创新医疗数据共享方式提高AI赋能医疗效率
一、引言
近年来,AI+医疗已成为生物医药赛道热点,据数据统计,过往的五年时间,近千亿资金注入医疗人工智能赛道。随着深度学习技术的发展,医疗市场规模快速增长,行业已进入发展快车道。以计算机视觉、自然语言处理、机器学习等为代表的AI技术已广泛渗透于医学影像、药物研发、辅助诊断、精准医疗、健康管理、医疗信息化、医疗机器人等多样化场景中,成为行业发展的重要驱动力。尽管人工智能带来了巨大的可能性,但也存在一些风险和挑战。本文将讨论人工智能赋能医疗行业所面临的主要问题及其存在的主要原因,并最终提出了五条建议,希望能为提高AI赋能医疗效率提供可行路径。
二、现状问题
人工智能在医疗行业的应用主要是通过机器学习和深度学习等技术实现的,这些技术可以使得计算机从大量的医疗数据中学习并总结出规律,进而进行诊断和治疗。尽管人工智能在医疗领域有巨大潜力,但也面临着一些问题与挑战。首先是数据共享问题,人工智能的应用离不开大量的数据支持。其次是数据隐私问题,在使用AI的过程中,我们需要收集、存储和应用大量的个人健康信息,这一过程增加了数据隐私泄露的风险。
(一)数据孤岛广泛存在,共享不足带来研究效率低下
在我国,政府、医疗机构、科研院校及一些医疗企业等机构组织随着长期医疗数据资源的积累成为了各类数据的实际拥有者和控制者,由此,医疗数据共享活动也多发生在这些行为主体之间。依据每个数据控制主体在医疗数据共享中的动机和需求的不同,可概括出四种典型类型:政府面向所有需求方的数据共享;医疗机构面向医疗服务、业务和科研的数据共享;科研院校面向科研的医疗数据共享;医疗企业面向商业和产业的数据共享。
目前来看,科研院校间在医疗数据共享方面有着天然的需求,医疗科研数据共享相对成熟,尽管这些共享活动仍然维持在较小环境范围且大多聚焦于科研团队内部,并且至多是合作方之间开展。由于牵涉到知识产权利益与分配、科研数据安全与保密等问题,有价值的科研数据共享仍有很长的一段路要走。
当前,多数医疗企业仅支持内部共享数据,医疗企业间存在一定的“数据孤岛”现象。医疗企业内产生的数据,在商业关系中多表现出资产属性,反映了企业真实的运营情况和竞争实力,而不同的医疗机构、商业主体之间还存在竞争关系,加之企业内部尚未从制度、标准、组织、技术、人才等方面建立匹配的数据流通管理体系,所以企业即便有共享意愿,也常持观望态度。
“AI医疗”应用离不开医院之间的信息互通、数据共享,然而一个无法回避的事实是,我国虽然在医院病例数方面有很大优势,但相互之间医疗数据没有共享,加之涉及数据安全和隐私保护等问题,大多数医院的医疗信息呈“数据壁垒”“信息孤岛”状态。有调查显示,当前已有70%以上的医院实现了医疗信息化,但仅有不到3%的医院实现了数据互通。很多病人在医院看病后的病理特征、看病记录,都会产生大量的数据信息,但这些信息不仅在各医院间不能共享,即使在同一医院不同科室间也很难分享。例如,当一位患者更换医院重新就医时,不同医院的检验数据之间并不互通,患者需要随身携带纸质报告或者重新检查,这不仅影响了医院的工作效率、降低了病人的就医体验,也对人工智能在医疗领域中的进一步发展产生一定的阻碍。
总结来说,我国医疗数据共享活动的开展规模仍是有限,成功的医疗数据共享活动多在小范围利益相关团体中产生, “数据孤岛”现象与数据标准不统一问题,使得医疗数据更加难以实现共享。
(二)数据隐私保护不足,数据泄露风险广泛存在
随着数据搜集、机器学习、人工智能等技术的使用,隐私问题也随之而来。医疗数据的处理涉及到个人的健康信息和隐私,在将大量的患者数据输入AI系统进行分析时,数据泄露和滥用的风险也随之增加。医疗垂直领域的大模型可以分成两部分,一部分是通用化的模型,可以基于一些公开的数据集进行大模型的训练,但真正要应用到某一个领域、特别是医疗领域的时候,需要进行模型的微调才能够提供更精准的结果,在模型微调的过程当中需要利用大量高敏感的患者隐私数据,这些数据直接用于训练AI模型会产生很多潜在的风险,其中人体基因组数据的泄露引起潜在的生物危害和商业利益更为突出,有报告显示,公众对个人隐私泄露问题的顾虑占到调查人群的59.72%。此外,如果医疗数据被不当使用,可能会导致患者的个人隐私受到侵犯,甚至影响到个人就医选择。例如在聘用过程中如果雇主通过某些渠道的诊疗手段泄漏获悉拟聘用人员有慢性病或一些较难治疗的疾病,有很大可能会招致聘用失败。
美国关于隐私安全的立法较早,1974年即通过《隐私权法》(The Privacy Act),后在2003年生效《健康保险携带与责任法》(Health InsurancePortability and Accountability Act, HIPAA)。针对个人健康医疗数据缺乏隐私保护的情况,HIPAA的隐私规则设定了健康数据的隐私保护标准。2009 年,《医疗信息技术经济与临床卫生法》 (Health Information Technology for Economic and Clinical Health Act,HITECH)顺应电子时代个人健康医疗数据逐步电子化的趋势,扩展了 HIPAA 的适用范围,在健康医疗数据领域,美国构建了比较完整的法律体系,从法制层面保障了健康医疗数据的隐私和安全,并积极推进健康医疗数据的互通共享和应用。我国也高度重视健康医疗数据的安全问题,政府发布了相关的法律法规和政策文件,要求开展大数据应用的同时必须保证信息的安全,如国务院办公厅印发的《关于促进和规范健康医疗大数据应用发展的指导意见》要求“加强对涉及国家利益、公共安全、商业秘密、患者隐私等重要信息的保护,加强医学院、科研机构等方面的安全防范”,但我国现有的医疗数据保护技术、相关政策、法律法规还未跟上发展节奏,当前对于医疗 AI 应用涉及患者的隐私问题、自我保护策略和可接受性也还没有清晰的策略。
三、症结分析
基于对我国阻碍人工智能应用于医疗行业发展的现状问题的梳理,我们发现,我国存在巨大的医疗数据共享潜力,但是,当前我国医疗数据管理者仍面临不敢共享、不愿共享的困境。究其原因,本文认为现阶段存在这一问题的关键在于:
1. 数据标准不统一
我国提出医疗信息化建设已有几十年时间,但由于国家层面一直未出台相关标准,各家医院在建设信息系统过程中缺乏标准指导。例如:医院HIS(医院信息系统)有的是用Unix系统开发的,有的是Linux系统开发的,不仅数据结构不一样,硬件接口也是千差万别,不同时期的HIS产品不同,有时甚至由多达几十个不同的供应商提供,导致同一家医院内部不同系统之间的数据兼容和信息交换都成为问题。
2. 数据权属不清
一方面,数据权属不明导致数据泄露问题归责难,从而影响数据相关方的信心,影响医疗数据的共享流通;另一方面,数据权属不明使得数据的利益分配没有得到规范性保障,制约了医疗机构信息化建设和民众参与的主动性,最终,阻碍了医疗信息的互通共享。
3. 数据共享如何收费、如何分配成果转化后的收益尚不明晰
不同医院间隶属关系复杂,还存在着争病员、抢资源等利益竞争关系,此外,医疗数据共享效益难以在短时期内立马有所体现,各个参与方在现有的数据共享行为中的利益所得难以体现,包括知识产权在内的利益分配的不规则性是阻碍医疗数据共享行为发生的关键。
4. 对数据安全、隐私保护方面存在担忧
目前,医疗数据共享的安全风险控制难以保障,尤其是隐私风险随着技术发展的不可控性愈加显著。
四、对策建议
第一,建立数据标准,促进开放共享。建立医疗数据标准体系,建设结构化数据集,支持引进医疗数据专业标注服务平台,提供专业程度高、技术密集型的高质量数据标注服务。提高医疗数据基础设施覆盖面,要求各级医疗机构建设统一标准的医疗数据基础设施,政府对此予以补贴。同时,以审慎监管、保护创新为原则,推动建立数据开放共享规范,对大数据的保存、备份、迁移进行规范管理,按保密程度分级分类管理,以审批申请制的方式向公众开放和共享数据,切实保障数据安全。
第二,明确医疗数据的权属。目前医疗数据的所有权、管理权、经营权的法律界定、隐私保护、交易规范、知识产权保护等还处于法律空白,为此,应加快医疗数据确权及其机制研究,制定相关法律法规,明确医疗数据的患者权益,承认医疗机构对各自产生的医疗数据享有财产权以及相应的社会责任。
第三,建议出台相关实施细则、制定健康医疗数据共享利益分配原则、从政策上鼓励多元主体参与健康医疗数据共享应用。建议国家卫健委会同国家发改委,明确健康医疗领域数据研究成果转化收益分配的原则,指引数据平台监管方、运营方、使用方等多方参与者在规定范围内探索建立数据共享的收费标准、应用成果转化的收益分配方式等。
第四,建议成立国家、省、市级“关键数据安全委员会”。针对医疗数据如何开放共享,如何判定隐私泄漏责任权属以及新技术的应用等问题,起到关键指导作用。
第五,针对医疗数据在不同领域的应用分别制订适宜的隐私数据安全管理制度。在实践中,医疗机构与医疗科技公司或数据分析公司合作的情形日渐多见,而众所周知,在数据安全管理方面,参与方越多,数据泄露和被篡改的风险越大,在医疗合作发生共享医疗数据的情况下,应更加严格的界定医疗数据安全保护的责任归属,对医疗数据进行规范的分级管理,对各个参与方的医疗数据权限进行明确划分,从而最大限度地减少医疗信息在共享过程中的泄露,避免侵犯患者个人隐私。
本文仅代表作者观点。
(巫景飞为上海大学经济学院副教授;方金武为中国信通院上海工创中心副总经理,数字健康事业部总经理;刘玉琳为中国信通院上海工创中心数字健康事业部研究员)
(文章来源:第一财经)
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。