胡建中:医疗行业对大数据的思考与探索
2014年10月28日,由中国工程院、美国国家工程院、EMC公司、VMware公司、浪潮集团及联想集团共同举办的以云计算和大数据为主题的IT行业学术研讨会——IT 2020高端论坛在京举行,此次论坛聚焦未来数年内影响中国乃至全球行业和经济发展的大数据、云计算和新兴IT趋势,来自中国、美国及全球各地的学术界和产业界的领导者及专家学者参与了此次盛会。
IT 2020高端论坛上,在医疗行业具有权威话语权的中南大学湘雅医院副院长胡建中,为大家带来《医疗大数据的思考与探索》的主题演讲,用实际案例生动的讲述了湘雅的大数据之路,以下是演讲实录:
胡建中:各位专家,各位来宾,大家下午好!我叫胡建中,来自湖南中南大学湘雅医院,我是外科大夫。我们校长带领团队在百年湘雅基础上,做了医疗大数据探索和思考,今天在这里,我把我的团队做了一些工作,给各位专家和领导做一个简要的汇报。
我从以下四个方面就我们对大数据的考虑一些行动简要汇报一下。首先谈谈国内外有关医疗大数据的有关工作,其实走到今天,大数据目前最大的问题,所有的这些数据经过百年历史走过来,这些数据封闭在自己的家里,怎么样把这些数据分别拿出来应用,这是数据财富所在。今年6月,美国FDA开放了数据库,供有条件的人士使用,谷歌也起动用相关项目,对疾病预防防治,英国、德国发达国家过来也在做这样的工作。医疗软件公司搜集了全美范围内专家,进行癌症机理进行分析,希望找到治疗癌症条件。
医疗整个过程总结起来,对疾病发生发展进行预测。我们国家医疗大数据的探索,起步时间不长,没有现成的数据。我们国家上世纪90年代医疗在自主发展情况下一步一步去做,今天为止形成这样的状态,采用不同的数据结构,形成不同的数据模式,很难把数据拿出来共享和协同服务,所以有一个条块分割。这些系统和采用系统采用不同标准,也是不同的建设模式,在这种情况下可能导致我们广大的病患以及健康数据隐私保护。像上午有专家提出来,可能有大量保护没有得到很好的机制。最重要的是,互联网、可穿戴技术、大数据发展到今天,医疗数据的应用和使用,还缺乏一个大数据的思维。我们还在按照医学走到今天,我们走的是群众医学的路径,我们必须每个病症要发生一个证据,证明这一点,不断地进行推演来证明我的诊断、我的治疗方式是正确的。医生是依据整个在学习过程中间,人类对疾病的认识所积累的经验,以及它本人在这个行医的一辈子中间所积累的经验,来进行综合分析和判断,对一个疾病进行诊断以及拿出治疗方案,然后治疗过程当中,不断地更新它的治疗手段。
大数据的今天,很有可能这种技术产生要颠覆医疗模式,这是很多专家曾经谈到,我们也在进行探索的一个工作。我们的国家已经明确地提出来了,医疗的信息化是我们的建设重点,我们要以认可信息、电子病例、电子健康档案三大数据库为基础,提供通用平台,提供六大项医疗卫生保障服务,同时把标准体系建设、数据安全作为重点工作来做。湘雅和中南大学、教育部、卫计委支持下,做了大数据应用到工作当中尝试。我们这个项目基于云计算、透明计算的技术,基于跨区域、跨医院全流程的医疗数据的数据咨询建议,基于这样一种目标,第一期建设希望建设辐射到湖南省,以及周边地区。它的健康受众和病人范围,大概应该接近于1800万人口,不是所有病人,病人人口。目前,上网医院有11家,第一期主要面对的服务对象是我们的病人受众和我们的大夫、医生,以及医院,提供一些基于大数据的服务。
同时,在这种建设的情况下,我们试图去解决两个对于医学信息、医疗数据很关键的问题,一个是各个医院、各个区域之间,各个系统的数据,解决医疗过程中间电子病例文档,自然书写语言,医学影像这些非结构化数据,怎么样结构化,得到我们的挖掘、利用。利用大数据服务平台,我们能够综合到全流程、全数据的基础上,我们能够为我们的社会提供一些什么样的服务呢?这张PPT能够看到一些端倪,在面对个体的病人,能够提供更加精准个性化服务,对于整个人生健康状况管理起来,能够在目前状况下,医疗资源相对稀缺,大量人口面对得救医状况下,能够更快就医,同时医疗机构,我们的医务人员,能够不断地提高它的诊断能力,提高我们的诊断标准,并且不断地更新它的治疗方案。对于我们的国家卫生行政部门,它能够更好地了解预期人口健康的状况,以及对费用的控制,同时不言而喻的科研机构,药品、研发部门、经营机构、保险机构,以及智能可穿戴供应商,都会利用这个平台做进一步工作,开发他们的产品,做好他们的工作。
这一点医疗大数据能够形成的话,第一具有非常大的社会价值,我们国家有接近15亿巨大人口,相对于全球医疗资源配备来说,相对优质医疗是稀缺的,怎么样能够把国家这些好的资源,能够更好地服务于老百姓,服务于广大人民群众,大数据把所有的资源整合起来,在这个平台上提供优质、便捷、高质量服务,可能通过目前手段,解决目前看病难、看病贵的难题。同时利用大数据,有可能使医学、科学发展,在疾病的预防、诊断治疗和研究水平提高到一个更高的高度。同时,像上一张片子所叙述的,医疗大数据的建设和形成,有可能拉动整个行业发展,这些行业是围绕医疗大数据、发掘运用大数据形成产业。这些大数据建设,对于整个社会经济和发展,不言而喻具有巨大的推动力。
根据目前公开的资料,我们国家到2020年健康产业市场发展8万亿人民币规模,到那个时候,现在我们关于在医院病人治疗费用,占到整个健康产业75%,当我们预计到2020年,在医院治疗费用降到35%的水平,其他65%的水平,都会在医院之外产生,这是对我们整个社会经济科学发展,都是巨大的、潜在的市场和推动力。湖南地区为例,两万家基本医疗机构,我们假设有600万的慢性患者,1800万需要利用我们的数据。湖南在智能医疗、慢性病管理、医药研发、个性化医疗、其他网络、可穿戴设备,将形成两百亿市场,针对全国来说更加不言而喻,我们国家现有的医疗机构的基础上,我们能够产生一个巨大的自费医疗决策支持服务的市场。
慢性病管理,这应该是大数据、区域医疗所面临的一个非常有效的管理知识,能够降低医疗的成本,能够扩大一个更大的市场。目前我们国家有2.6亿的慢性病病人,他们占到整个目前医疗资源70%花费。在未来可以预见这些内,整个互联网、移动可穿戴、医疗大数据结合,拉动和产生巨大的市场,这些市场工具,以糖尿病为例,可能达到2000亿规模,同时运用大数据能够加快药物的研发。下面这张图能够明确地看到,在全球范围内,真正应用于临床药物的开发、研究,是一个漫长而复杂的过程,因为我们的研究都是基于小样本抽样调查进行一步一步演算和推算,大样本原样推送到目前的数据机构,很有可能能够加快药物研发的进程,使这些投入更快地服务于人类,有益于我们健康事业的发展。
公共卫生医疗大数据应用不言而喻,公共卫生预期、公共卫生状况、基本药物运用、保险费用能够及时地展现出来,特别是我们展望的基于自己的基因、家族史、DNA不同,使用不同的药物,像高血压,像治感冒,我可能吃白加黑,可能吃泰勒,可能产生不同效果,需要每个个体不同情况产生不同的应用。
湘雅大数据目前在做的工作,平台架构,左边是数据采集提供商,包括医院、医疗诊所、智能可穿戴设备各个用户或者个体怎么应用,移动互联网大数据怎么形成,端对端做起来,形成这样服务。采集端、数据形成、处理、加工,同时云平台上会提供面对病人、医生,以及面对所有要使用医疗数据需要者的服务。
这张PPT是使用云平台目前很多技术进行构造和建设。同时大数据运用了知识图谱,两百多种结构化的资料指南,四万多种疾病症状描述,以及接近5万种诊断的标准,和接近三千多种实验室检查的标准结果、正常结果、两千多种手术治疗方案,18000多种对于疾病药物治疗方案,到疾病治疗中心。利用图谱技术,关联计算,快速搜索方法,为智能诊断提供一些基础。
下面这张图是我们对于非结构化的医学影像投入,研究、实施中心,能够做到我们的机器能够自动识别,在我们的图像中间出现得异常部分,跟我们以往的异常图像进行比对,得出诊断。最不能忘掉的是数据安全,上午已经有人谈到这个问题。为什么全球、医院,甚至美国,全球数据,保留系统中间,各个系统之间的交流,隐私数据安全摆在第一位,在座的每一位,包括站在这里的我,不希望我的健康数据变成网络上公开的东西,怎么去保护,目前能够做,我们建设湘雅大数据同时,考虑到个人隐私保护。数据到了中心以后,在云平台上,对于个人隐私的保护,数据加密以后,对于数据系统外的安全问题,总体来说采用角色访问控制,安全技术运用目前市场上成熟的应用的技术,应用到这里面来。
前期基于IT技术发展和一些理念,我们在湘雅、湖南做了一些探索,在这里有一些案例,给各位做简要报告。首先我们这些探索,在做湘雅大数据建设同时,推出一些应用,首先是面对我们的病人,面对我们的医生,我们希望利用大数据,能够给我们的患者提供便捷的医疗服务,不要像去大医院,有长长的排队、拥挤的人群、挂号多么难。我们面对病人和大夫,做了一部分工作,同时把数据归拢了以后,进行梳理、开发,变成中心数据以后,可以协助科研人员,能够快速地像互联网上面,搜索我所需要的资讯一样,搜索我需要的医学资源进行研究。
我们利用机器学习知识图谱这些技术,让智能诊断,也就是机器诊断,让电脑也变成一个医生,我们也在做一些工作。首先我展示的一款是在我的医院开始应用的一款简单的面对病人的APP,这款APP里面能够智能分组,能够用手机挂号,能够取报告单,能够咨询大夫,能够在网上进行支付,同时在数据库里面,还有与健康有关的数据库进行应用。如果感觉身体某一个部位的不适,可以在我的图片上点击,咽部不适、喉咙痛,有部位定位,我的系统会自动地告诉你,这个部位疼痛是咽部不适。我是老百姓,没有很好的医学知识。到医院就诊挂号,系统告诉你,你可能是咽痛,吞咽不好,是还是不是,可能犯的是咽验。得了咽炎,要到医院看病,系统告诉你应该看耳鼻咽喉科,这个医院里哪个教授最能看这种病,自动告诉你应该看这个教授,手机上能够挂上号,医院自动排队。哪天某个时间段告诉大夫,大夫在那里等着。很明确挂号、做,提示你挂号成功,回去进行挂号,挂号做完检查以后,检验结果自动推送到移动终端上面来。这是利用大数据、数据继承做的一款应用,目的为了方便病人快速就医,减少排队、时间浪费。
通过IT设备的沟通,能够得到医生咨询,中国还没有开始,希望慢慢通过大数据走到这个环节。我们建筑一个建筑连体28万平方米,里面很难走,我们利用数据功能,给患者进入以后去导航,能够很自动地出发,站在某个点,到哪里去,告诉你,前面图像是怎么样,怎么去走路。这个系统里面能够提供相关的、健康的知识,如果有兴趣可以点击看,同时获得相关疾病知识。如果有咽痛有很多咽痛相关知识,少抽烟、喝酒,少高声唱歌,能够保护咽部。很多数据库,数据中心能够随意搜索到病情,推送服务。
数据开放完成以后,能给医务人员干什么,如果做过体验,所有数据提供到你面前,系统为你的健康状况做评估,告诉你的健康状态是健康状态、亚健康状态还是疾病状态。我们也同样提供患者与医生之间的互动咨询,和院后慢性病管理,这张PPT展示了通过移动互联网、智能可穿戴设备,数据传上系统以后,跟大夫能够可看见、可咨询、可指示,构成了一个患者和医生之间的闭环,使互联网、移动智能设备在医疗行业的应用得以实现。这是科研,医学科研,抽样调查,样本分析,大量的样本调查以后形成大样本调查,大数据、全数据给我们全样本的调查研究提供这样的可能。大数据就是把整个在这个区域范围之内,在某个时间之内,疾病的状态是完整地推送到你们面前。所以我们试图在这个数据运用移动互联观念,给医生提供一个检查检验方便平台,这个平台是高级智能的搜索,这个界面像谷歌通过互联网搜索任何需要关键词,搜胡建中名字,在系统里与我有关的任何条款都会集中起来。同时我们有高级搜索,你把所需要的关键词尽可能限定范围、研究热点,得到资料,快捷地完成研究。
同时,我们能够对患者群在医院之间进行协同的管理,把这些患者去管理好,同时也能够进行统计信息的分析,这张图基于我们前面那么多种医疗资源的整合,我们根据指数,根据系统里各种数据整合,由机器得出可能的手段,这个诊断出来以后,会提示进一步做哪些检查,检查的数据再次整合以后,得出下一个诊断。同时根据数据库里面几十年、上百年、上万个医生的经验,治疗的方式,给一个治疗的提示。所以这一点是我们做的智能辅助诊断探索。这是使用界面,一个人输进来,告诉你他的症状,他有什么不舒服,电脑告诉你可能是哪一类疾病,进一步输症状,医生检查结果输进去以后,缩小范围,进一步告诉你有可能是什么样的诊断,这一块不但辅助诊断,对于年轻医生培训和学习是非常好的结果。
在我的讲话最后,拿这样一张图,讲述我们医疗大数据可能发生的事情。首先,我们的大数据来自于什么地方,来自于医院,这是医疗数据最大的来源,不但有在我们今天无时无刻新产生的数据,还有整个医学社会现在沉睡在各个医院数据库里大量的、海量的数据,这些数据能够为我们的病人、大夫提供很多医疗服务,这些服务由病人来诊断。同时可能是这些人拿着这些数据进行研究,同时为医院、医疗机构管理和改善服务提供很多服务,BI能够做到这一点。同时我们国家行政管理部门和卫生发展,医疗行业是非常好的应用。大数据的产生是智能可穿戴设备和医院之间通过移动互联方式连接起来,构成云医院、网上医院的可能性很大。这些数据上传数据中心,数据主动提供给医生面前,离开医院,搬到医院之外,互联网上的医院。
互联网上所有数据能够进入我们的平台,互联网大家贡献结果,产生结果,数据中间加以分析利用,对于整个医疗事业发展提供方向。更加与医疗健康相关的企业、产业和市场,会得到更好的发展,像医疗机械的这些公司,药品研发开发部门,医学、科学的研发机构,以及健康保险相关机构,他们能够在这个中间得到、了解状况,发展产业。
在这个外围,波及到互联网所有生活,涉及到食品安全、水的安全,就像银行里面应该向哪部分去投,第三方开发者提供的云平台,能够任意地开发运用。同时资本市场的走向,在这个中间少不了网络、电信、媒体的支持和帮助。这由于大数据给我们展现的未来,特别是在健康方面展现的未来。我的演讲到这里,谢谢大家!