案例丨华山医院信息中心主任黄虹:搭建大数据平台,我们做了哪些工作?

案例丨华山医院信息中心主任黄虹:搭建大数据平台,我们做了哪些工作?

AI 掘金志消息,由国家卫生计生委医院管理研究所主办的2017中国医院信息网络大会近日在北京国家会议中心举行。

在“大数据应用与人工智能”的分论坛上,上海华山医院信息主任黄虹教授发表了题为“医疗大数据与人工智能应用实践与展望”的主题演讲。

黄虹教授在演讲中分享了华山医院信息化平台的建设过程。她表示,华山医院的数据中心汇集了过去16年医院系统数据,近10亿条记录(已接入80多亿条),涵盖门诊、住院、医技、检验、手术、财务等十几个领域的数据,为深度数据分析利用构建了坚实的数据平台。

她表示,医院里还是以非结构化的数据为主,实际应用当中比较痛苦的是可用的优质数据不多。为此,华山医院从2013年起,利用平台的方式做成一个数据中心,通过平台来扫盲点,找出医院面临的各类问题。黄虹表示,“在建数据中心的过程中,改善医院的 IT 生态环境。比如说主数据管理,把诊断数据纳入医院的主数据管理平台。当一个数据能产生价值和对医生、对医院管理有帮助时,这个数据本身的质量才可能有所提升。”

以下为黄虹教授演讲内容实录, AI 掘金志做了不改变原意的编辑:

黄虹:数据到底从那里来呢?我们信息部门直接负责管理数据,今天我想从四个方面来讲:医疗数据的发展趋势、医院数据中心的建设方法、医疗大数据的应用场景以及医疗大数据与人工智能的应用展望。

医疗数据蕴藏着巨大价值

医院经过了从收费为主、临床为主到以平台为主的转变,确实产生很多的数据,但是数据量是不是足够大,质量是不是足够高,这些值得商榷。医院里还是以非结构化的数据为主,包括影像、文本。实际应用当中比较痛苦的是我们可用的优质数据不多。

大数据时代,我们要做科研应该很方便,但是拿出来的可用数据少得可怜,为什么?我们的临床医生之前没有尝到数据质量的甜头,因此也不是那么在乎。所以在这个过程中,大家交流之后对数据的认识正在不断提高,医院数据的质量也在逐渐地好转,这需要投入大量的时间、财力和人力。

从数据本身来讲,我觉得它的价值度还是可以去拎一拎,医院里面是关于诊断、治疗方案的选择。我是卫生管理出身,我们老师一直讲预防比治疗更为重要,所以我们要想得远一点,想得宽一点,医疗数据蕴藏巨大价值,数据挖掘与统计检验成为最关注的需求,包括后期疾病的研究、卫生经济体系的建立、卫生政策的下达。所有的数据从哪里来?还是得从医院来,医院有这个责任把数据处理好,能够提供给各方做相应的研究和应用。

医疗数据的技术环节来讲,我觉得技术本身已经非常成熟了,但是从我们管理数据的部门来讲,这个认识可能有点滞后,医院大量数据的来源可能就是各个系统。原先医院各个系统的数据管理者,不见得每家医院的信息部门都真真切切地把数据掌握在自己手里。现在大量信息化过程还是依赖于第三方公司来建设。

这些帮我们建系统的公司,可能比我们更清楚这些数据的价值在哪里。而我们自己部门的人员、技术都是缺乏的,所以这两年华山在信息化建设过程中投入了巨大精力。另外,大数据是有前提的,如果没有云计算,大数据是没有环境可以开花结果的。正因为有了云计算这样的平台支撑,我们才能走过大数据这段路。

第二,我觉得价值观还是很重要的,你心中总要有担当追求。从医院层面来讲,现在药品取消零加成了,包括耗材的加成也非常少,数据层面提出了更高的运营管理要求,今天来讲精细化管理更有意义。从学科建设上来看,所有的医院排名排到最后还是靠科研,科研可能在评分体系里面要占到60%,我们会更多地说 SCI 论文和科研能力,所以科研体现在哪里?体现在学科建设上。学科建设靠什么?第一当然是靠临床诊断水平,第二要靠临床案例的搜集,第三可能是案例的分析。

信息化平台的搭建,华山医院做了哪些工作?

对华山来讲,虽然是老调重弹,但也有很大的现实意义。2013年,我们就用平台的方式做成一个数据中心,通过平台来扫盲点。因为建数据中心一定会去分析现状,医院里到底缺什么,碰到哪些瓶颈,应该怎么去做。所以在建数据中心的过程中,我们就改善整个医院的 IT 生态环境。比如说主数据管理,医院的诊断,把诊断数据纳入医院的主数据管理平台。

因为华山皮肤科比较好,当时我们建设数据中心的时候先将皮肤科的数据进行尝试。后来我们和业务部门进行调整,由医务牵头,让各个科室固化一下各自科室的诊断名称,制定一个医院内部的诊断编码。我们把国家的INCD10,INCD9,包括上海卫计委出台的一套编码统统作为外部编码,我们医院自有一套内部编码,既能够满足应用又能够满足政策上的应用。

从运营管理的角度来讲,医院面临的最大困难是什么?做绩效分析的时候,我们就发现这个还没有 Excel 做得好。因为医院的科室体系非常复杂,有绩效的科室体系、医疗服务的科室体系,可能还有一些其他科室体系,有很多的数据标法。这些不同的科室体系都用一套标准是行不通的,我们在做集成平台的时候都是院长牵头,把各个科室聚在一起构建了一套完善的科室体系,甚至包括我们医院的人也是做了一定的标准化。

在三级医院里,我们做这个平台之前是比较理想化的。事实上,很多的电子病历、电子医嘱的录入是谁在做呢?是我们的研究生,基地医生在做。做主数据平台的时候,我们为了把主数据做全还建立了一套学员管理系统,还有系统跟系统之间的交互以及术语的约定。在我们传统的 HIS 里面,包括电子病历、赏罚系统、超声系统,同一事物在不同系统里面的定义是不一样的,这个是需要平台去解决的。

还有一块是患者主索引,我们要建队列做随访,首先要进行标化,患者主索引的建立非常难,中国没有强制实名制就医,华山医院可能一天的门诊里面60%是上海的医保病人,40%是外部的病人,如果不强制患者实名制就医的话,患者的 VID 很难去进行标化。我们在这方面做了一些工作,按照身份证,如果没有的话,我们会根据医院的就诊卡,如果还不行我们会把病人的姓名,性别、年龄一些基本特征整合起来再去做统一的标化。

通过这种方式也只能达到60%-70%。从今年1月1日开始,我们开始实行实名制来接诊,我也想过为什么是2017年的1月1日,我们的预约挂号做了好多年,挂号是要实名制的,所以我们今天来做这项工作具有一定基础。

这个是我们集成平台打基础的部分,集成平台其实就是为了要构建好的生态系统,让医院的系统在统一的框架下进行,最终还是要服务于我们的医院、患者和临床科研。

这个是医院的总架构,其实跟很多家医院可能都区别不大,核心部分还是数据。我也经常跟医院的领导说,传统的医院管理叫人、财、物,是不是把数据也作为一个重要的资产加入进去呢?这个是我们平台介绍的五大方面,数据中心的建设,主数据的管理,以及数据之间的交互模式,以及这个数据之间的所有的SSO。以前在医院,不同的系统、不同的用户体系,需要记很多套密码体系,我们通过SSO之后,把大概70%的系统已经纳入到这个体系里面来了。

从华山医院的数据管理来讲,我们是把2000年到现在的数据都放到里面去了,大概有81亿多条包括结构化的和非结构化的数据。我们甚至为了帮助科研,能够拿到一些很长远的数据,我们把翻拍的数据也通过病人的模式纳入进来了。

很多临床医生拿出的数据质量不高,我们做数据要么是前处理要么是后处理,如果不愿意在前面花太多时间,后期可能要花更多的时间去处理,所以我们病案翻拍的部分就是一张张拍的照片,也是基于分类给我们临床医生,他们需要一张张去翻,或者在索引里面一张张去看,我们建立队列之后就可以直接翻看到纸制病历。

我们的数据中心就是四大块,四大块都有一些应用落地,从临床服务来讲,就是我们的患者360,能够帮助临床医生,甚至是药师看到临床数据,包括我们的科研、队列、病种库的管理、医务管理、运营平台等各个方面。

这是五个方面数据共享的模式,其中有两块我觉得还是特别对医院帮助特别大一块就是院感,有的医院很好但院感没做好,患者的预后就会差,给我们的院感科做院感的提示,院感科在这方面可以很方便地进行交流,及时地提示医生,包括我们的一些科研查询以及随访。

另外一块,基于数据的管理我们可以回顾性地去分析,现有的系统到底有哪些缺陷,有哪些不足,我们在医院里其实很担心盲目地建一套系统,花了钱花了时间建了一套系统没人用是很可怕的事情,现在基于数据层面的质量和缺陷,我们会反思系统录入得不完善,哪些系统还有缺陷,这是以数据为导向,我们来进行信息化的规划。

这个其实就是一个例子,我们在做手术绩效的时候,医院要盈收,外科要微创化,内科要外科化,医院为了鼓励医生能够更多地去开刀,今年医院就要对每个手术医生进行奖励,当时就把这个任务交给我们,因为你要有数据来支撑,我们当时就商定说,把每个医生写的手术记录单作为我们考量数据台数,包括手术内容的依据,原先的医生是不太在乎手术记录单的,但是变成收入的一部分的时候,这个手术记录单的有效性包括数据的正确性得到了大幅提升,包括我们的手术名称、手术时间、手术医生。

以前我们的手术记录单,有一个医生从主刀到三助都是他。现在我们做了很多系统约束之后,这份表单的准确度就大幅提升,所以我们就反思:当一个数据能产生价值和对医生、对医院管理有帮助时,这个数据本身的质量才可能有所提升。

反向推导,手术记录单怎么来引导,这个是我们的主数据管理提纲,因为有了人的管理,我们医院所有的排班、考试都是基于主数据的管理,因为原先很多的大医生升为副教授之后很少写病史,也很少直接在系统里下医嘱了,但是因为他的功耗不行了,所以纷纷地找我来问密码,说明什么他从来没有好好地用我们的系统,通过这次的考试我们的用户系统百分之百都生效了,都被激活了。

异构系统基于服务总线实现了互联互通

我们在医院的数据落地包括管理过程当中,我们会参照很多的标准化的东西,就包括我们很多国际上语言数据的标准,包括国家和地区发布的。这个就是我前面介绍的患者主索引的一个机制,我们60%-70%已经配上了,剩下的一部分是靠医生临床的人工鉴别进行整合,这个就是我们讲的医院权限管理,我们还会在这个过程当中,有的系统像我们OA级别比较高,所以我们给个人做两套密码体系,其实也是起于数据层面建立起来的。

其实我们也是通过这些数据服务包括集成平台,实现了整体的互联互通,达到了很多平台建设的要求。我们是把华山60多个系统整合到一个平台里面,这个是各个系统不同的年份,在整理数据、对数据质量的标化是需要很多临床医生来参与的。像我们360界面做了很多优化,因为 IT工程师不太理解临床医生的临床思维,临床医生看到这个IT思维也看到非常的头疼,很难根据临床的感受度去进行调整,包括我们的危机值,现在都不能基于检验系统而是基于整个数据中心,包括医院的运营管理,同时基于数据来说话。

平台还有哪些可以持续性改进的地方?

另外我想讲一讲平台的持续性改进,其中是把临床用药放在一个很重要的部分,所以我们这两年是在临床药师工作方面做了基于数据层面的工作,我们的医嘱里现在已经整合了个性化给药,跟精准医疗有一点关系。我们是把药剂科的给药模型跟临床医生做了整合,我们现在做了两种药,将来可能有更多的药会纳入这个体系,根据病人生理和病理的数据,基于模型直接把计算结果反馈给临床医生,临床医生会根据结果给病人很精准的剂量,同时基于药物的监测去回顾看病人的用药依存好不好,这也是在我们精准医疗方面开展的一些工作。

最后讲讲这个是我们做的临床病例的筛选,我们现在给13个科室做了40几个病种库,这个病种库现在比较方便,临床医生培训一下大概自己都能开展这方面的研究。

最后就讲讲我们的使命吧,作为医疗机构,作为数据的落地点以及将来的应用点,我们除了刚刚讲的服务于管理、服务于医生之外,我们现在是基于物联网,也希望说跟我们患者把一些生活服务方式的数据也能连接起来,这个可能处在思考阶段。我们在做数据服务方面,信息部门来讲比较痛苦的是什么呢?我们得到临床的有效指导实在是太少了,我们最终还是要服务临床的,我们在座很大的一项工作就是让临床能够认识数据本身的价值,以及寻找一个好的通道,我的汇报就到这里,谢谢各位!

报名啦!智能投顾高级特训班

随着大众互联网理财观念的逐步普及,理财规模随之扩大,应运而生的智能投顾,成本低、风险分散、无情绪化,越来越多的中产阶层、大众富裕阶层已然在慢慢接受。王蓁博士将以真实项目带你走上智能投顾之路,详情点击阅读原文。

相关领域
人物