Press "Enter" to skip to content

[医疗NLP]NLP人误闯医疗界

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

一.2021年,新冠如魅影

 

(1)大国对比,中美PK

 

2015年,联合国统计的GDP排名前20的国家,医疗卫生总支出占GDP的百分比。其中, 美国为17.1%,中国为5.5% ,见参考(1)。这说明,我们的水平,还不能算很高。

 

(2)中国政策引导

 

这里给出一个基本的时间线,如下:

2014年:“46312”(卫生资源整合的顶层设计)
2018年3月:电子病历分级评价的新标准(共8级水平,此前是7级水平)
2018年8月:卫健委要求2020年前所有三级医院电子病历应用水平达到4级或以上

附加:

 

(1)2016年,国内49.8%的医疗机构电子病历评级为0级,4级或以上的占比为8%。

 

(2)“46312工程”解读

“4”代表4级卫生信息平台,分别是:国家级人口健康管理平台,省级人口健康信息平台、地市级人口健康区域信息平台及区县级人口健康区域信息平台
“6”代表6项业务应用,分别是:公共卫生、医疗服务、医疗保障、药品管理、计划生育、综合管理
“3”代表3个基础数据库,分别是:电子健康档案数据库、电子病历数据库和全员人口个案数据库
“1”代表1个融合网络,即人口健康统一网络
“2”是人口健康信息标准体系和信息安全防护体系

内忧,外患,还有”新冠“黑天鹅,所以,值得干一把。

 

二.NLP的大锤有了,医疗界的钉子给我一打

 

整体上看,业务流程的划分有三个视角:

医院粒度:院前,院中和院后
诊断粒度:诊前,诊中和诊后
事件粒度:事前,事中和事后

整体的业务场景划分上,分别以 平安医疗 和 来未来&熙牛医疗 为例,医渡云的团队也不错:

 

平安医疗:智能医疗质量控制,智能疾病预测,智能分诊导诊,智能医疗影像筛查,智能辅助诊断和治疗(700+的疾病类型,医疗知识图谱),智能ICU重症管理以及智能随访患教。

 

来未来&熙牛医疗在数据中台和业务中台两大中台体系下的业务架构如下:

 

 

整体上看,以智慧医院云平台和区域医疗健康两大核心为主,下分不同的智慧模块,服务不同的用户角色,实现医疗过程的全流程介入。

 

嗯,医疗首先要解决的是信息化,也就是让数据流动起来。在流动的数据中,可以添加智能化的组件。这里仅给出算法侧相关的钉子两例。

 

其中的一个算法侧的抓手是: 电子病历结构化 。博主调研了各种相关 学术竞赛 ,绝大多数的比赛都是围绕该抓手进行的。通过结构化,形成知识库,甚至于知识图谱,继而支撑上游业务。

 

比如,一个标准的电子病历结构如下(通常情况下,每种类别可以分开处理):

 

 

但是要形成一个知识库,仅有上述数据是不够的。这里给出一个临床诊疗知识库的体系:

 

 

第二个算法侧的抓手是: 临床科研 。具体场景如下:

 

 

本着循证医学的思路,临床科研也是一个较大的钉子。

 

三.具有医疗特色的NLP技术

 

(3.1)结构化

 

第一:数据融合。要关注多源,多模态,多类型。比如要融合第三方厂商的数据库数据,下面给出一个列表。

 

 

第二:模型侧。分类,序列标注,关系抽取,消歧归一,知识图谱构建与应用

 

第三:重规则引擎开发

 

第四:闭环:数据侧+模型侧+服务侧

 

(3.2)搜索:标准的文本处理问题。

 

(3.3)推荐:医疗问题的错误惩罚较重,决策权一定是要在人手中。

 

(3.4)医疗影像处理

 

(3.5)文本生成

 

整体上,相比于通用NLP任务,医疗NLP的落地要求重视规则引擎的开发,要求准确率的提升,要求更加通用的方案(各种“多”的特点),要求模型能力和更加的耐心做badcase的分析和纠正。

 

四.未来

 

(4.1)医疗行业的成长周期很长,这是一个重视长期价值,普世价值的赛道。(可以回顾丁香园等公司)

 

(4.2)信息化的进程还有一半的路要走,更深的医疗环节介入。

 

(4.3)信息化基础上对智能化的需求加深,还有很多值得挖掘的地方,这是一个有较高壁垒的赛道。

 

(4.4)强政策依赖,跟着党和国家走(可能是区别其他行业的一个鲜明特点)。

 

好了,有几个故事想讲给你听,见参考(5)。

 

但是,别忘了,投资50亿的IBM医疗裁员70%这样的新闻,可能的风险点在哪里?在接下来的博客中会单独分析这个事情。

 

参考文献和部分数据来源:

 

(1)中国和世界各国医疗支出占GDP的比例是多少?https://www.zhihu.com/question/264996078?from=groupmessage

 

(2)卫健委卫生信息数据。http://www.nhc.gov.cn/wjw/s9497/wsbz.shtml(非常有价值的文档)

 

(3)《电子病历系统功能应用水平分级评价方法及标准》,https://wenku.baidu.com/view/0700d582842458fb770bf78a6529647d262834f1.html

 

(4)腾讯天衍实验室:https://jarvislab.tencent.com/

 

(5)故事:http://share.591adb.com/sharearticle/article/article_id/3524764/app_key/e70891ddafa5e012828c143390cdad9e

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注