中国医疗大数据“痛点” :孤岛怎么破

简介:

近年来,医疗大数据炙手可热。那么何为医疗大数据?

与医疗健康相关的信息,均可被归入医疗大数据的范畴,数据来源可以是医疗和科研机构,亦可来源于个人甚至政府。其应用场景十分广泛,如药品研发,精准医疗,医保控费,个人健康管理,个性化用药,甚至分级诊疗、远程医疗等。从以太的经验来看,中国医疗大数据的应用各环节有一些共同的痛点。

数据孤岛

首先从机构层面看,在政府政策主导下,当前已经有70%以上的医院实现了医疗信息化,基础设施建设层面已经初见成果。

然而当前仅有不到3%的医院实现了数据互通:传统系统厂商数量众多,据不完全统计,当前国内HIS系统厂商超过500家,PACS系统厂商超过200家,厂商为医院单独设计实施系统,且不同系统会出现不同版本。使用传统方式聚合一家系统需耗时2-6个月,对医院数据采集和聚合耗时费力。尽管有移动医疗、远程医疗的一些创业公司会部署新的系统获取数据,然而众多互联网医疗产品的接入,造成了医患双方的额外负担。

其次,从个人角度来看,当前常见的直接获取个人数据的渠道主要有两个:可穿戴设备的佩戴或移动设备的使用,上门检测获取用户数据。然而这两种获取渠道对于用户来说都处于市场导入期,存量市场微乎其微,导入和说服成本巨大。

比如2016年中国的可穿戴设备仅有200亿市场规模,从使用习惯的角度而言,即使是美国2015年的数据,也仅有3%的美国人保有可穿戴设备。此外,用户的使用习惯和意愿也是数据获取的大敌,2015年美国市场研究公司NPD Group的一份调研指出,超过40%的运动手环用户会在半年内弃用该设备,无法获得周期性可持续的数据。

上门检测用户数据当前常见的是血液检测和基因检测,从服务切入,未来通过数据积累应用到科学研究、医药用品研发、用户个人健康管理等场景,然而由于该类服务成本高,用户接受度低,数据获取也受到诸多限制。

事实上,针对前文提出的机构数据痛点,当前已经有一部分创业公司开始对数据进行整合,打造数据中间件。然而由于医疗机构之间的壁垒、检测水平、试剂选取等原因,数据口径和相关指标无法直接使用的情况依旧存在。个人数据源层面,不同数据分析厂商也会造成标准不统一的问题。

在具体实施层面,对于这些稀缺的个人数据如何整合,如何对不同领域和议题下的主题进行定义以及统计口径的协调将成为应用前的重要环节。在商业环境当中,这也将面临利益分配、如何分工合作以及伦理问题。

工具的缺失

医疗大数据能够发挥作用,还要看实际的应用和解读,如何正确解读数据,让数据对临床、个人健康、公共卫生、医疗保险等领域进行指导是医疗大数据最终落地的必备环节。

在任何垂直应用场景中,“know-how”都是很重要的一环。好的医疗数据领域的分析师也应当兼具垂直领域的专业知识和数据分析的基本能力,能够将业务和数据实现有效的整合。然而作为最匹配的复合型学科生物统计学在国内尚属起步阶段,由于数据市场上整体数据分析人才的缺失,能够落地到垂直领域的人数愈发受到限制。

其次是工具层面的短板,笔者在做数据工作的时候,有一个定性的发现:SAS、R、MATLAB等相对高门槛的工具在医疗行业里应用非常广泛,学科的限制导致了对工具的高要求,然而可视化的报表,直观的展现方式,能够有效提升分析的效率,“让专业的人做专业的事”。

隐私的边界

数据分析之后,如何落地,如何对患者体现价值也是当前数据应用的问题。对政府的部分数据更多反推至政策的制定当中,药品研发数据的最终落地和验证周期会更长。数据的价值如何对个体患者的体现,可否是个体用户可感知的输出,实际的作用如何去评估和衡量都是医疗大数据面临的问题。

此外,医疗数据采集、加工和应用的过程中,对于用户隐私的保护也十分重要,基于患者的属性,如检测指标和结果等,可直接对用户行为进行预判,如个人信息泄露带来的虚假推销等问题,因此,关注数据如何应用到个人层面的同时,信息泄露问题也是留意的重点之一。

第三方数据厂商打入医疗机构,并且使数据能够得以有效应用也面临推广的压力:高度资源导向型的医疗行业,行业、院校、机构、地域均面临重重壁垒,即使是上市公司也依旧无法打入某些区域,商务拓展难度和落地难度极大,一方面难以获取有效数据源,另一方面也没有足够的场景训练自身的模型。

对于这种情况,一些创业者采取了两条腿走路的方式:比如以太协助融资成功的“数联易康”,其一方面整合自身资源,不断与卫计委和医院进行商务拓展;另外一方面有效借助商业机构的网络,打破地域限制,快速实现自身的成长。或者如“永数”,直接通过产品创新,获取全国性标杆机构的支持,绑定进行推广。 

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 关系型数据库 测试技术
印尼医疗龙头企业Halodoc的数据平台转型之Lakehouse架构
印尼医疗龙头企业Halodoc的数据平台转型之Lakehouse架构
33 4
|
3月前
|
大数据
大数据在医疗领域的应用有哪些?请举例说明。
大数据在医疗领域的应用有哪些?请举例说明。
49 0
|
大数据
《从数据治理看医疗大数据的发展》电子版地址
从数据治理看医疗大数据的发展
90 0
《从数据治理看医疗大数据的发展》电子版地址
|
SQL 存储 分布式计算
Apache Hudi在医疗大数据中的应用
本篇文章主要介绍Hudi在医疗大数据中的应用,主要分为5个部分进行介绍:1. 建设背景,2. 为什么选择Hudi,3. Hudi数据同步,4. 存储类型选择及查询优化,5. 未来发展与思考。
304 0
Apache Hudi在医疗大数据中的应用
|
机器学习/深度学习 存储 人工智能
后疫情时代的城市医疗大数据,需要怎样的建设“方法论”?
找准自身定位,医疗大数据产业的上下游企业将大有可为。城市级健康医疗大数据体系建设,是一个很宏大的命题。
|
数据采集 数据可视化 大数据
智慧医疗大数据解决方案
随着医院信息化建设不断发展,医疗数据规模日益增长,医疗服务全面进入“大数据时代”。
2884 0
智慧医疗大数据解决方案
|
人工智能 安全 大数据
医疗行业正从大数据中汲取回报的六个途径
科技总是源源不断地改变着世界,人工智能和大数据正在结合起来,为人们提供各种好处,其中应用最广泛的可能要数医疗行业了。
|
存储 分布式计算 大数据
湖北Hadoop,基于大数据的医疗行业发展,解析大数据技术在医疗领域的应用及使用方法
健康医疗大数据作为国家重要的基础性战略资源,也受到了政企、医院等行业相关人员的高度重视。如何让医疗行业及领域去便捷管理和使用海量的大数据?
1379 0