收藏 分销(赏)

医疗大数据的应用.ppt

上传人:a199****6536 文档编号:964416 上传时间:2024-04-09 格式:PPT 页数:29 大小:3MB
下载 相关 举报
医疗大数据的应用.ppt_第1页
第1页 / 共29页
医疗大数据的应用.ppt_第2页
第2页 / 共29页
医疗大数据的应用.ppt_第3页
第3页 / 共29页
医疗大数据的应用.ppt_第4页
第4页 / 共29页
医疗大数据的应用.ppt_第5页
第5页 / 共29页
点击查看更多>>
资源描述

1、医疗大数据的应用医疗大数据的应用2021/3/29 星期一1议程议程医疗与大数据的趋势什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望2021/3/29 星期一2议程议程医疗与大数据的趋势什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望2021/3/29 星期一3趋势分析趋势分析:我们正处在医疗行业的一个重要转折点我们正处在医疗行业的一个重要转折点医疗费用在不断上升医疗费用在不断上升GDP的占比非常高Source:U nited Nation s“Po pulati on Agi ng 200 2”25-29%25-29%30+%30+%20-2

2、4%20-24%10-19%10-19%0-9%0-9%o f popu lation over age 60%o f popu lation over age 6020502050WW Average Age 60+:21%WW Average Age 60+:21%全球老龄化全球老龄化 平均年龄60+:目前的10%,到2050年将达到20%以美国为例以美国为例:医疗大医疗大数据的价值数据的价值3千亿美元/年,相当于每年生成总值增长0.7%2021/3/29 星期一4趋势分析趋势分析:我们正处在医疗行业的一个重要转折点我们正处在医疗行业的一个重要转折点05000100001500020102

3、0112012201320142015存储的增长存储的增长医疗服务产生的数据总量医疗服务产生的数据总量(PB)Admin Imaging EMREmail FileNon Clin Img Research医疗影像归档医疗影像归档一个医疗系统案例的数据一个医疗系统案例的数据到到20202020年年,医疗数据将急剧增长到医疗数据将急剧增长到35 Zetabytes,35 Zetabytes,相当于相当于20092009年数据量的年数据量的4444倍倍增长增长2021/3/29 星期一5议程议程医疗与大数据的趋势什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望2021/3/

4、29 星期一6医疗大数据简介医疗大数据简介1.1.制药企业制药企业/生命科学生命科学3.3.费用报销费用报销,利用率利用率 和和 欺诈监管欺诈监管2.2.临床决策支持临床决策支持&其他临床应用其他临床应用 (包括诊断相关的影像信息包括诊断相关的影像信息)4.4.患者行为患者行为/社交网络社交网络数据来源包括哪些?我们如何利用大数据创造价值?(示例)1.1.个体化医疗个体化医疗3.3.欺诈监测得以加强欺诈监测得以加强2.2.临床决策支持临床决策支持4.4.由生活方式和行为引发的疾病分析由生活方式和行为引发的疾病分析2021/3/29 星期一7医疗大数据相关解决方案分布式平台存储优化安全和隐私影像

5、数据处理加速新兴的医疗服务 应用个体化医疗临床决策支持肿瘤基因组学健康信息服务基础医疗服务个人健康管理老龄社会数据分析及 视觉化处理类SQL的检索医疗影像分析机器学习数据处理/管理医疗影像医疗记录基因数据2021/3/29 星期一8议程议程医疗与大数据的趋势什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望2021/3/29 星期一9大数据的挑战不仅来自于数据量的增长大数据的挑战不仅来自于数据量的增长.需要新技术的支持检验结果,费用数据,影像,设备产生的感应数据,基因数据等数据量数据量结构化数据,遵循标准的数据标准(如,HL7)非结构化数据,如口述、手写、照片、影像等类型

6、类型在传统的解决方案之上,引入新的数据及分析模型和技在传统的解决方案之上,引入新的数据及分析模型和技术,术,实时有效的商业价值实时有效的商业价值基于现有数据库中的数据进行分析,来支持不同种类的业务:如 费用及报销、患者病史、归档影像分析、实时临床决策支持(数 据分析)价值价值 实时数据分析,而非传统的批量处理分析 数据以流的方式进入系统,进行抽取和分析 对于实时运行中的每个时间节点产生影响,而不是事后处理速度速度2021/3/29 星期一10议程议程医疗与大数据的趋势什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望2021/3/29 星期一11关注数据的价值关注数据的价

7、值数据源数据源文本-语音-视频-传感器 Requesting Or M2M通讯批量 商业应用传统解决方案传统解决方案 环境环境ERP,CRM,ERP,CRM,Batch,OLTP-Batch,OLTP-DBDB边缘服务器(Edge)大数据存储的考虑传统存储方式大数据存储的考虑传统存储方式 大规模数据分析 Hadoop*海量数据库 Hive*大规模备份 Lustre*丰富的视觉化效果 安全的数据分析和缓存分析 同步 端到端Machine-to-Machine Source-to-Source2021/3/29 星期一12关注数据的价值数据源数据源文本-语音-视频-传感器 Requesting O

8、r M2M 通讯批量 商业应用传统解决方案传统解决方案 环境环境ERP,CRM,ERP,CRM,Batch,OLTP-Batch,OLTP-DBDB边缘服务器(Edge)Data Center ProvisioningDiscrete VirtualCloud As A Service HPC大数据存储的考虑大数据存储的考虑 传统存储方式传统存储方式 大规模分析 Hadoop*海量数据库 Hive*大规模备份 Lustre*丰富的视觉化效果 安全的数据分析和缓存分析 同步 端到端Machine-to-Machine Source-to-Source可行的解决方案体系(示例)可行的解决方案体系(

9、示例)Applications&ServicesVisualization&Analytical ToolsData Delivery,Operational&Graphical AnalyticsData Management&Computational AnalyticsCompute Storage&Infrastructure Platforms2021/3/29 星期一13大数据解决方案的部署方式(参考)企业级数据仓库电子表格视觉化工具数据挖掘集成开发工具ODS&数据集市企业应用工具企业应用工具传统的文件格 式日志社交&网络遗留系统结构化结构化非结构化非结构化录音文件&笔记等数据平台

10、数据平台关系型数据库No-SQL内存数据库SQL应用应用NodeNodeNodeHadoop*Web Apps MashUpsIMPORTINSIGHTSCONSUMECreate MapREDUCE2021/3/29 星期一1418大数据解决方案的整体框架架构大数据解决方案的整体框架架构Data as a ServicesBI&Predictive AnalyticsExisting BI/Analytics with in-databasedata processing supportMedical DevicesData VelocityData Volume and QualityIn

11、tegrated Analytics with Hadoop SupportIntegration ToolsDistributed High Performance Data ProcessingHadoop*MapReduceData ingestion,Integration and Processing ServicesMPP DatabasesDW AppliancesDatabases DBMS/NoSQLCustom Analytic SolutionsMapReduceTextual AnalyticsStreaming Analytics10GBeFast FabricVer

12、tically Integrated Software IntelAIMSuiteNLP/Semantic Search/Machine Learning Knowledge ManagementData VulnerabilityHPC/TCP MICNAS-SAS and Distributed StorageData Access User AuthenticationData CharacteristicsDistributedVirtualPersistenceEvent,Message Real-Time,Cached,Federated EDW,MartsData Visibil

13、ityCloudProvisioning Models-Storage&Connectivity ConsiderationsData SourcesText,VideoSecurityServices Privacy ComplianceHumanGenome&Drug DiscoveryGISSurveillance andMedical Device Streaming DataDiagnosticImagesSocialMediaMedicalRecordsLogFilesand AudioProvisioning Models Can Vary by Data Characteris

14、tics2021/3/29 星期一15高效的大数据访问途径高效的大数据访问途径 (客户端客户端)“Know Me”“Free Me”“Express Me”智能手机移动医疗 助理平板电脑笔记本,Ultrabook 其他设备台式机数字标牌自助终端MobilityVital sign,I&O entryMedication administrationTemplate data entryFree-format textdata entryLarge diagnosticimagesData inquiryManageability“Link Me”2021/3/29 星期一16大数据在中国医疗行

15、业中的应用模式1.1.制药企业制药企业/生命科学生命科学3.3.费用报销费用报销,利用利用 率和欺诈监管率和欺诈监管4.4.患者行为患者行为/社交社交 网络网络2.2.临床决策支持临床决策支持&其他临床应用其他临床应用 (包包 括诊断相关的影像括诊断相关的影像 信息信息)药品研发对药品实际 作用进行分析;实 施药品市场预测基因测序分布式计算加快基因测序计算 效率临床数据比对匹配同类型的病人,用药临床决策支持 利用规则和数据实时分析给出智能提示公共卫生实时统计分析 发现公共卫生疫情及公民健康 状况新农合基金数据分析 及时了解基金状况,预测风险 辅助制定农合基金的起付线,赔付病种等基本药物临床应用

16、分析分析基本药物在处方中的比例远程监控 采集并分析病人随身携带仪器数据,给出智能建议人口统计学分析 对不同群体人群的就医,健 康数据实施人口统计分析了解病人就诊行为 发现病人的特定就诊行为,分配医疗资源2021/3/29 星期一17议程议程医疗与大数据的趋势什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望2021/3/29 星期一18案例分享:Regional Health Info Network ChinaReal-time Clinical Decision Support 实时的医疗数据处理(电子健康档案,医 疗影像数据),支持医疗协同、临床决策 支持和公共卫生

17、管理采用 Hadoop*(HBase*/Hive*)来实现医 疗数据分析和处理未来将扩展到不同领域、不同区域/地区(包括数据交换、处理和分析)与本地的软件厂商及OEM厂商进行了广泛 合作技术挑战技术挑战Hadoop(HBase/Hive)与传统关系型数据 库如何有效结合大数据在区域卫生信息平台中的切实可行 应用场景Public HealthHospitalPrimary care (Grassroots)Ancillary Data&ServicesHealth Information DWEHRData&ServicesRegistries Data&ServicesLongitudinal

18、 Record ServicesHealth Information Access LayerCare Coordination Clinical decision supportData Analytic R&DRHIN2021/3/29 星期一19区域医疗及基层医疗信息系统大数据解决方案区域医疗及基层医疗信息系统大数据解决方案分布式数据服务系统展现层(报告,视图)集成的用户应用界面(居民、医生、卫生行政管理人员)数据挖掘(Mahout)分布式批量处理框架(Map/Reduce)协作 服务(Zookeeper)结构化数据采集器(Sqoop)日志数据采集器(Flume)分布式文件系统(HDFS

19、)区域卫生信息访问层区域卫生信息访问层(HIAL)医院信息系统医院信息系统实时数据库(Hbase)语言和编译(Hive)基层医疗信息系统新农合医疗保 险服务器虚拟化基础设施虚拟化基础设施虚拟化网络虚拟化 存储虚拟化基于云的区域基层医疗服务系统多租户应用多租户应用健康档案数据存储公共卫生医疗服务运营管理药品管理2021/3/29 星期一20Sequencing3 Billion Base PairsData Processing Cloud Storage VisualizationMillions of VariantsInterpretation&AnalyticsMillions of V

20、ariants Millions of PatientsCommercializingTargeted Therapeutics Companion DiagnosticsActionable Biomarkers案例分享案例分享:NEXTBIO基因数据分析Cost to sequence a genome has fallen by 800 x in the last 4 yearsEach genome has 4 million variantsGrowth in the genomics data in the public and private domainData availab

21、le in variety of sourcesStructured,semi-structured,unstructuredNew aggregated data growing exponentially2021/3/29 星期一21案例分享案例分享:NEXTBIO病人相关性数据Novel DiscoveriesBiomarkers Disease Mechanism Drug IndicationsClinical Trial Parameters Patient Care OptionsLarge content repository of public and private gen

22、omic data combined with proprietary and patented correlation engine2021/3/29 星期一22案例分享:Kaiser Permanente 大数据应用2021/3/29 星期一23数据的发展趋势Kaiser的数据中,90%是非结构化的(80%的EHR和影像数据)在未来十年,数据将会有25 倍的增长(One exabyte by 2020)主要的数据 增长 来自于 非结构化数据(医疗影像,视频,文本,音频等)信息 给 实时个性化医疗服务带来了可能性 (Requires Contextual device,environment

23、,spatial,Demographics,Social and Behavioral profiles in addition to medical information)Kaiser 正在评估大数据相关技术结构化数据结构化数据80%80%非结构化数据非结构化数据全世界全世界 80%80%的数据是非结构化的的数据是非结构化的 (大量的移动 终端设备,机器产生的数据)在未来十年,数据将迎来在未来十年,数据将迎来 44 44 倍的增长倍的增长 (35zettabytes by 2020)主要的数据主要的数据 增长增长 来自于来自于 非结构化数据非结构化数据 (在线 的归档数据,医疗影像,在线视

24、频和存储,照 片等)信息信息 给各行业发展带来了新一轮的机遇给各行业发展带来了新一轮的机遇 (零售,金融,保险,制造,医疗,)各行业已经开始采用各行业已经开始采用 大数据技术大数据技术 用于信息提用于信息提 取取全球数据的构全球数据的构成成结构化数据结构化数据KaiserKaiser的数据构成的数据构成90%90%非结构化数据非结构化数据2021/3/29 星期一24数据平台计算的趋势数据平台计算的趋势分布式计算分布式计算Discontinuous ChangeSAN/NASMasterSlave(s)Data is distributed across processing slave no

25、desResources containing data are not sharedMaster manages the data distribution,job scheduling across slave nodes and aggregating result setsIntegrate built/bought Real-time Predictive Analytical Solutions or Processing logicSMP(5$)MPP(10$)In-Memory (50$)SAN/NASSAN/NASShare-Nothing Distributed Stora

26、ge and Compute($)Fault-tolerant MasterSlave Architecturecapable of withstanding partial system failuresDASSAN/NASSMP(Disk Caching,High Speed Network)(10$)Kaiser is looking to exploit this capabilityStructured,Relational Tabular DataInteractive Query SupportReal-time AnalyticsSQL Transaction DataUnst

27、ructured,Non-tabular DataRich Ad Hoc IntegrationReal-time AnalyticsUQL ALL Data2021/3/29 星期一25大数据平台大数据平台需求分析需求分析 Ingestion(Data Model,Metadata Reference Data,Store)Integration(Alignment,Semantics,Completeness,Quality)Interrogation(Clustering,Statistical,Quality,Semantics)Information(Standard&Ad Hoc

28、reporting,Query,Alerts,Forecasting,Access)数据量数据量 (Sensors,EMR,Claims,Pharmacy,Images)类型类型(Structured,Text,Unstructured,Documents,Images)处理的特性处理的特性 Intuition(Simulation,Optimization,Stochastic Optimization)A unified information storage methodologyenabling users to manage data from ALL sources.A portf

29、olio of tools to manage(profile,cleanse,classify,synchronize,aggregate,integrate,share)ALL types of data.Support current BI tools focused on structured information.Build/buy packaged unstructured data processing and analytics tools.Ability to model information and transition from multiple access met

30、hods to generating,sharing,collaborating and acting on insights anytime,anywhere on any device.速度速度 (SLAs,Real-time Decision Support&Contextual Intelligence)Information drives process optimizations with strategic impact.Modeling business intuition from data deluge.数据的特数据的特性性2021/3/29 星期一26大数据 界定的标准D

31、ATA SIZEDATA TYPEDATA CLASSDATA CATALOGDATA VELOCITYDATA ACCESSDATABASE TYPESERVER ARCHITECTURESTORAGE ARCHITECTUREGigabytes,Terabytes,PetabytesStructured,Semi-Structured,Unstructured Human Generated,Machine Generated Text,Image,Audio,VideoBatch,StreamingAnalytics,Search,Transaction(ACID,BASE)Relati

32、onal,Columnar,NoSQL,Document,Graph,RDFSMP,MMP,Distributed ProcessingNAS,SAN,Direct Access Storage,Spinning Disks,Flash,SSDFRAMEWORKSFinancial,Computer Vision Engine,Geospatial,Machine Learning,Mathematical,Natural Language Processing,Neural Networks,ANALYTICSStatistical Modeling,Time-Series Analysis

33、,Voice Engine Standard Reporting,Ad hoc Reporting,Query/Drill downs,Alerts Forecasting,Simulations,Optimization,Stochastic OptimizationsDISTRIBUTED PROCESSINGAppliance,Commodity Cluster(CC)1K nodes2021/3/29 星期一27议程议程医疗与大数据的趋势什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望2021/3/29 星期一28总结总结 我们正处在医疗行业大数据 和分析的一个重要转折点 我们需要让大数据更为高效,可以便捷的访问 专注在创新,依赖产业链来 提供企业核心能力之外的服 务 采用标准和最佳实践,参考 全球已有的成熟模型2021/3/29 星期一29

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服