前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇医疗大数据范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
当前云计算、物联网、移动互联网等技术飞速发展,数据的种类和规模以前所未有的速度增长,如何管理和利用大数据成为当前研究的热点。云计算和大数据技术对数据处理及服务方式产生巨大影响。文章阐述了云计算和大数据的内涵特征基础,结合医疗领域,论述了大数据的研究意义及云计算下大数据处理方式。阐述了云计算下大数据技术不仅改变了传统的数据管理模式,必将带来极大的经济与社会价值。
【关键字】
云计算;大数据;医疗行业数据;应用研究
一、前言
随着社会的发展,人们日常生活与工作产生的数据量越来越大,人类已经步入了大数据时代。数据变化具有以下趋势:第一是海量数据的需求。数据基本是以每年成倍的速度进行增长,数据量的需求分析也更细,对它的门槛要求也更低,传统的数据库无法满足这种需求。第二是快的需求。数据得到的同时,希望有智能的产生,希望能够直接产生效果。第三现在的开发者,需求是多样化的,很多时候关系型数据库并不是最优的解决方案。数据的不断增长,给数据存储、数据管理和分析利用带来了机遇;在这些包括个人信息、消费记录等的海量数据之中,蕴含着许多有价值的信息,能够为企业经营及管理提供参考。云计算作为这个大数据时代的主流技术,对于大数据的应用管理又有着重要影响。云计算是大数据的IT基础,而大数据是云计算的一个重要应用。
二、大数据的概念与意义
1、大数据的概念
大数据,即巨大数据量,不能够通过主流的软件工具,在适当的时间内收集管理处理及组织起来,使之作为企业决策的有用信息。大数据,需要特别的技术,由大规模并行处理(MPP)数据库、数据挖掘网格、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统组成。“大数据”,需要更多的决策权及洞察发现力及过程地大规模优化能力,应对新模式高增长率及信息资产多样化。大数据技术的战略意义并不是一个巨大的数据信息的掌握,而是因为这些包含了专门的数据进行处理。大数据的特点可以概括为4个“V”(大量Volume,多样Va-riety,价值Value,高速Velocity)。首先,庞大的数据量。大数据的初始测量单元至少为P(1000个T),E(100万个T)或Z(10亿个T);二、数据类型丰富。例如,网络日志,视频,图片,位置信息等。第三,低密度,高商业价值。第四、快速处理速度。这最后一点是传统的数据挖掘技术本质上是不同的。大数据技术,是一种先进的数据分析技术,能够从各类数据快速获取有价值地信息,它需要新地加工方式,实现更大决策力地海量高增长率及多样化的信息。
2、大数据的意义
面对大数据直接从所有的数据分析,挖掘所需信息。分析数据挖掘是混合的有不同来源数据结构,要求其对样品的精度高并且关注数据相关性地研究。大数据为云计算及计算能力提供了解决空间,对于大数据存储挖掘及云计算业务,大数据需要高效节能的海量云服务器,并从海量数据提取有价值地信息,能够对政府金融零售娱乐及媒体领域带来革命性的变化。云计算是基础信息存储,为数据共享和挖掘方法提供有用的工具,通过数据的分析和预测使决策更加准确。中国拥有庞大地高度复杂性充满变化的用户群体,将成为世界数据量最大的国家。探索基于大数据的解决方案能够解决海量数据带来的问题,并使国内产业升级和提高效率。
三、云计算技术与大数据结合应用
1、云计算技术
云计算,是互联网基础设施底层的抽象,是互联网相关服务的使用和交付模式,并提供一个具有扩展性和虚拟性地动态资源。云计算,将加工程序自动分割成许多较小子程序,通过互联网使一个或多个服务器搜索大量系统的计算和分析的巨大处理能力。最后将计算处理结果反馈给用户。云计算,强调动态计算能力,大数据,是静态计算的对象。
2、云计算与大数据关系
云计算和大数据是相辅相成的关系。云计算提供了大数据存储和操作地一个计算平台,大数据则利用分布式处理方法来应用此平台,云计算与大数据,前者强调计算能力,需要处理大量复杂数据:包括数据获取、整理、转换、统计。云计算,要用大量数据作为运算地基础,两者是必然趋势结合。在具体实际应用中,云计算促进了大数据的实际应用,这种应用出现在公共问题领域等。借助云计算、云存储、数据丢失、病毒入侵等问题的优势,保障数据安全和爆炸性增长的数据为企业带来了新的机遇和挑战。
四、大数据在医疗行业应用
1、医疗行业数据分析
随着医院信息化的快速发展,医疗行业产生大量的医疗数据,如何使这些数据提供帮助,即节约医疗成本,提高医疗质量,目前,医疗数据的应用,还有一些问题,一是医疗数据分散在各个医疗机构,二是数据利用率很低,医院信息系统积累了大量的数据,但在大多数情况下仅限于管理层面,很少涉及临床专业水平。在面对大量的医疗数据积累的情况下,如果可以进行有效的数据分析和数据挖掘,可以获得大量的有价值的信息,可以帮助医疗和医院决策者,从而推动到医院提供更好的医疗服务,提高治疗质量。大数据技术将在医疗领域的公共基础服务领域应用,将能够帮助医院推动医疗行业的进步。
2、大数据的应用
由于区域医疗信息化及医疗物联网地应用,能够产生大量地数据:如测试结果、成本数据、传感器数据、基因数据和图像数据等,并且还包括大量的在线实时数据分析和处理的需求数据,它们满足大数据4V特征,属于大数据类别。为了创造经济和社会价值,如何有效地管理利用这些海量地医疗数据是医疗行业面临的挑战。在医学领域中大数据技术的应用前景广泛。主要包括以下几个方面:
(1)临床决策支持系统
将大数据技术应用于临床决策支持系统,能使系统更加智能化。由于大数据分析技术的非结构化数据的强大的分析能力。例如:在医学文献数据库通过数据挖掘,为医师提出更合理的诊断及治疗意见,提醒医生对于预防潜在的错误,例如由于药品不良反应等,通过采用图像分析与识别技术,对医学图像数据进行识别并提高诊断和治疗的质量。
(2)个性化地医疗系统
通过对患者进行如基因组数据分析的个性化医疗大型数据。综合分析患者的特点及疗效数据及对患者进行基因测序的调查,对某一疾病患者的药物特殊性和敏感性的反应关系,及在治疗过程中的特殊性进行靶向治疗。
(3)监测与预报流行病
在中国疾病预防控制中心,建设突发公共卫生事件和国家传染病网络报告系统已投入运行,每年存储的病例报告和信息有600多万左右,覆盖了全国所有县疾病控制机构信息的年度报告。通过大数据技术报告海量数据可以进行综合性地分析及检测,对于通过综合疾病监测及反应程序,准确预测传播时间和路径,方便采取有效措施,减少传染病的患病率。流感的准确预测是利用大数据技术成功案例。谷歌公司对流感准确预测的成功案例是大数据技术的应用。谷歌公司把美国最常使用的搜索条目。与流感疫情在美国疾病预防控制中心的数据相比,确诊了是否感染流感。人们通过使用特定的如“咳嗽和发热药”搜索词,便获得流感治疗的互联网信息,建立了特定的搜索条件和时间空间与流感之间联系。比美国疾病控制和预防中心的数据提前一周。检测流感传播路径,他们的判断很及时。近年来,医疗行业面临着海量数据和非结构化数据的挑战,许多国家都在积极推动医疗信息化的发展。因此,大数据技术在医学领域的应用前景十分广阔。
五、结束语
大数据技术在医疗领域的大规模应用尚不完全成熟,但随着高速网络、云计算中心等基础设施建设日趋完善和大数据技术的发展,医学领域发展的趋势,将是推动大数据技术的个性化、创新化,便利化医疗。云计算、移动互联网和物联网技术的快速发展,全球范围内数据增长规模越来越大,大数据将被应用到各行各业,不仅改变了传统的数据管理模式,带来了新的思维、业务转型和管理创新,提高企业和公共部门的生产力和竞争力,也会带来巨大的经济和社会价值。大数据已成为新发明和新服务的来源,是社会新的财富。
作者:郭群 单位:辽宁对外经贸学院信息管理系
参考文献:
[1]张德丰.大数据走向云计算[M].北京:人民邮电出版社.2014.4.1.
关键词:大数据;医疗;大数据挖掘
引言
随着信息时代的不断发展,海量的数据被产生出来。在人们的日常生活中,方方面面都可能产生数据。这些数据反应了社会规律和自然规律,被认为是一笔重要的战略资源,与自然资源等可以相提并论。有统计显示,一般的医疗机构每年会产生1TB到20TB的数据,一些大医院甚至可以产生300TB到1PB的数据。随着技术的不断进步,人们处理数据的能力和技术也不断增强。从前,人们只能看着这些宝贵的数据白白丢失;现在,这些数据有望被运用到智慧医疗方面,即让患者就医更方便、疾病诊断更加高效,以及医疗信息更加准确。
一、大数据概述
(一)大数据的定义
随着智能手机、平板电脑、移动互联网、物联网等各式各样传感器的涌现,数据源呈现指数级增长,信息数量迅速扩大。从这些海量数据中提取有用信息并加以利用,已经成为战略性发展和要求。大数据可以通过在海量数据中提取的有用信息,挖掘新的认知,创造新的价值,从而改变市场关系和组织机构。
关于大数据的定义,目前学术界仍然没有获得统一共识。一般认为,大数据指的是巨量数据结合,是指无法在一定时间范围内用常规软件工具和软件进行捕捉、管理和处理的数据集合,是需要更强的决策力、洞察发现能力才能加以挖掘和应用的数据。大数据不是单纯的海量数据,而是大量种类繁多、价值密度低、处理速度要求快和实效性要求高的数据的集合。目前,大数据在互联网、金融、农业等领域都有广泛的应用。
(二)大数据的特征
通常,用4个V(即Volume, Variety, Value, Velocity)来概括。
一是体积巨大。截止到目前,人类生产的所有印刷材料的数据量是300PB,大企业一年生产出的数据量大多处于TB量级。
二是数据种类繁多。对此,人们把这些数据分为结构化稻莺头墙峁够数据。结构化数据多以文本为主,非结构化数据则包括音频、视频、地理位置信息等。这些数据为数据的挖掘处理能力提出了更高要求。
三是价值密度低。在大量不断生产的数据流中,只有极少数的数据是有价值的,如何在海量数据中挖掘真正有用的数据,进行数据“提纯”成为大数据工作者研究的重点。
四是处理速度快。据统计,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,各国政府及企业能否加快处理数据的效率,将成为成败的关键。
(三)大数据的意义
大数据最重要的意义是预测。比如,商业公司对消费者日常的购买行为和使用商品习惯进行汇总和分析,了解到消费者的需求,从而改进已有商品并适时推出新的、消费者很可能会满意的商品。知名互联网公司谷歌对其用户每天频繁搜索的词汇进行数据挖掘,从而进行相关的广告推广和商业研究。
由于大数据的处理迫在眉睫,近年来各国政府和全球学术界都掀起了一场大数据技术的革命,都在积极研究大数据的挖掘技术和分析手段。很多国家都把大数据技术研究上升到了国家战略高度,提出了一系列的大数据技术研发计划,从而推动政府机构、学术界、相关行业和各类企业对大数据技术进行探索和研究。
可以说大数据是一种宝贵的战略资源,其潜在价值和增长速度正在改变着人类的工作、生活和思维方式。可以想见,在未来,各行各业都会积极拥抱大数据,积极探索数据挖掘和分析的新技术、新方法,从而更好地利用大数据。当然,大数据并不能主宰一切。大数据虽然能够发现“是什么”,却不能说明“为什么”;大数据提供的是一些描述性的信息,而创新还是要人类自己来实现。
二、大数据对医学研究的影响
(一)大数据改变医学诊断手段
大数据分析为许多医学难题的解决提供了新途径,改变了一些疾病诊断方式。大数据可以挖掘出大量以往的相似疾病案例,通过分析这些诊断数据,对疑难杂症进行快速判别。如,在心脏病的诊断过程中,首先采集心脏数据并转化为心脏图谱,然后根据图谱进行建模,模型中的变量包括压力、张力、僵硬度等,最后根据这个模型分析心脏疾病病情,并作出相应的诊疗方案。此外,还可以利用图像处理技术,将心脏数据建模成为一个虚拟实体,通过设置不同的参数,模拟观察各类手术或者药物对心脏机能造成的影响,从而在诊疗之前就对诊疗后心脏疾病可能的走势做出预测,为获取疾病诊治方法提供了手段。
(二)大数据可预测病情的扩散趋势
当流行病发生时,可以对疾病已有的扩散趋势和感染人数进行建模,对每一个时间节点的数据进行分析处理,从而对流行病进行统计研究,预测病情的扩散趋势,为疾病防治提供参考。同时,当下一次疫情发生时,可以调出往年数据进行分析,了解规律,从而有望抑制病情的进一步扩张。
(三)大数据有望决定现代医药学研究成败的关键
当前在我国,优质医疗资源有限,患者往往需要争抢医疗资源,才能获得一个宝贵的治疗机会。然而,患者个体差异巨大,疾病种类繁多,且仍然有很多现代医疗技术无法解释和治疗的疑难杂症,使得诊断很难标准化和自动化。同时,医生在治疗时,治疗手段和方法、治疗进度等并不公开透明,缺少病人的主动参与。此外,医生工作强度大,医疗资源不足,误诊漏诊现象时有发生,使得医患矛盾不断加剧,医患关系已经在近年来成为了一个社会问题。大数据医疗则可以使患者主动参与到医疗过程中。医生可以在海量数据中找到病人的既往病史、体质特征、健康数据等资料作为辅助,从而更好更快地为病人做出准确的判断。
此外,以往医院的医疗数据都是独立的,病人若首次在某家医院就诊,医生还需要花费时间和精力了解病人的既往病史,既降低了诊治效率,也增加了病人就医的时间成本。大数据使得医院之间互通数据成为了可能,可避免患者在多个不同的医院之间进行重复诊治而付出高昂的医疗费用。大数据医疗有望构建一个以患者为中心的个性化平台,为患者提供疾病治疗、疾病管理、挂号预约、健康数据查询等多方面的服务,充分尊重患者的价值观和需求,协调不同专业的医疗服务。可以说,大数据有望带来医学研究、临床决策、疾病管理、医疗卫生决策等方面的改变甚至革新,从而带来整个医疗模式的转变。
三、大数据在医疗行业的应用
(一)疾病预防
大数据可以帮助研究者比之前任何时候都更了解健康影响因素。有统计显示,大约只有10%到15%的健康影响因素已经被现代医学确定,而剩下的85%到90%的影响因素,包括基因、健康行为、自然和社会环境均未被确定。利用大数据,研究者可以将患者的家族病史、医疗记录等与平日的生活习惯、饮食习惯、收入、教育等方面联系起来,通过对海量的数据进行分析比对,研究这些健康影响因素相互之间的关联。通过对不同区域、不同年龄的人群进行评选,筛选健康相关危险因素,并制作健康监测评估图谱数据库和知识库,提出有针对性的疾病预防计划,以促进居民健康水平的提高,降低患病风险。这样一来,大数据可以显著提高医疗和健康服务,且对不同的人群提供不同的干预措施和针对性的解决方案。
大数据还可以整合和分析公共卫生数据,提高疾病预报能力,加强对疾病的监测。例如,Asthmapolis公司为哮喘患者研发了一种追踪器,记录患者吸入器的使用,并⑹据传输到中央数据库进行分析,用来了解个人患者的疾病进程和使用习惯。将这些数据与疾病预防中心的哮喘危险因素数据结合,能够有助于医生为患者制定更加个性化的预防、治疗计划。
(二)临床应用
在医学临床方面,大数据有着广泛的应用天地,包括相对疗效研究、医疗资料的透明化、病人病历的进阶分析、药物副作用分析和远距离监测病患。
1.相对疗效研究
信息时代使得电子病历的普及成为可能。目前,电子病历结构化数据已逐渐成熟,通过大数据分析海量的医疗数据,比较分析不同的干预措施的有效性。这为临床治疗决策提供了非常有用的参考信息。在医疗护理系统中利用大数据实现相对疗效研究,将大大提高疾病诊疗的效率,减少过度治疗以及治疗不足。
2.医疗资料的透明化
大数据分析可以对不同医院的治疗费用、治疗质量与绩效进行评估和比对,并快速呈现出来,让患者一目了然。此外,大数据有望精简业务流程,从而降低成本,提高医疗护理质量并给患者带来更好的就诊体验。
3.患者病历的进阶分析
目前,电子病历系统包括三部分数据,即电子病例数据、医学检验数据和医学影像数据。电子病历是病人自述病症、医生记录产生的以文字标书为主体的数据,是一种非结构化的数据。医学检验数据来自于医学检验设备,主要包括各种数据,具有标准性和规范性的特点,是一种结构化数据。医学影像数据则包括X光片、B超影像等来自医学影像设备的数据,由于这些数据以图像为主,因此是一种非结构化数据。构建电子病历系统,可以全面掌握患者的病情演进情况。大数据可以对海量的患者病历和档案进行进阶分析,确定哪些人是某类疾病的高危感染人群,并按照不同患者的既往病史为其提供不同的治疗模式和不同的预防性保健方案,才能达到最佳治疗效果。
4.药物副作用分析
在临床用药的过程中,药物使用可能会引起患者的不良反应。这种不良反应会导致药物不能发挥原本的作用,治疗效果减弱,严重时甚至导致患者死亡,同时不合理的用药也可能大大集中患者的经济负担。来自美国的统计显示,每年美国有70度万人因为药物副作用受到伤害或者死亡。通过对产生药物副作用的患者病情进行分析,挖掘出不同药物的副作用可能产生的情况,从而提高患者疾病的治疗质量,指导临床用药,减少药物副作用或不当用药对患者的伤害,并指导新药研发。
5.远距离监测病患
随着传感器的进步和物联网的发展,大量可穿戴设备、各类App等出现,能够实时获取病人的健康信息。许多高血压、心脏病、糖尿病患者在家中测量的血压、心率、体重、血氧、吐气流量等健康指标和数据都可以传回医院或健康管理中心,给医疗人员提供诊断参考,便于给患者提供饮食和生活建议。
(三)互联网医疗
互联网的发展与大数据技术的进步使得在线医疗成为了可能。在互联网医疗网站上,患者提供病症相关数据,医生根据这些病症数据,对患者的病症情况进行初步判断。该方法能够在一定程度上环节医疗资源不足和分布不均的情况,但是无法从根本上解决这一难题。由于常常有非专业人员给出诊断答案以及缺乏详尽的病理数据,通过互联网医疗网站很难得到准确的医疗治疗。此外,网络药房也在近年来逐渐兴起。通过网络药房,患者可以购买非处方药,或是提供医生的处方购买处方药,等待药品送货上门的。这种方式减少了患者去药房或者医院的时间成本,有一定的发展空间。
四、大数据在医疗领域应用的几个关键问题
将大数据全面应用于医疗领域中,构建医疗大数据系统,除了国家政府从政策层面鼓励支持和加强引导之外,各级政府及医院等相关机构也需要行动起来,积极迎接大数据。
(一)推广电子病历,实现数据标准化采集
各级政府应鼓励医院使用电子病历。在使用电子病历的医院中对医生作出一些规范性的要求,使电子病历记录规范。此外,医学检验数据和影像检验数据的采集和存储也需要规范,同事要建立统一的数据库存储系统来分门别类的存储这些信息。在推广电子病历和构建医疗大数据系统中,数据标准化十分重要,是技术实现的关键问题。
(二)确保数据库的安全性
病历是患者的个人隐私。将这些隐私信息被转移到线上时,应该注意数据库的安全性,保障患者的个人隐私。技术部门要持续更新病毒库,定时对数据库系统进行查漏补缺,同时不断攻克技术难关,加强数据库的安全性,确保患者隐私信息得到保障。
(三)大数据挖掘分析方法
要想真正将大数据为己所用,适当的大数据挖掘分析方法必不可少。大数据挖掘的核心内容是数据的特征与属性提取,并依据特征和属性进行分类。在此基础上,对不同属性的数据类型进行关联分析,从而获得有价值的信息。目前,大数据挖掘分析方法包括分类、估计、预测、聚变等。大数据相关从业人员有必要不断学习理论知识,同时在实践中积累大数据挖掘分析经验,从而提高大数据分析能力。
五、结语
大数据分析是当前计算机科学与技术领域的热点。各个领域都认识到了大数据可能带来的好处,获得大数据并挖掘其中有价值的信息对于领域发展十分重要,也是未来科学发展的必然方向。在医疗领域,大数据有着广泛的应用空间,可以用在包括疾病预防、临床应用、互联网医疗等方面。可以说,医疗大数据是未来医疗领域的发展趋势。目前,在医疗行业应用大数据方面,我国还处于初级阶段,政府、医院及数据挖掘技术人员需要共同努力,才能让大数据在医疗领域发挥作用。
参考文献:
[1]邹北骥.大数据分析及其在医疗领域中的应用[J].计算机教育.2014(7):25-27
[2]周光华,辛英,张雅洁,胡婷,李岳峰.医疗卫生领域大数据应用探讨[J].中国卫生信息管理杂志.2013(4):74-76
巧合的是,当天有媒体报道了我国30省份至少有275位艾滋病感染者个人信息遭泄露的事件。犯罪分子在诈骗电话中能准确地描述出病患的个人信息,包括真实姓名、身份证号、联系方式、户籍信息、确诊时间、随访的医院或区县疾控等等,并谎称能为病患办理补助而需要收取不菲的手续费。中国疾病预防控制中心相关负责人于7月17日表示,国家艾滋病感染者相关信息系统被列为国家网络信息重点安全保护对象,目前已经报案,将积极配合公安部门尽快破案。此事还引起了世界卫生组织驻华代表处和联合国艾滋病联合规划署驻华代表处的关注。7月18日,两家代表处联合发表声明,强调“加强现有系统以杜绝类似信息入侵事件再次发生,至关重要”。
国家对于健康医疗大数据的安全十分重视,据统计,《意见》中,“安全”这个词出现了33次。而此次疑似真实发生的医疗数据安全事件,成为“安全是核心基础”的最佳注脚。
他山之石,可以攻玉
――英国健康医疗数据安全的审查和建议
不止我们,许多其他国家也发生了一系列事件,向全世界宣告了他们对健康医疗数据安全的关切。在英国,国家医疗服务体系(National Health Service, NHS)于2016年7月6日做出停止care.data健康医疗大数据平台的决定中,“安全”即是重要原因之一。
在很大程度上,NHS决定关闭care.data,是基于7月6日的两份评估报告。第一份报告《安全的数据,安全的医疗》(“Safe Data, Safe Care”)由英国医疗质量委员会(Care Quality Commission,CQC)。医疗质量委员会是英格兰健康和社会医疗的独立监管机构,其职责是监控、检查和评价医疗服务,促进医疗服务符合标准规范以保证其质量和安全。作为独立第三方,CQC经常地区、国家级的健康和社会医疗质量报告。2015年9月,受英国卫生大臣委托,CQC对NHS处理病人敏感数据过程的安全现状进行审查,并提出改进数据安全的建议。
第二份报告《对数据安全、同意和选择退出的审查》(“Review of Data Security, Consent and Opt-Outs”)是由英国“国家健康和医疗数据守护者”(National Data Guardian for Health and Care, NDG)。2015年9月,英国卫生大臣也委托其与CQC紧密合作,共同提出新的数据安全标准、测评数据安全合规的新方法,以及获取同意共享数据的新模式。在英国,NDG由卫生大臣任命,其主要职责是确保公众能够信任医疗健康系统将保护个人信息,以及个人信息将被用于提高健康医疗水平。
CQC和NDG在对533起数据安全事故调查后发现,大多数事故与纸质的医疗记录相关,且80%到90%的数据安全事故是因为工作人员的习惯无意之中引起的,比如点击了不安全的链接、丢失了存储数据的介质等。但是随着医疗信息系统的普及、数据的逐步集中化及对公众开放访问入口,如果不提升安全防护水平,更严重、更大规模数据泄露的风险将会增加。综合CQC和NDG的报告,英国NHS数据安全工作中存在以下问题:
首先,虽然很多机构都建立了数据安全方面的策略与规程,但并没有在日常工作中得到有效实施,很多机构只依赖策略和规程,而不是通过检测验证系统是否足够安全,也未要求其供应商也遵循同样的管理措施。
其次,NHS的绝大部分工作人员认可数据安全的重要性,但是培训质量参差不齐,有些机构培训覆盖面不够,未涉及合同商、数据共享方、临时员工等,有些机构未将安全事故经验作为培训内容的重要参考。
再次,机构往往不清楚如何从目前存在的大量安全标准中选取合适的参考,许多机构很少去学习其他机构保护数据安全的做法,也很少请外部第三方机构做专业的安全测评。
针对上述问题,CQC和NDG提出的建议简要概括如下:第一,每个机构的领导应该明确数据安全的责任人和其职责,类似于组织医疗事务和财务的管理和问责制度,包括建立有效的内审机制,必要时进行外审以验证安全措施有效性,对恶意类数据安全事件进行严厉处罚等;第二,所有的工作人员应该获得足够的资源,包括正确的信息、工具、培训等,以便于他们履行数据安全处理和共享的职责;第三,IT系统和所有的安全协议都应该按照实际的病人治疗过程和一线工作人员的需求进行设计;第四,应该按照新的数据标准要求设计自评估系统,并选取优秀的案例供其他机构进行同步学习;第五,NHS应该修改通用财务合同模板,确保各机构能够落实数据安全标准,地方机构和供应商签署的合同也应有相应的条款,当供应商无法满足安全要求时不应与其续签合同。
虽然NHS以及care.data计划在数据安全管理方面受到诟病,但从以上审查结果中不难看出,英国作为健康和医疗大数据集中应用的先行者,已经在数据安全方面做了很多有价值的工作,比如配套的法律法规、标准规范,任命了专门的数据保护官员,建立了独立的监管和审计机构,建立了数据安全风险管理的信息系统等。
但是,由于健康和医疗数据的高度敏感性,对其进行集中存储和管理后,一方面会引起恶意人员的高度关注,另一方面一旦发生数据泄露其影响面非常广,对于每个病人来说其后果很难挽回;因此,健康医疗数据的安全工作可谓难上加难,即便英国具备一定的基础,其数据安全治理也未在一开始取得理想的效果,但从近期频繁的安全审查中可以看出,英国政府建立的数据安全监督机构、数据保护官等正在发挥积极作用,正视已出现的问题并提出注重实效的解决方案,以重新赢回公众的信任。
善治病者,必医其受病之处
――我国健康医疗数据安全形势严峻
早在2013年底,国家卫生和计划生育委员会就了《关于加快推进人口健康信息化建设的指导意见》,提出在“十三五”期间将大力推动全国人口健康信息大平台的建设。从安全需求上来说,这个信息平台一是将承载全国13亿公民的人口、健康、医疗等隐私信息,数据保密性要求高;二是将提供公民个人医疗保障、诊疗等信息化服务不能中断,业务连续性要求高;三是将为国家卫生计生行业未来发展提供决策依据,信息容错率要求高。然而目前,我国在健康医疗数据安全保障方面情况堪忧,行业整体安全态势趋于严峻。主要问题包括:
首先,行业合并导致底数不清。卫生、计生行业合并时间并不算太长,业务层面的整合已初步实现,但数据层面的整合尚属起步阶段,在实际执行过程中易滋生死角盲区。从网上已公开的医疗行业信息安全事件中不难发现,绝大多数安全事件的第一步突破点来自于安全管控体系的“法外之地”。
其次,行业信息安全人才与经费保障缺口较大。据不完全统计,医疗行业2015年整体信息化建设资金超过300亿,但信息安全投入不足6亿,占比不足2%,而对于有较高安全保障要求的行业,安全占比普遍超过10%;在人才队伍方面,专业信息安全从业人员严重缺失,许多机构甚至出现“身着白大褂的大夫在看病之余兼职管安全”的状况。
再次,缺乏具备行业特色的信息安全指导框架。健康医疗行业特殊性较高,目前行业虽然已推行国家信息安全等级保护要求,但尚未建设具备行业业务特点的信息安全保障体系,也没有专门的行业信息安全技术标准,不利于有针对性地开展安全防护工作。
第四,行业网络涉及面广,不易管控。我国医疗卫生机构总数已超百万,以药品方面为例,我国有6000多家化学制药企业,药品经营流通企业17000多家,而作为世界制药大国的美国,才分别为200多家和50多家。超大规模、超复杂接入对构建安全的卫生计生网络来说,难度巨大。
另外,不易树立行业信息安全标杆。全国医疗信息化及软件生产供应商达数百家。以行业龙头东软集团为例,其拥有的市场份额不足5%,离散化的分布导致安全的最佳实践无法快速复制推广,在现有保障能力下也很难做到“避轻就重”“抓大放小”。
【关键词】遗传算法 数据挖掘技术 医疗大数据 应用
医疗行业具有其本身的特殊性和复杂性,医疗大数据所包含数据信息更加驳杂,借助医疗大数据能够有效的转变传统的决策依据。同时,借助医疗大数据的数据挖掘技术,可以完成对患者的相关病情研究,并合理对患者进行用药。数据挖掘技术在医疗大数据中的应用价值十分明显。基于此,本文分析基于遗传算法的数据挖掘技术在医疗大数据中的应用,分别对基于遗传算法的数据挖掘技术和具体在医疗大数据中的应用进行阐述,具体内容如下。
1 遗传算法的数据挖掘技术分析
1.1 数据挖掘
医院对日常患者信息收集、药物信息录入和相关管理信息充斥着医院的数据库,导致数据数量日渐增加。而这些庞大的数据信息中,涵盖了作用明显的数据信息和作用不显著的数据信息。而为了从这些驳杂的医疗信息中,获取有效的病例信息、药物信息,需要选择有效技术类型。数据挖掘技术则是一种从海量数据、存在噪声和模糊的数据中进行目标信息的提取,并对相近的数据信息进行提取。借助数据挖掘可以为医院完成治疗预测和降低医疗成本、明确各类药物的基本情况,实现对药物副作用的发现、辅助公共卫生检测,积极推动医院医疗服务水平和服务质量的提升。
在实际的医疗大数据挖掘中,可以对分类算法、聚类算法、实践序列和的关联规则和回归预测等方法进行应用,从而完成对医疗大数据的有效挖掘,进而获取准确的数据信息,保障医院医疗服务的质量和相关决策的效率。
1.2 遗传算法
遗传算法是建立在的“自然选择”和“适者生存”的基础上,结合具体的适应度值情况,先在某一特定种群中选取一定数值的染色体,并通过对种群进行迭代,从而获得满足终止条件的最优解。遗传算法在迭代过程中,主要是通过选择、交叉和变异等操作方式,促使种群完成自然选择。且遗传算法的关键内容主要以染色体编码、种群初始化和适应度函数等。常见的遗传算法实例有人工鱼群算法、蚁群算法等。
借助遗传算法的数据挖掘技术能够有效完成对医疗大数据中的数据信息的攫取,并获得有效医疗数据信息为医疗服务奠定基础。
2 遗传算法的数据挖掘技术在医疗大数据中的应用
2.1 数据挖掘对象
从数据挖掘技术的基本能力上看,数据挖掘技术,可以完成对任意类型的数据信息存储的数据信息挖掘。根据医疗大数据的基本情况,基于遗传算法的数据挖掘对象是互联网的相关医疗数据信息和医院内部的患者病例、药物信息、费用信息和管理信息等内容。其具体的数据挖掘目标是根据使用者的基本需求,完成对目标信息的获取。
2.2 基于遗传算法的k-means算法改进
基于遗传算法的k-means算法改进有效的将遗传算法和k-means算法相结合,在具体的医疗大数据挖掘中的应用,具体的算法设计如下:
(1)编码方案和种群初始化;设聚类中心的坐标为d维,k个簇的每个染色体长度为k×d,染色体为{P1,P2,P3……Pk},其中Pi={Pj1,Pj2,Pj3……Pjd}。对于对应的每条染色体,随机从n个对象中的k个为的初始聚类中心坐标。
(2)适应度函数的选取,为了保障医疗大数据的数据挖掘技术的有效性,必须要对适应度函数进行合理选择,具体的适应度函数如下公式(1)所示:
(3)操作选择。为了完成对遗传算法的更好操作,需要对遗传算法的早熟问题进行控制,可以选择引入免疫机制。
按照上述方式,选择基于遗传算法的k-means算法,可以有效使k-means算法快速收敛,从而有效减少算法所应用的时间,并获得最优解,为医疗大数据的数据挖掘奠定基础。
2.3 应用实例
以基于遗传算法的k-means算法改进在血液系统疾病费用统计分析为例。在医院日常营业中,改进后的k-means算法可以根据患者的年龄、性别和患者等信息完成分组,且客观的显示血液疾病的分布情况,应用基于遗传算法的k-means算法改进,可以获取患者年龄和性别的基础信息,还可以的对不同年龄和性别分组下的临床生化指标特征进行解读,从而相关统计人员能得到目标数据。
将基于遗传算法改进的k-means算法应用到医疗费用数据的处理。主要是对数据进行分类,并得到初始聚类中心情况,再根据遗传算法,完成对聚类中心的迭代和更改,并得到最终的聚类结果。通过聚类结果可以将不同类型的血液系统疾病的总例数和具体的治疗费用进行展示,从而使得相关结算人员能够获得较为准确的费用信息。选择基于遗传算法的k-means算法,可以完成对医疗费用的预测,经过检验得知,具体预测准确性可以达到92.21%。
3 结束语
结合基于遗传算法的k-means算法优化,实现对医疗大数据的数据挖掘技术的应用。在血液系统疾病费用的统计分析中,借助化后的算法可以完成对不同血液疾病的病例数和治疗费用等信息的获取,以达到降低医院治疗成本的效果,再为提高医疗服务质量提供有效的数据信息,推动医院医疗质量水平的提升。借助遗传算法的数据挖掘技术在提高医疗数据挖掘效率的基础上,更为直接的提高了数据挖掘的质量,为医院决策提供数据信息,这是符合现代医院大数据应用的需求。
参考文献
[1]张宁,李祥,鹿珂珂.遗传算法在数据挖掘技术中的应用研究[J].仪表技术,2015(12).
因此在实施大数据分析项目之前,企业不仅应该知道使用何种技术,更应该知道在什么时候、什么地方使用。除了较早前就开始利用大数据的互联网公司,医疗行业可能是让大数据分析最先发扬光大的传统行业之一。医疗行业早就遇到了海量数据和非结构化数据的挑战,而近年来很多国家都在积极推进医疗信息化发展,这使得很多医疗机构有资金来做大数据分析。因此,医疗行业将和银行、电信、保险等行业一起首先迈入大数据时代。麦肯锡在其报告中指出,排除体制障碍,大数据分析可以帮助美国的医疗服务业一年创造3000亿美元的附加价值。本文列出了医疗服务业5大领域(临床业务、付款/定价、研发、新的商业模式、公众健康)的15项应用,这些场景下,大数据的分析和应用都将发挥巨大的作用,提高医疗效率和医疗效果。
临床操作
在临床操作方面,有5个主要场景的大数据应用。麦肯锡估计,如果这些应用被充分采用,光是美国,国家医疗健康开支一年就将减少165亿美元。
1.比较效果研究
通过全面分析病人特征数据和疗效数据,然后比较多种干预措施的有效性,可以找到针对特定病人的最佳治疗途径。
基于疗效的研究包括比较效果研究(Comparative Effectiveness Research,CER)。研究表明,对同一病人来说,医疗服务提供方不同,医疗护理方法和效果不同,成本上也存在着很大的差异。精准分析包括病人体征数据、费用数据和疗效数据在内的大型数据集,可以帮助医生确定临床上最有效和最具有成本效益的治疗方法。医疗护理系统实现CER,将有可能减少过度治疗(比如避免那些副作用比疗效明显的治疗方式),以及治疗不足。从长远来看,不管是过度治疗还是治疗不足都将给病人身体带来负面影响,以及产生更高的医疗费用。
世界各地的很多医疗机构(如英国的NICE,德国IQWIG,加拿大普通药品检查机构等)已经开始了CER项目并取得了初步成功。2009年,美国通过的复苏与再投资法案,就是向这个方向迈出的第一步。在这一法案下,设立的比较效果研究联邦协调委员会协调整个联邦政府的比较效果的研究,并对4亿美元投入资金进行分配。这一投入想要获得成功,还有大量潜在问题需要解决,比如,临床数据和保险数据的一致性问题,当前在缺少EHR(电子健康档案)标准和互操作性的前提下,大范围仓促部署EHR可能造成不同数据集难以整合。再如,病人隐私问题,想要在保护病人隐私的前提下,又要提供足够详细的数据以便保证分析结果的有效性不是一件容易的事情。还有一些体制问题,比如目前美国法律禁止医疗保险机构和医疗补助服务中心(Centers for Medicare and Medicaid Services)(医疗服务支付方)使用成本/效益比例来制定报销决策,因此即便他们通过大数据分析找到更好的方法也很难落实。
2.临床决策支持系统
临床决策支持系统可以提高工作效率和诊疗质量。目前的临床决策支持系统分析医生输入的条目,比较其与医学指引不同的地方,从而提醒医生防止潜在的错误,如药物不良反应。通过部署这些系统,医疗服务提供方可以降低医疗事故率和索赔数,尤其是那些临床错误引起的医疗事故。在美国Metropolitan儿科重症病房的研究中,两个月内,临床决策支持系统就削减了40%的药品不良反应事件数量。
大数据分析技术将使临床决策支持系统更智能,这得益于对非结构化数据的分析能力的日益加强。比如可以使用图像分析和识别技术,识别医疗影像(X光、CT、MRI)数据,或者挖掘医疗文献数据建立医疗专家数据库(就像IBM Watson做的),从而给医生提出诊疗建议。此外,临床决策支持系统还可以使医疗流程中大部分的工作流流向护理人员和助理医生,使医生从耗时过长的简单咨询工作中解脱出来,从而提高治疗效率。
3.医疗数据透明度
提高医疗过程数据的透明度,可以使医疗从业者、医疗机构的绩效更透明,间接促进医疗服务质量的提高。
根据医疗服务提供方设置的操作和绩效数据集,可以进行数据分析并创建可视化的流程图和仪表盘,促进信息透明。流程图的目标是识别和分析临床变异和医疗废物的来源,然后优化流程。仅仅成本、质量和绩效数据,即使没有与之相应的物质上的奖励,也往往可以促进绩效的提高,使医疗服务机构提供更好的服务,从而更有竞争力。
数据分析可以带来业务流程的精简,通过精益生产降低成本,找到符合需求的工作更高效的员工,从而提高护理质量并给病人带来更好的体验,也给医疗服务机构带来额外的业绩增长潜力。美国医疗保险和医疗补助服务中心正在测试仪表盘,将其作为建设主动、透明、开放、协作型政府的一部分。本着同样的精神,美国疾病控制和预防中心(Centers for Disease Control and Prevention)已经公开医疗数据,包括业务数据。
公开医疗质量和绩效数据还可以帮助病人做出更明智的健康护理决定,这也将帮助医疗服务提供方提高总体绩效,从而更具竞争力。
4.远程病人监控
从对慢性病人的远程监控系统收集数据,并将分析结果反馈给监控设备(查看病人是否正在遵从医嘱),从而确定今后的用药和治疗方案。
2010年,美国有1.5亿慢性病患者,如糖尿病、充血性心脏衰竭、高血压患者,他们的医疗费用占到了医疗卫生系统医疗成本的80%。远程病人监护系统对治疗慢性病患者是非常有用的。远程病人监护系统包括家用心脏监测设备、血糖仪,甚至还包括芯片药片,芯片药片被患者摄入后,实时传送数据到电子病历数据库。举个例子,远程监控可以提醒医生对充血性心脏衰竭病人采取及时治疗措施,防止紧急状况发生,因为充血性心脏衰竭的标志之一是由于保水产生的体重增加现象,这可以通过远程监控实现预防。更多的好处是,通过对远程监控系统产生的数据的分析,可以减少病人住院时间,减少急诊量,实现提高家庭护理比例和门诊医生预约量的目标。
5.对病人档案的先进分析
在病人档案方面应用高级分析可以确定哪些人是某类疾病的易感人群。举例说,应用高级分析可以帮助识别哪些病人有患糖尿病的高风险,使他们尽早接受预防性保健方案。这些方法也可以帮患者从已经存在的疾病管理方案中找到最好的治疗方案。
付款/定价
对医疗支付方来说,通过大数据分析可以更好地对医疗服务进行定价。以美国为例,这将有潜力创造每年500亿美元的价值,其中一半来源于国家医疗开支的降低。
1.自动化系统
自动化系统(例如机器学习技术)检测欺诈行为。业内人士评估,每年有2%~4%的医疗索赔是欺诈性的或不合理的,因此检测索赔欺诈具有巨大的经济意义。通过一个全面的一致的索赔数据库和相应的算法,可以检测索赔准确性,查出欺诈行为。这种欺诈检测可以是追溯性的,也可以是实时的。在实时检测中,自动化系统可以在支付发生前就识别出欺诈,避免重大的损失。
2.基于卫生经济学和疗效研究的定价计划
在药品定价方面,制药公司可以参与分担治疗风险,比如基于治疗效果制定定价策略。这对医疗支付方的好处显而易见,有利于控制医疗保健成本支出。对患者来说,好处更加直接。他们能够以合理的价格获得创新的药物,并且这些药物经过基于疗效的研究。而对医药产品公司来说,更好的定价策略也是好处多多。他们可以获得更高的市场准入可能性,也可以通过创新的定价方案,更有针对性疗效药品的推出,获得更高的收入。
在欧洲,现在有一些基于卫生经济学和疗效的药品定价试点项目。
一些医疗支付方正在利用数据分析衡量医疗服务提供方的服务,并依据服务水平进行定价。医疗服务支付方可以基于医疗效果进行支付,他们可以与医疗服务提供方进行谈判,看医疗服务提供方提供的服务是否达到特定的基准。
研发
医疗产品公司可以利用大数据提高研发效率。拿美国为例,这将创造每年超过1000亿美元的价值。
1.预测建模
医药公司在新药物的研发阶段,可以通过数据建模和分析,确定最有效率的投入产出比,从而配备最佳资源组合。模型基于药物临床试验阶段之前的数据集及早期临床阶段的数据集,尽可能及时地预测临床结果。评价因素包括产品的安全性、有效性、潜在的副作用和整体的试验结果。通过预测建模可以降低医药产品公司的研发成本,在通过数据建模和分析预测药物临床结果后,可以暂缓研究次优的药物,或者停止在次优药物上的昂贵的临床试验。
除了研发成本,医药公司还可以更快地得到回报。通过数据建模和分析,医药公司可以将药物更快推向市场,生产更有针对性的药物,有更高潜在市场回报和治疗成功率的药物。原来一般新药从研发到推向市场的时间大约为13年,使用预测模型可以帮助医药企业提早3~5年将新药推向市场。
2.提高临床试验设计的统计工具和算法
使用统计工具和算法,可以提高临床试验设计水平,并在临床试验阶段更容易地招募到患者。通过挖掘病人数据,评估招募患者是否符合试验条件,从而加快临床试验进程,提出更有效的临床试验设计建议,并能找出最合适的临床试验基地。比如那些拥有大量潜在符合条件的临床试验患者的试验基地可能是更理想的,或者在试验患者群体的规模和特征二者之间找到平衡。
3.临床实验数据的分析
分析临床试验数据和病人记录可以确定药品更多的适应症和发现副作用。在对临床试验数据和病人记录进行分析后,可以对药物进行重新定位,或者实现针对其他适应症的营销。实时或者近乎实时地收集不良反应报告可以促进药物警戒(药物警戒是上市药品的安全保障体系,对药物不良反应进行监测、评价和预防)。或者在一些情况下,临床实验暗示出了一些情况但没有足够的统计数据去证明,现在基于临床试验大数据的分析可以给出证据。
这些分析项目是非常重要的。可以看到最近几年药品撤市数量屡创新高,药品撤市可能给医药公司带来毁灭性的打击。2004年从市场上撤下的止痛药Vioxx,给默克公司造成70亿美元的损失,短短几天内就造成股东价值33%的损失。
4.个性化治疗
另一种在研发领域有前途的大数据创新,是通过对大型数据集(例如基因组数据)的分析发展个性化治疗。这一应用考察遗传变异、对特定疾病的易感性和对特殊药物的反应的关系,然后在药物研发和用药过程中考虑个人的遗传变异因素。
个性化医学可以改善医疗保健效果,比如在患者发生疾病症状前,就提供早期的检测和诊断。很多情况下,病人用同样的诊疗方案但是疗效却不一样,部分原因是遗传变异。针对不同的患者采取不同的诊疗方案,或者根据患者的实际情况调整药物剂量,可以减少副作用。
个性化医疗目前还处在初期阶段。麦肯锡估计,在某些案例中,通过减少处方药量可以减少30%~70%的医疗成本。比如,早期发现和治疗可以显著降低肺癌给卫生系统造成的负担,因为早期的手术费用是后期治疗费用的一半。
5.疾病模式的分析
通过分析疾病的模式和趋势,可以帮助医疗产品企业制定战略性的研发投资决策,帮助其优化研发重点,优化配备资源。
新的商业模式
大数据分析可以给医疗服务行业带来新的商业模式。
1.汇总患者的临床记录和医疗保险数据集
汇总患者的临床记录和医疗保险数据集,并进行高级分析,将提高医疗支付方、医疗服务提供方和医药企业的决策能力。比如,对医药企业来说,他们不仅可以生产出具有更佳疗效的药品,而且能保证药品适销对路。临床记录和医疗保险数据集的市场刚刚开始发展,扩张的速度将取决于医疗保健行业完成EMR和循证医学发展的速度。
2.网络平台和社区
另一个潜在的大数据启动的商业模型是网络平台和大数据,这些平台已经产生了大量有价值的数据。比如PatientsLikeMe.com网站,病人可以这个网站上分享治疗经验;Sermo.com网站,医生可以在这个网站上分享医疗见解;Participatorymedicine.org网站,这家非营利性组织运营的网站鼓励病人积极进行治疗。这些平台可以成为宝贵的数据来源。例如,Sermo.com向医药公司收费,允许他们访问会员信息和网上互动信息。