X 注册生物链会员

扫描二维码关注生物链
英特尔想做基因行业的数据管家:这块骨头不好啃
来源:太平洋电脑网   发布者:尹海华   日期:2017-07-07  

“我们已经可以在24小时内实现 精准医疗 的主要过程,包括数据采集、分析、找出病因、给出个性化的靶向药等等。但是,目前成本还是太高,不适合普通用户使用。”

面对记者的提问,英特尔公司医疗和生命科学集团亚太区总经理李亚东很坦白。

在精准医疗领域,“24小时精准医疗”更像是一个数据管家。但是对于英特尔来说,这个“管家”并不好做。如何控制产品成本?如何加快解读速度?谁才是产品的买单方?一个个问题摆在英特尔相关团队的面前。

英特尔公司全球副总裁兼中国区总裁杨旭

近日,在第三届英特尔生命科学信息技术论坛上,英特尔公司全球副总裁兼中国区总裁杨旭给出了关于“24小时精准医疗”进展的时间节点,即:“2020年把24小时内完成一个人全基因分析的费用降到500美元。”

杨旭表示,精准医疗是数据驱动的科学,是生命科学、医学技术和计算技术融合的前沿领域。作为一家数据公司,英特尔可以为精准医疗提供大数据、云计算、人工智能以及网络存储等方面的技术支持。

目前,在基因检测领域,计算依旧是瓶颈。据英特尔公司医疗与生命科学集团总经理Kay Eron介绍,目前,精准医疗领域存在四大数据方面的挑战,这也是英特尔要着力解决的问题。

数据规模。基因组涉及的数据量是TB级的,要实现这些数据在不同用户之间平滑、及时地传输和分享,对很多数据科学家来说都是挑战。

解析速度。通常情况下,全基因组分析需要花几周的时间,这个时间对很多临床医疗服务来说太长了,所以必须要加速临床或者门诊对基因组的分析速度。

信息分享的安全。基因信息关系到人最根本的隐私和个人的数据,所以一定要保证它的安全性。

数据的可扩展性。基因组数据爆炸式的增长速度已经超过了摩尔定律的速度。因此,产品的后台技术需要确保有足够的扩展性来支撑超过摩尔定律的爆炸增长速度。

目前,数据处理正是华大基因所遇到的瓶颈之一。“我们国家基因库现在每年要处理的数据由10PB(较高级的存储单位,等于250个字节),这么大的数据量处理起来非常困难,但是自己建一个巨大的计算机机房,时间、精力又都不够。” 华大基因副总裁王洪琦表示,这种困难一方面是存储困难,另一方面是解读的困难。正是基于这样的考虑,华大基因与英特尔成了合作伙伴。

过去几年,为了解决上述提到的四个问题,英特尔在中国 精准医疗 领域做了很多尝试。

“从2015年10月份发布1.0产品,到2016年底, BGI Online已经完成了170TB数据的处理,并将平台上的170余个应用程序进行开放。” 李亚东提到。在提高数据分析速度方面,2015年,英特尔与华大基因、阿里云成为合作伙伴,共同打造基因组数据分析云计算平台BGI Online。

2017年5月,英特尔宣布与博德研究所 (Broad Institute)、华大基因及阿里云达成协议,将通过BGI Online为用户免费提供最新版的基因组分析工具箱GATK4(Genome Analysis Toolkit 4)使用授权。据了解,过去完成3000份的全基因组数据分析至少需要6个星期,而通过GATK4,在两个星期内就可以同时完成1.5万个全基因组的数据分析。

产品再好,不合水土也是不行的。为了能够使产品更加本土化。2017年6月,英特尔精准 医疗 伙伴计划的下属联盟“基因组一体机联合实验室”宣布成立。浪潮、UEC、华大基因、聚道科技、阿里云、Falcon和安诺优达等上下游公司将与英特尔合作,为医院和研究机构开发基因组学设备,以便处理本地数据分析需求。

李亚东表示,“与国外不同的是,中国的基因数据大多存储在本地,我们的产品必须要适应中国特色。”

对于英特尔来讲,产品的本土化不仅体现在数据分析方面,更体现在数据的交换方面。

“数据量越来越大,数据拥有者不太愿意或者不太方便进行数据完全共享。”李亚东表示。在这种情况下,怎么样才能不移动数据,却可以实现最大程度上地分析数据?这是英特尔在数据交换方面要着力解决的问题。

目前,英特尔在这方面的尝试就是与上海市儿童医院共同启动儿童健康协作云中心。据了解,儿童健康协作云中心是一个开放式平台,是双方针对儿童遗传基因组研究和数据交换应用于临床的范例。目前,这个数据交换框架已在上海市儿童医院、联盟医院和上海交大生物医学转化中心上线。上海市儿童医院和联盟医院利用该框架,在不同站点之间对儿童发育迟缓案例进行基因变异识别和比较。

具体来说,在这个数据交换框架内,各医院的数据仍然保留在本地,但可以根据自身要求通过查询的方式,异地发起查询。

上海市儿童医院院长于广军表示,“这个方式大家可以接受,既建立了相应的数据库,又可以通过分布式共享查询解决临床问题,推动了不同儿童医疗机构间在基因组分析方面开展协作。”

速度和成本是实现“24小时 精准医疗 ”目标的两座大山。

从基因数据的解读流程上来看,大多数 基因测序 的解读都需要一个月左右。由于技术和管理双重因素的影响,基因数据的解读速度还很慢。

管理方面的因素对速度产生了很大的影响。于广军提到,“解读的前提是已经有测序的结果,但是目前大多数测序时间比较长,都要积累到一定数量才能启动测序机器。”

所以,目前很多医院自己是不做测序的,往往是将这份工作交由华大基因来做。其流程是:医院抽好血,将标本送到华大基因的实验室,华大基因将测序分析结果返回医院后与临床医生进行沟通。这个过程中,样本的运输时间是比较长的。另外,和医生反复沟通也需要很长时间。于广军表示,上海市儿童医院目前正在尝试建立基因知识库,帮助医生更好地理解测序分析结果,从而节省时间。

如果要在2020年实现“24小时精准 医疗 ”,成本是另一个很重要的指标。李亚东告诉健康点记者,如果不计成本,英特尔现在已经实现了24小时内完成基因数据的采集、分析、解读等。但成本太高,却并不适合产品的大规模推广。

“我们希望最终实现基因信息解读的普惠,但我们在成本上还有很大压力。”李亚东举例,“24小时精准医疗”产品目前的使用成本超过1000美元,对普通民众来说还是比较贵的。“怎么样将成本进一步降至200美元到500美元,需要看最终医保怎么覆盖这部分费用。”

怎样才能更好地提速与控制成本?在于广军看来,“专业化+有效集成”是最好的办法。但基因检测的复杂度在于,还没有完全实现流水线化、标准化,尤其是数据分析方面。于广军表示,“如果完全标准化就简单了。”

对于英特尔来讲,支付环节的缺位是阻碍其应用发展的主要障碍。

实际上,对于任何新技术的应用和行业发展来说,没有支付支持,都举步维艰。对于精准医疗而言,其发展需要更多地着眼于长远利益,以支付为杠杆推动精准医疗临床应用发展,这是实现精准医疗社会和经济效益的必经之路。

在美国,很多商业保险公司以治疗效果为前提,为基因诊断治疗支付相关费用。例如,Medicare会支付参保者的基因检测,覆盖癌症、艾滋病和心脏疾病等多个病种。

在中国, 精准医疗 的保险支付也已经有了尝试。“在深圳做NIPT(无创产前基因检测),绝大部分已经可以医保支付了。”于广军提到。但目前,精准 医疗 领域的医疗支付还只是地方行为。近日,上海、江苏等地也已经尝试精准医疗基因检测。

如于广军所言,精准医疗支付环节的建立需要一个过程。在精准医疗发展初期,确保临应用有效性是核心任务。因此,刺激临床数据积累、激励有效的诊疗方式,将是保险支付计划的核心侧重点。后续,随着 基因测序 价格下降,以及精准医疗模式的成熟,保证大众在新诊疗技术和模式应用上的公平性就成为保险计划设计的关键。

对于正在推动“24小时精准医疗”的英特尔来说,控制好产品成本,加快产品解读数据的速度,验证其临床医用的有效性是当务之急。只有解决了这些问题,才能真正成为精准医疗领域的数据管家。


相关新闻