您的位置:健客网 > 疗养频道 > 疗养资讯 > 疗养动态 > 人和未来:成立仅3年的生物技术公司,是如何刷新了IT纪录的?

人和未来:成立仅3年的生物技术公司,是如何刷新了IT纪录的?

2017-07-15 来源:动脉网  标签: 掌上医生 喝茶减肥 一天瘦一斤 安全减肥 cps联盟 美容护肤
摘要:测序环节产生的基因数据——每个人动辄百G以上——是等待挖掘的金矿。因此,数据的存储、传输、分析和解读是必须的过程,这就对大比例的压缩算法、高效的传输策略、超快速的计算平台和专业的解读服务提出了很高的要求。

  另外,不同于传统的传输方案,GTZ采用边传输边压缩的专利技术,实现了满带宽稳定高效传输。

  通过将数据传输、压缩、分发集于一体,GTZ能实现将大规模基因组数据传输时间缩减90%,传输能力是Aspera的10倍;同时还能减少90%的磁盘存储空间,与主流的gzip的35%相比提升3倍。

  高性能计算解决方案

  1.GT-WGS

  GT-WGS是基于亚马逊AWS的基因信息云计算平台。基于公有云的分布式计算,平台采用数百台高性能计算机协同运算,能够将30X的人类全基因组数据分析时间缩短到10分钟以内(缩短了23个小时)。

  在快速分析的同时,GT-WGS仍兼具结果准确性,与标准的GATK流程对比,其分析结果一致性大于99%。

  一般情况下,从基因数据产生需要经历样本提取、建库、质控、测序、分析、解读这6个环节。在普通方案,这个流程最快也要用时50h。

  而GT-WGS方案则能将建库时间和分析时间分别缩短1h和23h,将个人基因组检测服务(从采样到结果报告)的时间缩短至一天。

  GT-WGS的机时费用约为16美元,与单台标准服务器相比,数据分析速度提高了90倍,可节约75%的云计算机时费用。

  2.GTXOne

  尽管云计算有着弹性灵活等诸多优势,鉴于国内仍有大量基因数据存储于线下,适合本地计算的硬件加速系统必然是未来基因数据分析的一个战略要地。

  人和未来于去年推出了基于CPU+FPGA异构硬件加速的数据分析一体机GTX-One。PCI-E3.0FPGA,可以使一台普通PC机具有了百台服务器的基因数据分析能力。

  通过为基因数据分析定制优化计算流水线,单台GTXOne能够在15分钟内完成30X全基因组的比对和突变分析,刷新基因数据分析的最低能耗纪录。今年公司对GTX-One的接口进行升级。

  简单来说,GTXOne单台设备实现了150台标准服务器的分析能力,最大化地降低了计算集群的采购和运维的成本,并加快了基因组分析速度。

  基于文本挖掘的数据解读方案

  CNV是基于NCBItextmining的文本挖掘数据库,能够将人类性状与基因型相关的关联与挖掘。这类似于此前动脉网曾报道的DNAdigest和Genomenon所提供的服务。

  通常情况下,大约只有6.6%的文献会在标题和摘要上体现出疾病与基因突变的关联。也就是说,在没有工具的情况下,研究人员需要通读全文才能找到所需要的信息。这个过程占据了研究人员大量时间。

  利用文本挖掘对文献相关知识进行提取和重构,CNV能够实现文献挖掘的自动化处理流程,将研究人员从枯燥而冗长的文献检索过程中解放出来。

  目前,CNV覆盖了NCBI所有的文献摘要,并对这些文献进行每月更新。

  BT与IT的融合

  看到这里,你也许会有疑问:这不是一家IT公司?

  我想不完全是。从北京南下湖南后,人和未来用两年的时间建立起了医学检验所、工程中心、基因库、研究院、示范中心。同时,公司也通过与医院与体检机构合作,建立面向B端的检测市场。目前,公司检测产品线覆盖了健康管理和临床诊断。

  总的来看,人和未来既是一家生物公司,也是一家IT公司。

  相比单纯的生物技术公司,人和未来的IT实力会是公司的竞争优势。但正如IT巨头选择与生物公司结盟跨界一样,要开发出服务生物技术的优势产品,必然离不开生物技术的支撑。IT与BT的学科交融,才是这家公司真正的实力。

  未来,学科交叉融合将是趋势

  对BT领域而言,IT好比一种工具;而对IT领域而言,BT则是一个庞大而复杂的数据源,IT领域需要针对不同的问题开发出专业分析工具。

  这个过程从2000年人类第一个全基因组测序数据产生后开始,IT领域便一直在针对生物领域的不同需求来开发相应的分析工具。

  但随着测序成本下降随之带来了数据量的暴增,眼下的数据规模已经逐渐超出了分析工具能够处理的极限。IT领域面临的问题不再是“怎么算”,而是要“怎么算得更快,如何存储”。

  这是BT领域对IT的新需求,也是IT领域要面临的新的挑战和机遇。在此背景下,SevenBridge、DNAnexus、CLCBio等交叉学科背景的生物信息企业应运而生。

  IBM、Intel、Microsoft、Google等科技巨头也都看到了这里未来的前景,纷纷抢滩市场。

  Microsoft在2016年与SpiralGenetics合作推出了分析工具BioGraph?Suite,Intel则抱团BGI、BroadInstitute发力高性能计算与存储优化。

  这些巨头希望借由自己在IT领域的优势跨界到生物市场。但无可厚非,BT实力是他们的短板。因此,这些巨头通常会选择与BT领域企业合作联盟来扬长避短。

  IT巨头携BT公司入场,一方面说明生物数据分析将是未来大趋势,IBM、Intel这样的全球巨头也想进来分一杯羹;另一方面这说明要在这一领域站稳脚跟,仅凭IT实力是不够的,人和未来这样将IT与BT交叉融合的企业或将在未来竞争中占领优势。

1 2
看本篇文章的人在健客购买了以下产品 更多>
有健康问题?医生在线免费帮您解答!去提问>>
健客微信
健客药房