在(zài)科技领域,跨界、融合带来的新生事物具备的颠覆性竞争,而只是技(jì)术(shù)和经济层面的竞争。
而在病(bìng)毒领域,跨界(jiè)、融(róng)合产生的新(xīn)病毒往(wǎng)往意味(wèi)着(zhe)灾(zāi)难。一个天上飞的鸟落下的粪便(biàn)不小心与(yǔ)地上某个(gè)禽类的食物结合被(bèi)这个禽(qín)类(lèi)所食,那(nà)么其上可能带来的病毒与禽类体内病(bìng)毒(dú)进行杂(zá)交进(jìn)化一个(gè)新的病毒。而这个病毒(dú)获得(dé)跨界传播的能力,将对整个人类造成大的(de)灾难。最(zuì)快速的了解新的病(bìng)毒(dú)带(dài)来的病例成因早日实现对(duì)症下(xià)药,成为打赢(yíng)“抗疫”的关键。今天AI等新技术在积极发挥着(zhe)作用。
目前新型冠状(zhuàng)病毒疫情进(jìn)入了攻坚战阶段。除了一线医务人员前赴后继的战斗(dòu)之外,对(duì)于(yú)新冠病(bìng)毒的疫苗研发(fā)和药物筛中也在争分夺秒的进(jìn)行中。此(cǐ)次“抗疫”战争中,AI等科技技(jì)术在(zài)默默贡献中。关(guān)注抗击疫情(qíng)中的科(kē)技公司的(de)动向,就会发现包(bāo)括阿(ā)里(lǐ)云、华为云(yún)、中科曙光、腾(téng)讯云、上海超算中心等积极主动并免费提(tí)供超算能(néng)力,AI算(suàn)法来助力开展抗(kàng)新冠病毒的疫(yì)苗研发和药物筛选中。
要最快(kuài)解决此次新(xīn)型冠(guàn)状病毒疫情,目前来看除了全国动(dòng)员在家“闷”死病毒(dú)之外(wài),对于从早期(qī)对(duì)病毒基因组的数据分析及AI建模(mó)到如何对疑(yí)似患者的快(kuài)速、精准临床诊断,以及抗新冠病(bìng)毒的疫(yì)苗研发和药(yào)物筛(shāi)选中也需要和时间赛跑。在其中AI正在发挥其作用。
AI技术能够加(jiā)速“疫情”中(zhōng)数据(jù)分析
AI作为一种(zhǒng)工具,有三要素在支(zhī)撑,算力、算法和数据。基(jī)于三个(gè)特点(diǎn),目前AI等科技公(gōng)司(sī)都(dōu)是提供具备高性能、高可靠性、高性价比的(de)计(jì)算、存储、分析和AI能力支持的,能够让(ràng)科(kē)研过程(chéng)固(gù)化可执行,提高效(xiào)率的工具。
而让AI在疾病(bìng)基因的分析和诊断中发挥。首(shǒu)先要依靠医学界的(de)专(zhuān)家发现(xiàn)病毒。就像上海华(huá)山医院张文宏就谈(tán)到医疗(liáo)专家要“要非常准(zhǔn)确的知道现在搜索的病毒是什么,才能相应的(de)病毒做(zuò)相应(yīng)的抗病毒治(zhì)疗。”
我(wǒ)们应让人工智能与病理(lǐ)学家形成互补,提高(gāo)人工诊断(duàn)的效率与可靠度。依靠科(kē)技手段 “面对未知的病毒的(de)时(shí)候,通过把其基(jī)因序列全部打(dǎ)碎(suì),通过深度测序的平台,把所(suǒ)有的序列(liè)全(quán)部(bù)恢复,然后通(tōng)大数(shù)据开始拼接,通(tōng)过组装(zhuāng)序列,经(jīng)过大(dà)数据分析,分(fèn)析出(chū)其演化关系,通过数据(jù)库记录分(fèn)析(xī)获得遗传标志,来最终(zhōng)告诉你这是(shì)什么病毒(dú)。” 张文宏(hóng)站在医生的(de)角度言简意赅的阐述了(le)AI的作用。
portant;" />
比如针对此(cǐ)次新冠病毒,AI等新技术的应用一个核心的(de)作用就是(shì)让医学专家们不用把大量的时间放(fàng)在海量的数据(jù)分析(xī)上,而是能够将自己的时间、精力以及医学经验投入到应对传染病风险之上。把(bǎ)数据分析(xī)、重复的信(xìn)息的收集(jí)等任务,交给(gěi)AI来(lái)处理(lǐ)。
目前集成了AI功(gōng)能的基因组测序平(píng)台能够提供从基因组数据管(guǎn)理、生(shēng)物信息分析流程、科研分析管理到知识(shí)图(tú)谱整个流程的服务,快速实现基因组(zǔ)数据分析及AI建(jiàn)模,让基因组分析更(gèng)便捷。
比如(rú)将深度学习算(suàn)法及药物分析服务融入药物研发过程,令药企能更快速高效地完成药(yào)物研发,节约研发成本,让研(yán)发更快速。
具备医疗影像(xiàng)标注、影像分(fèn)析服(fú)务及AI模型预测服(fú)务,全(quán)方位满足医(yī)疗影像研发需求,让影像分析更方便。很大程度上帮助了医(yī)生提高阅片效率、减少漏诊误(wù)诊的(de)情况。一(yī)个医生可能(néng)一天(tiān)看一(yī)百个病(bìng)人,一个(gè)月(yuè)看了两千个病人,一年可能(néng)看几万个病人(rén),他(tā)通过这样的(de)方式去累计(jì)经验。一个(gè)15年经验的医生,和一个刚出来做3个月的医生(shēng),他们两个的经验不同(tóng),在对一些影像图片上面的判断就不是(shì)一样的级别(bié)。
portant;" />
深度学习会提取(qǔ)图像特征。然后影像(xiàng)专家先把上面做一个标注,等到标注有更大的(de)样本的时(shí)候,就可以(yǐ)做到辅助医学诊断(duàn)。比(bǐ)如通过(guò)AI对疑(yí)似患者肺部CT影像进行病灶的(de)自动检出(chū)、定(dìng)位、弥漫性程度的多维(wéi)分析(xī)并生成自(zì)动报告(gào),帮助(zhù)医护人员快速(sù)筛查疑似新冠病例并进行(háng)隔离与(yǔ)进一步确诊(zhěn),从而减少交叉感染的风(fēng)险,同时(shí)产品的随访功(gōng)能还可帮助医生对患者的(de)治疗效(xiào)果进行精(jīng)准量化评估,用AI为(wéi)一线医务工(gōng)作(zuò)者提供有迹可循(xún)、有据可(kě)依的智能(néng)辅助。
联合科研成(chéng)为AI技术应用在疾病领域的(de)主要形(xíng)式(shì)
在整个“抗(kàng)疫”过程中,包括分离毒株(zhū)、药物筛选、意思病例(lì)检测、新药(yào)研发等需要基于AI技术进行大量的数据分析。目前科技公司在(zài)病(bìng)毒(dú)基因组计算分析、抗(kàng)病毒药(yào)物研(yán)发(fā)和抗疫医(yī)疗影像分(fèn)析领(lǐng)域,将提供海量AI算力和算法的强有力支持(chí)。这就需要具(jù)有强大的(de)CPU及GPU算力调度能力,能(néng)够为基(jī)因测序(xù)、医疗(liáo)工(gōng)程提供稳(wěn)定高效的算力支持的平台。
最近关(guān)于“抗(kàng)疫”的战役中,我们(men)看(kàn)到科技公(gōng)司联合医疗机构(gòu)、科(kē)研机构(gòu)成为最高效的一种模式(shì)。比如华中科技(jì)大学同济医学院基础医(yī)学院、华中科技大学同济医学院附(fù)属武汉儿童医院、西安交通大学第一附属医院、中科院北京基因组研究所、华为云联(lián)合科研团队宣布,筛选出五种可能对2019新型(xíng)冠状病毒(2019-nCoV)有效的抗病毒药物。
其中华为云(yún)EI医疗智(zhì)能体平台(EIHealth)集成了(le)医药领域众(zhòng)多算法(fǎ)、工具(jù)、AI模型和自动(dòng)化流水线提供(gòng)大规模计(jì)算机辅助。
portant;" />
在(zài)几位教授的(de)指导下,针(zhēn)对(duì)数十个(gè)靶向蛋白和(hé)上亿小(xiǎo)分(fèn)子化合(hé)物,通过医疗智能体平台(tái)完成了(le)蛋白质同(tóng)源模(mó)建,分(fèn)子动力(lì)学模拟计算,和大(dà)规模虚拟药物筛(shāi)选,短时间内完成了上(shàng)千万(wàn)次的模拟计算,让以往耗时(shí)数月的计算机辅助药物筛选(xuǎn)在数(shù)小时内(nèi)完成。
比如在新冠(guàn)肺炎疫(yì)情上,疑似患者(zhě)的快速、精准临床诊断仍是(shì)挑战。2月1日,由浙江省疾控(kòng)中心、阿里达摩(mó)院和杰毅生物联合研发上(shàng)线的自动化全基因(yīn)组(zǔ)检测分析平(píng)台(tái),让原来数(shù)小(xiǎo)时的疑似(sì)病(bìng)例基因分析缩短(duǎn)至半小(xiǎo)时。重点(diǎn)在(zài)“全基因组(zǔ)”这(zhè)几个字(zì),全(quán)基因组以为着海量(liàng)的基因数据,需要对(duì)平(píng)台的算力、AI算(suàn)法(fǎ)、数据处理和分更高的要求。阿(ā)里(lǐ)达摩(mó)院(yuàn)创新的采用分布式(shì)设计的分析算法,并基于蛋白质数据库(PDB)等(děng)公共数据集的数据进行算法(fǎ)的优化训练。这样的AI突破,对于有效提(tí)升(shēng)疑似病例确诊效率,及(jí)时阻断病毒的传播,必然会有极(jí)大助(zhù)益(yì)。
我(wǒ)们也看到(dào)为助力研究机构(gòu)加速新药筛查和疫(yì)苗研发,腾讯云组建了应急工作小组(zǔ),免(miǎn)费开放(fàng)云超算等能力。目前(qián),已向中山大学药学院(yuàn)罗海彬教授团(tuán)队提供了(le)批量GPU云(yún)服务器免费使(shǐ)用权,帮助(zhù)该团队(duì)推进病毒药物的筛选工作(zuò);向北京生命科学研究所/清(qīng)华大学(xué)生物(wù)医学交(jiāo)叉(chā)研究院的黄(huáng)牛教(jiāo)授实验室提供了大量标准的CPU算力以(yǐ)及对象储存能(néng)力,帮助他们进行基于结构的(de)药物分子(zǐ)设计的(de)离(lí)线计算任务(wù)。
与此同时(shí),基于新型冠(guàn)状病毒靶(bǎ)标(biāo)结(jié)构的化合物虚拟筛(shāi)选工作正在(zài)北京生命(mìng)科学研(yán)究所/清华(huá)大(dà)学生物医学交叉研究院黄(huáng)牛教(jiāo)授实验室推进。从(cóng)原理上(shàng)讲,药物通过与体(tǐ)内(nèi)的生物(wù)靶标相互作用而发挥药(yào)效,若能够根据药物靶标结构来计(jì)算筛选和(hé)设计小分子配(pèi)体,将可大大降低创新药前期研(yán)发的成本与周期。针对新型冠状(zhuàng)病毒的(de)多个靶点,黄牛教(jiāo)授实验室通过腾讯云秒级交付的海量高性能计算、存储资(zī)源,快速计算(suàn)筛选数亿级别(bié)的化合物(wù)数据库(kù),结合实验验证,来寻找新型结构类(lèi)型的先导化合物,为下一步新(xīn)药研发工作提供依据。
总结,AI对于基(jī)因组的(de)分(fèn)析和(hé)诊断(duàn),有几个关(guān)键点(diǎn)。首先数据库(kù)的检索(suǒ)功能,在获取到(dào)病毒基(jī)因(yīn)信息(xī)后(hòu),通常(cháng)需要与已知数据库(kù)的基因组(zǔ)匹(pǐ)配(pèi)来找出可(kě)能存在(zài)的突变。而突变与疾病的对应关系(xì)的判(pàn)断(duàn)大(dà)部分依靠海量的数据(jù)库(kù)资源,因此(cǐ)如果人工来(lái)完成这些工作是不现(xiàn)实(shí)的,这(zhè)个时候便体现出了人(rén)工智能的价值。
其次算法的(de)优化,我们看到包括华为云、阿里达摩院都是采用了最新的AI算法和分布式数据(jù)库,来优化(huà)人工智能的技术路径,能够(gòu)更有效的对大量(liàng)非(fēi)结构化数据进行学习(xí)和整合,挖掘并计算其中的关联。缩短人工智能可以(yǐ)持续不断的挖掘并更新突变位点和疾病的潜在(zài)联系。
再次海量的数(shù)据(jù)喂养,与在Google AI实(shí)践中曾有(yǒu)关于诊断乳(rǔ)腺癌的人(rén)工智能(néng)的报道。它(tā)只需几秒钟(zhōng),就能取得比(bǐ)人类医生花上几(jǐ)十(shí)个小(xiǎo)时还(hái)要准确(què)的诊断。在(zài)基于医学图像的诊断上,结合人工智能的效率可以说是大大增加了癌(ái)病的诊断(duàn)。这需要基于(yú)大量患者的成百上(shàng)千(qiān)张医疗影像,基于深度学习算法的(de)训练。经历(lì)了大(dà)量迭代(dài)训练后(hòu),实现算法的精准度(dù)越来越高,实现在疾病分析丰富临床经验的专家的诊(zhěn)断结果与AI工具的诊(zhěn)断结(jié)果(guǒ)是否(fǒu)一致来判断AI分析的价值。
除此之外,业(yè)内专家(jiā)对至(zhì)顶(dǐng)网表示目前基于“深度(dù)学习”的AI技术要发挥作用(yòng),一个好的云数(shù)据(jù)库其(qí)实(shí)是(shì)非常关键的一(yī)个点,因为如(rú)果医院(yuàn)里面每个科室的数字(zì)是(shì)零(líng)散的,那么很难做这个(gè)工作。基于云数据(jù)库,不管(guǎn)是(shì)从公有(yǒu)云还是从私有云(yún),帮助(zhù)医院把这些(xiē)数据规范起来。从数(shù)据的采集,到(dào)它的存储(chǔ),到预处(chù)理,形成一(yī)套规范的AI服(fú)务。这样(yàng)的话,数据即使在(zài)有些单位是分(fèn)散的,需要的时候还(hái)是可以复(fù)合起来使用(yòng)。
同(tóng)时在深度学习(xí)的技术上面(miàn),对这(zhè)些数据(jù)做训(xùn)练的时候,不(bú)仅仅是把数据丢到(dào)深度学习里面去训练就好了,而且我们还要对这(zhè)些数据做一些特征提取。我们把数据的(de)维度降(jiàng)低了(le)以后,再去训练就可以得(dé)到一个相对(duì)比较好的效果。当然,这个数(shù)据积(jī)累(lèi)以后,越来越(yuè)多的数据积(jī)累以后,准确率会越来越高。
最(zuì)后,医疗(liáo)过(guò)程是(shì)一个复杂(zá),周(zhōu)期长的过程(chéng),AI辅助只是其中一个环节,我们希望(wàng)能够(gòu)通过(guò)AI等科技技术帮助(zhù)到医药领域的专家(jiā),加速疾病基因检测和相关药(yào)物研发过程。