艾德生物取得算法突破,靠的是甘坐“冷板凳”的研发攻坚。(受访企业供图)
本报记者 李晓平
著名影星安吉丽娜·朱莉通过检测,发现携有BRCA1(乳腺癌1号基因)突变基因,为降低患癌风险,做了双乳切除手术。该领域相关检测背后的核心是算法,此前,该算法一直被外国企业所垄断。但目前,这一局面被一家厦企、国内肿瘤精准诊断龙头——艾德生物一举打破,且新算法更精准,覆盖面更广。
日前,艾德生物的研发团队,将该算法——GSS(Genomic Scar Score)基因组瘢痕算法(以下简称GSS算法)形成论文,在SCI(《科学引文索引》)发表,引发国际上的广泛关注。
为什么要突破这一算法?为产品“出海”!中国企业要在海外市场站稳脚跟,且越走越远,核心技术专利是关键。
在这背后,是艾德生物4年内进行的超6000次测试,对海量数据看不见的深度学习,和甘坐“冷板凳”的研发定力。
新算法更精准、覆盖面广
实现我国HRD检测领域突破
解读这一算法,得从基因和肿瘤的关系说起。
其实,每个人体内都有BRCA基因,其相当于基因组内的“修道工”,修补DNA在新陈代谢中产生的错误。如果该基因缺失或者突变,可能导致其无法及时修复错误,导致错误积累得越来越多,就产生了肿瘤。
2014年,有研究发现,可以通过三个基因组的不稳定,联合评估出BRCA的非正常“工作状态”,通过这一发现申请的全球专利算法,成为HRD(同源重组修复缺陷)评估的金标准算法。
而艾德生物是基于自主专利的算法及建库技术,开发自己的HRD产品,从检测性能到临床价值,都得到国内外同行专家的验证。“因为基于更广泛的底层架构,更海量的数据,艾德这一算法不仅覆盖人群更广,针对的癌种更多,包括卵巢癌、前列腺癌、胰腺癌、乳腺癌。”艾德生物董事长郑立谋告诉记者。
其实,早在2021年欧洲妇女肿瘤学会上,GSS算法的“1.0版本”一经披露,就“惊艳”了与会的大部分专家学者。
经过这两年的持续优化和精进,该算法被公认为目前该细分领域最精准、涉及面最广的算法,实现我国HRD检测算法从0到1的突破,有力推动了艾德生物通过该算法研制出的PARP(一种DNA修复酶)抑制剂伴随诊断产品的全面“出海”。
引入机器学习等技术
不间断尝试终获成功
那么,这一算法的突破点在哪?
原来,早期科学界发现,带有BRCA基因突变的患者,对PARP抑制剂有响应,但在实际用药过程中发现,除了BRCA突变以外,其他患者对PARP抑制剂也有响应。可是,这其间的关联,并没有完全研究出来。
“人体内像BRCA这样的‘修道工’还有很多,每一个‘修道工’的‘罢工’,都会引发肿瘤风险。”郑立谋说,由于我们没办法检测每个“修复通道”,因此我们换了一个角度,从结果导入。我们发现,这些对PARP抑制剂有响应的患者,有个共同特点,就是他们肿瘤细胞的基因组呈现出不稳定的特征。BRCA基因突变,只是导致基因组不稳定的众多原因之一。
郑立谋说,人体内有SNP位点超过3000万个,我们通过检测特定的位点,来评估基因组不稳定状态。因此,这个评估关键就是选择合适位点进行检测,并寻找基因组的不稳定特征。
于是,艾德生物从生物学的底层逻辑入手,引入机器学习、神经深度学习网络、人工智能算法等,深入海量的基因组测序数据。艾德生物高级生信总监杨爽向记者解读道,他们从大约3000万个人类SNP中,筛选出9万个代表性SNP位点(同时兼顾东西方人群),设计出第一代HRD检测试剂盒,并通过检测400例临床标本,对他们基因组不稳定性进行初步测算;然后通过计算机模拟,从上述9万个SNP位点中,二次筛选了2.4万个,开发出第二代更优化的检测试剂盒,以及基因组不稳定评估算法,并做了超过4000例样本,对该方法进行全方位验证。
“我们完全没有用国外企业的专利算法,通过另外的维度、更巨量的数据,不间断模拟和测试。”杨爽说,将得出的各种不稳定权重参数,进行反复验证后,才形成最终的GSS算法。
【名词解释】
SNP:单核苷酸多态性,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。通过检测全基因组上特定位点SNP可以替代全基因组测序,评估基因组不稳定状态。
【对话】
杨爽:
要正确认识创新的价值
记者:这个项目的团队有多少人,涉及哪些领域?
杨爽:团队共20多人,涉及生物信息、医学、生物技术、统计等多学科专业。
记者:和此前已有的专利算法相比,艾德生物的GSS算法优势在哪?
杨爽:具有两大优势,其一,在考虑多个人种间差异的同时,补充了中国人群杂合度较高的SNP位点,贴合我国临床实际使用需求;其二,识别出国外公司算法中特征重复、简单累加的不足,通过算法创新,将基因组分成更加精细的特征去评估基因组不稳定性,提高计算结果的准确性。
记者:通过这个算法的突破,您对创新有没有更深刻的认识和收获?
杨爽:作为一位长期扎根在生物信息领域的科研人员,这个项目给我最大的感触就是,应该正确认识创新的价值。其实,这个算法并不是难到只有艾德能做出来,但是国内扎根这一算法,并最终取得突破的只有艾德。有些企业可能更倾向于“短平快”项目,坐不住“冷板凳”,最终只有艾德脱颖而出。还有一个重要因素,就是海量的投入。为了突破这一算法,艾德不仅付出了看不见的时间成本,还有近亿元的资金投入。这些成本,都是单纯的产品价值体现不出来的,都体现在创新上。只有正确认识创新的价值,才能形成激励,进入良性循环。
●产品介绍
PARP抑制剂伴随诊断产品
PARP抑制剂伴随诊断产品化繁为简,将建库步骤从常规杂交捕获技术的17步精简为5步,实验时长从32小时缩短至6小时,显著减轻医技人员工作负荷,大大缩短患者等待时间。实现了NGS(高通量测序技术)检测的去中心化,让HRD检测实现医院终端的普及应用成为可能。