关于我们
投资案例
新闻中心
活动入口
社会责任
联系我们
松禾成长关爱基金会

ABRF:测序平台大比拼 华大智造性能跻身国际前列

发表于:2020-08-19 来源:

01

ABRF NGS II 期研究;规模宏大,权威性高

获取基因序列信息对于基础科研和临床诊断都至关重要。自1977年第一代测序技术问世以来,经过四十余年的探索,DNA测序技术取得了重大进展。随着对测序成本降低的需求,以高通量为特点的第二代测序技术(NGS)应运而生并逐步成熟,以单分子测序为特点的第三代测序技术也已经诞生。DNA大规模平行测序已然成为基因组学研究和临床诊断的重要工具。


目前,能够完成DNA大规模平行测序的平台,除了基于边合成边测序原理的Illumina平台和基于半导体测序法的Thermo Fisher平台外,作为新兴测序平台代表的华大智造DNBSEQ平台异军突起,长读长平台Oxford Nanopore也呈飞跃式发展。


各家测序仪的“霸主之争”由来已久,在人类和细菌基因组DNA层面的测序性能到底如何,不同的检测需求又该如何进行平台选择?到底应该如何看待各个平台的错误类型?


ABRF NGS II期研究分析了在文库制备和生物信息可控下, 各大测序平台的数据,将平台的性能和测序错误类型一一揭示,为中外各大基因测序设备公司的产品提供真实全面的参考依据。


ABRF于1989年正式组建,成员包括来自41个国家/地区、340个不同核心实验室的1000多位科学家,成员来自工业界、政府、学术界以及研究机构。ABRF致力于通过研究、交流和教育推进生物技术实验室的核心竞争力和研究。


在ABRF NGS II期研究中,研究者在多个实验室内,基于16款测序平台,对一个人类基因组家族、三个单独的菌株和十种细菌的宏基因组混合物测序,并将各平台数据进行多角度比较。

这些平台包括6款Illumina平台、3款ThermoFisherIon Torrent平台, 2款DNBSEQ平台(BGISEQ-500和MGISEQ-2000)以及Oxford Nanopore平台和Genapsys平台等。数据分析包括各平台的reads mapping能力(将测序的得到的DNA定位在基因组上的能力),不同平台的测序覆盖度、复杂区域的测序错误率、不同突变类型的检出影响因素等。

02

DNA水平测序,华大平台优势显现

基因覆盖度分析

以25X均一化测序深度后,长读长和短读长平台的基因组覆盖度均较好。


按照UCSC(加利福尼亚大学圣克鲁兹分校)的 RepeatMask(基因组重复序列检测)分类,DNA重复序列分为Alu、L1、L2、LTR、微卫星、简单重复和端粒区域。测序数据显示,对于DNA重复序列的检测,平台各有所长:华大智造的BGISEQ-500、Illumina的HiSeq4000、NovaSeq 2x150bp在捕获Alu区域时具有优势,Illumina的HiSeq 2500、HiSeq X10和NovaSeq 2x150bp在捕获L1、L2和低复杂度区域表现最佳,PacBio的PacBio CCS和NovaSeq在微卫星区域和简单重复区域的测序中表现最好,Oxford Nanopore的PromethION平台的特长则在端粒区域的捕获。


测序错误率

分析结果显示,测序错误率与基因组GC(在序列中鸟嘌呤(G)和胞嘧啶(C)所占的比率)含量具有直接相关性。在GC含量比较高的区域(75%-100%),各平台的错误率均比较高。就错误类型而言,华大智造的DNBSEQ平台和Illumina平台更倾向于核苷酸替代,这两个平台灵敏度相当,但华大智造的精度略好;Genapsys平台和长读长平台最主要错误来源是插入/缺失。

SNV(单核苷酸变异)和INDEL(插入/缺失突变)突变检测

SNV和INDEL是生物DNA常见的突变类型。


在SNV的检出中,华大智造的DNBSEQ平台最为灵敏,其次是NovaSeq 2x250bp、NovaSeq 2x150bp、HiSeq 2500、HiSeq X10和HiSeq4000平台。对INDEL的检出中,所有平台灵敏度均达到99.5%,华大智造的DNBSEQ平台和NovaSeq的检出相似,优于其他平台。PacBio、Nanopore平台对于SNV和INDEL的捕获能力均较弱。

SV(结构变异)检测

数据表明, SV(结构变异)的检出与多因素相关,如SV类型、测序平台、实验室间的操作等。


在各平台数据中,HiSeqX10检测到SVs数量最多,其次是HiSeq4000和HiSeq2500。检出假阳性最多的平台依次是HiSeq2500,HiSeqX10和HiSeq4000。

细菌基因组的捕获

此研究对于GC不平衡的原核细菌基因组进行了测序分析,包括三种单一菌种和十种细菌的混合物,各样本分别于MiSeq、Ion PGM和 IonS5平台测序。


细菌基因组捕获的影响因素主要为菌种差异和测序平台差异。在各个平台中,ThermoFisher的Ion PM和S5平台在错误率角度略胜一筹。对于复杂的宏基因组样本,所有平台都能够识别混合物中的所有菌株,但对基因突变的捕获水平差异较大。

03

华大智造:自主可控,走向世界

ABRF NGS II期研究是迄今为止最全面的DNA测序分析研究之一,此研究跨越不同基因组大小和核苷酸组成,多角度分析揭示了测序平台之间的特征差异,以及同一平台的可变性和可重复性。


综合各项数据,样本的GC含量是影响测序错误率的主要因素。对单一样本的DNA测序而言,成熟的平台如Illumina的表现依旧名列前茅,但就特定区域如Alu的捕获能力,对SNV、INDEL的检出和错误模式的评估,来自华大智造的DNBSEQ平台,受益于其独特的测序文库方法学,已经独具优势。


早在 2013 年,华大就已经在深圳成立了研发团队,和美国 CG 团队并行开展测序仪器研发。经过 6 年时间,华大智造陆续推出了 BGISEQ-500、BGISEQ-50、MGISEQ-2000、MGISEQ-200 和 DNBSEQ-T7。随着越来越多产品的上市和用户数量的递增,目前,华大智造的产品已经在全球超过500家科研机构和企业中获得使用和认可。


近期,国家代谢性疾病临床医学研究中心实施了中国代谢解析计划 ChinaMAP ,首次报道了覆盖全国 27 个省份和直辖市,8 个民族,超过 1 万人的高深度全基因组测序数据和表型的系统性分析结果。研究团队对队列中代表中国不同地区和民族的样本,使用华大智造的国产自主高通量DNBSEQ测序平台进行了深度全基因组测序,完成了高质量的中国人群遗传变异数据构建、中国人群体结构分析、基因组特征比较以及变异频谱和致病性变异解析。


从海外市场来看,在新冠肺炎期间,华大智造和瑞典、韩国、南非和泰国的机构展开合作,他们对华大智造提供的测序产品和自动化仪器设备也给出了高度的评价,对于他们本国病毒基因组序列的研究,提供了高效的工具和平台。


总体来看,近年来越来越多的用户能够使用华大智造测序平台产出数据,助力科研和临床应用开发,并且逐步取得突破。到目前为止,在华大智造测序仪上产出的文章已经超过 1000 篇,这是和行业内科研和临床专家们合作的成果。我们期望未来有更多科研成果和产品能够在 DNBSEQ 平台上孵化产出。


多年来,DNA大规模平行测序的市场一直由Illumina和ThermoFisher等寡头垄断。但此项研究显示,来自中国的华大智造已经打破了国外巨头在该领域的技术垄断,我国自主可控的基因测序平台已经达到了国际领先水平。


 参考资料:

Jonathan Foox .et al,Multi-Platform Assessment of DNA Sequencing Performance using Human and Bacterial Reference Genomes in the ABRF Next-Generation Sequencing Study , bioRxiv ,2020,doi:https://doi.org/10.1101/2020.07.23.218602

关于华大智造

深圳华大智造科技股份有限公司(简称华大智造)秉承“创新智造引领生命科技”的理念,致力于成为生命科技核心工具缔造者,专注于生命科学与医疗健康领域仪器设备、试剂耗材等相关产品的研发、生产和销售,为精准医疗、精准农业和精准健康等国计民生需求,提供实时(Real Time)、全景(Whole Picture)、全生命周期(Life Long)的全套生命数字化设备和系统解决方案。

华大智造成立于2016年,现有员工1000余人,其中研发人员占比40%以上,业务遍及39个国家和地区,并在全球设立多家科研和生产基地,是全球三家能自主研发并量产临床高通量基因测序仪的企业之一。