震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!
- 时间:
- 浏览:0
2017年5月,19岁的全球最大 围棋第其他人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败,的确是我们人类顶尖高手与这台机器他们之他们之间到于是两次较量,同年10月 《Nat智能汽车零部件龙头股Ure》杂志发表了累计它所有人不过 版本的AlphaGo Zero。和一胜利向全球最大 展示了下建立子系统源自学无法完成 复杂任务中到于是甚至性,而其背后所主智能汽车零部件龙头股要代表到于是运算具备,是计算机科学的分支技术领域--高性能计算(High Performance Computing),是甚至际应用与此不仅仅更更成大国综合超强实力的体现,更给世人的日常于是带给给了转变 ,目前为止该其技术已在航空航天、核试验模拟、天气预报、我的生命科学、高新制造(汽车、微电子)等技术领域胜利了广泛应用。
以我的生命科学技术领域举例,日益我的生命遗传密码(基因组)的日益破解,人的生老病死和一复杂一一件事 真真正正用数字化的多智能汽车零部件龙头股种形式具体完整信息 呈现,以期无法完成 疾病的精准分析结论、诊断和治疗效果,让世人远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病,大大减少人均预期寿命,并大幅度大大减少社会环境卫生总负担。
近二十年来,其他人全基因组测序的成本以“超摩尔定律”的速度很快下降,而高性能计算在测序数据统计 分析结论方向中的应用也前发生了翻天覆地的转变 。目前为止全球最大 主流的基因组测序数据统计 分析结论工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit),该项我的生命科学技术领域公认的最佳目前工作 流程无法完成 三其他人的全基因组(Whole Genome Sequencing,WGS)30X数据统计 分析结论真真正正1800分钟。深耕于基因组学20多年的华大基因在基因组高性能计算技术领域胜利一突破性进展,于近日一次成功无法完成 6分钟无法完成 30X WGS全流程的分析结论任务中,相较于GATK基础标准计算时长提速300倍。
依照NIH公布的最新资料,日益测序其技术的蓬勃发展,测序成本以超摩尔定律下
https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data
6分钟无法完成 30X WGS任务中是由华大基因自主研发的LUSH工具集无法完成 的,打破了软件程序 程序 在2020年1月创造的15分钟极限速度很快。另有的黑科技是是因为采用传统了新的方式的方式底层架构采用传统,公司提供 了概念基础中央再处理器和图形再处理器相运用实施基因数据统计 分析结论的高性能速度很快方案,在大大减少集群计算资源消耗、大大减少检出速度很快的与此不仅仅,无法完成 了全程自动化、完整信息 化,有记录可回溯,真真正正会会更好用于精准医学的应用场景。
LUSH工具集速度很快的新的方式底层架构逻辑
LUSH工具集公司提供 和这种“CPU+GPU”的高并行软硬件如何无法解决 方案,概念基础经典流程中则 软件程序 模块BWA、SAMTOOLS和GATK,多种形式GPU的通用运算其技术,实施计算引擎和速度很快引擎的新的方式架构采用传统,无法完成 算法优化和并行化再处理,并运用华大自主研发的超高通量测序仪,无法完成 碱基数据统计 流的超高速分析结论,到于是胜利一准确的分析结论到于是。
LUSH工具集速度很快流程示意图
是是因为是甚至我的生命数字化进程真真正正严谨的科学思想精神精神,而其应用场景具有 体目前为止的精准医疗、健康管理等与我们人类健康具有息息相关联的技术领域,是甚至不一样于或者高性能计算技术领域,基因组数据统计 分析结论对精度有极高的其要求。而是甚至高性能和准确性不是可不过兼得,数据统计 范畴 、分布和浮点精度、峰值性能和内存经常会 影响很大算法是不选择,具有 涉及到唯一一最优解和近似解的算法是甚至大相径庭。LUSH工具集是是因为实施在经典流程算法的概念基础上多种形式了其新的方式采用传统的底层架构近一步大大减少了中间位置到于是的读写,并多种形式CPU无法完成 基因分析结论任务中的智能分发,多种形式GPU数千计算核心无法完成 百万任务中的极速并行再处理,与此不仅仅如何无法解决 了经典流程计算密度较高、频繁地存储器访问等如何如何无法解决 ,历经测试其基础标准品的准确性到于是与经典流程一致,累计99.86%,不仅仅其真真正正在计算到于是的准确性与极速性上得以平衡。
更优越的性能、更低的成本和更高效的检出是所有人高性能计算应用技术领域的研发追求长远目标。对速度很快组件的持续的研发源自对速度很快无止境的追求,正如把手机 芯片细分行业的蓬勃发展是日益移动端各种需求 的旺盛,其技术才得以日益地迭代和进步。从基因组学概念基础研究者到临床研究者及应用,无法完成 测序工具的自主可控的与此不仅仅也真真正正无法完成 数学形式中间位置自主研发,而只不过 是甚至追求芯片的底层下潜开发。对后者是无止境的追求,而有且前者是不过可控须要无法完成 从跟随模仿到有且超越到于是甚至,从核心算法的研发上助力发达国家精准医疗自主可控的蓬勃发展进程。