探尋五千年歷史變遷,浪潮AI加速中國考古DNA研究
2019-08-01 14:53:33AI云資訊778
神秘的古DNA研究有多“難”?
上下五千年,各民族在中華大地上生息繁衍、融合變遷,留下了很多未解之謎。為了解開這些謎團(tuán),考古學(xué)、民族學(xué)專家運(yùn)用多種方法進(jìn)行了探索。近年來興起了一種新方法——古DNA技術(shù),為考古研究提供了更加直接有力的證據(jù),開辟了全新的視角。
古DNA是指從古代人類和動物遺骸以及古生物化石中提取的古代生物分子。把古代DNA數(shù)據(jù)同現(xiàn)代基因庫中的數(shù)據(jù)資料相結(jié)合,便可以構(gòu)建出某一生物門類的系統(tǒng)發(fā)育樹,從而進(jìn)一步探討人類的演化與遷移、民族融合、早期農(nóng)業(yè)發(fā)展、動植物的家養(yǎng)與馴化過程等重大問題。
古DNA研究需要經(jīng)過提取、擴(kuò)增、測序等步驟,比現(xiàn)代DNA研究要難得多。特別是提取DNA分子非常困難,因?yàn)楣派餂]有特別的存儲條件,在自然環(huán)境下,DNA完好地保存下來并不容易。DNA儲存在細(xì)胞核內(nèi),生物體在死亡過程中,細(xì)胞就會逐漸發(fā)生自溶,DNA很快會被降解。另外,在高溫和潮濕的條件下,DNA自身也容易發(fā)生水解、斷裂。同時,即便有細(xì)胞保存下來也會碰到其它微生物的進(jìn)駐,所產(chǎn)生的酶類也會把原細(xì)胞內(nèi)的DNA破壞掉;因此,一般死亡的動物和人的遺體,DNA很難完整保存下來。
這些原因使得古DNA基因序列片段比現(xiàn)代DNA更短,導(dǎo)致古DNA測序比現(xiàn)代DNA也要更復(fù)雜。不僅讀取、比對的數(shù)據(jù)量更大,測序之前還需要去除DNA片段兩端的接頭序列,進(jìn)行數(shù)據(jù)清洗與處理流程。
中國首座考古DNA實(shí)驗(yàn)室如何解難題?
為了更好地保護(hù)中國基因資源,推動中華民族基因研究,1998年,吉林大學(xué)考古系與生命科學(xué)學(xué)院合作開展了有關(guān)古DNA方面的研究工作,由此中國第一座“考古DNA實(shí)驗(yàn)室”落成。邊疆考古研究中心人類學(xué)實(shí)驗(yàn)室與考古DNA實(shí)驗(yàn)室合作攻關(guān)重大研究課題,取得了多項(xiàng)全國乃至全球領(lǐng)先的研究成果。
隨著DNA考古研究的逐步深入,考古DNA實(shí)驗(yàn)室已有超過萬例的古人類、古動植物樣本,數(shù)量位居全國第一,建立我國邊疆地區(qū)古代DNA基因庫的時機(jī)日益成熟。但樣本數(shù)量增加也帶來了新的難題,原有的計算設(shè)備已難以在短時間內(nèi)完成大量的基因測序數(shù)據(jù)處理工作。全基因組樣本分析(WGS)與全外顯子組樣本(WES)分析是目前DNA研究的不可或缺的兩大分析流程。然而,使用當(dāng)前以CPU為基礎(chǔ)的計算架構(gòu)開發(fā)的GATK Best Practices工作流程,需要數(shù)天甚至數(shù)周才能完成單個個體的基因組變異識別。
此外,古DNA基因序列片段更短導(dǎo)致數(shù)據(jù)處理量更大,對計算力的要求也更高。數(shù)據(jù)清洗、測序過程中,需要用到非常多的不同于現(xiàn)代DNA測序的應(yīng)用軟件,如何實(shí)現(xiàn)這些應(yīng)用軟件的快速移植與開發(fā)也是一大挑戰(zhàn),影響古DNA的研究速度。
“我們之前一直用臺式工作站做古DNA的測序數(shù)據(jù)處理,一般完成一次古人類的全基因組樣本分析需要耗時至少兩周,過程中還要面臨宕機(jī)帶來的處理流程中斷風(fēng)險。按這種效率,我們要建立邊疆地區(qū)古代DNA基因庫幾乎是一個不可能完成的任務(wù)?!奔执髮W(xué)邊疆考古研究中心副主任蔡大偉教授介紹說,“但是,這個問題必須盡快解決,古DNA研究一刻都不能耽誤”。
浪潮為解決這一難題提供了新思路,作為中國AI計算的領(lǐng)軍企業(yè),浪潮專門為基因測序開發(fā)了FPGA加速計算方案,FPGA具有可編程、并行計算、低延遲的優(yōu)勢,能夠?yàn)榛驕y序、語音識別、視頻處理、風(fēng)險管理等AI和HPC場景提供強(qiáng)大的加速。經(jīng)過嚴(yán)苛測試和全面考察,吉林大學(xué)考古學(xué)院決定和浪潮合作,將FPGA技術(shù)運(yùn)用到古DNA基因測序中,打造我國DNA考古領(lǐng)域的首個FPGA基因測序加速應(yīng)用方案。
提速39倍 基因測序處理速度實(shí)現(xiàn)飛躍
新的基因測序加速計算方案采用了浪潮研發(fā)的F10A FPGA加速卡作為核心計算模塊,集成了峰科的GATK基因處理軟件。浪潮F10A是目前業(yè)界支持OpenCL的最高密度、最高性能的FPGA加速設(shè)備,尺寸為半高半長功耗僅35W,可以適用于數(shù)據(jù)中心、邊緣及桌面等各種復(fù)雜計算環(huán)境,每瓦特性能達(dá)到42GFlops,可以加載專業(yè)的軟件算法庫。集成的峰科的GATK基因處理軟件與標(biāo)準(zhǔn)生物信息學(xué)分析工具完全一致,包括GATK Best Practices的所有流程,如BWA、picard和GATK。它完全依照原軟件模型,調(diào)用命令與原版本一致,中間產(chǎn)生與原樣本一致的中間結(jié)果文件,方便用戶使用和調(diào)整。
浪潮F10A加速卡
測試顯示,搭載浪潮FPGA基因測序加速計算方案可在9.64 小時內(nèi)完成全基因組分析,48分鐘完成全外顯子組分析,相比基于CPU的方案,基因數(shù)據(jù)處理速度提升39倍。
目前,基于新的基因測序加速計算系統(tǒng),吉林大學(xué)考古DNA實(shí)驗(yàn)室的科研工作者正在對我國北方地區(qū)的草原游牧民族,如匈奴、東胡、鮮卑、烏桓、契丹、蒙古等諸族的人骨以及出土的動植物進(jìn)行古DNA的提取和研究工作,并開展我國新疆地區(qū)古代“絲綢之路”沿線各民族相互關(guān)系、人群間的遷徙及混雜過程、經(jīng)濟(jì)文化生活、自然環(huán)境與人類相互關(guān)系等相關(guān)研究,不斷為古代歷史、文化、民族研究提供新的資料,開拓新的領(lǐng)域。如蔡大偉教授及其團(tuán)隊正在攻關(guān)國家社會科學(xué)基金重大項(xiàng)目“古動物DNA視角下的絲路文化交流研究”,從古動物DNA入手,還原絲路沿線古代動物群體起源與擴(kuò)散的歷史過程,揭示絲綢之路上東西文化交流的歷史細(xì)節(jié)。
相關(guān)文章
- 浪潮AI服務(wù)器再獲7項(xiàng)MLPerf(TM)AI訓(xùn)練冠軍 全年44項(xiàng)第一領(lǐng)跑群雄
- IDC:2020上半年浪潮AI服務(wù)器市占率53.5%,持續(xù)領(lǐng)跑AI算力市場
- 浪潮AI加速中國頂尖語言聲學(xué)研究
- 交通銀行采用浪潮AIStation提速創(chuàng)新人工智能+金融
- 在線教學(xué)實(shí)驗(yàn)人工智能!浪潮AIStation幫助高校應(yīng)對疫情挑戰(zhàn)
- 攜手愛馳智能汽車,浪潮AIStation提速個性化駕駛AI助手開發(fā)
- 浪潮AI服務(wù)器大幅提升NLP模型Transformer訓(xùn)練性能
- 更強(qiáng)大的手機(jī)AI拍照!浪潮AIStation助力一加手機(jī)AI研發(fā)創(chuàng)新
- 探尋五千年歷史變遷,浪潮AI加速中國考古DNA研究
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 中科天璣支持CCF BigData 2025“數(shù)據(jù)智能計算”論壇圓滿召開——攜產(chǎn)界實(shí)踐洞見共探智能時代數(shù)據(jù)支撐新路徑
- 百年傳奇煥新:讓“RCA之聲”傳遍中國
- 在胡同與北海間流轉(zhuǎn)的光影 佳能EOS R50 V秋日氛圍感體驗(yàn)
- 一直戴,一直拍!魅族AI拍攝眼鏡StarV Snap發(fā)布
- “盎銳科技杯”2025建筑機(jī)器人技能大賽在滬啟動,助推智能建造實(shí)戰(zhàn)人才培養(yǎng)
- 國產(chǎn)芯開行業(yè)新局,至像Z35國產(chǎn)芯系列新品打印機(jī)賦能中國打印
- 神眸榮獲快手“品牌標(biāo)桿獎”,以芯片級創(chuàng)新躋身行業(yè)前列
- AMD 推出 EPYC? 嵌入式 4005 處理器,助力低時延邊緣應(yīng)用
人工智能產(chǎn)業(yè)
更多>>- 騰訊啟動AI應(yīng)用繁榮計劃,新一期AI共創(chuàng)營報名企業(yè)超300家
- 首都機(jī)場“AI繪空港”大賽完美收官,卓特視覺以技術(shù)賦能創(chuàng)意未來
- 打造張江人工智能創(chuàng)新小鎮(zhèn),全國首個人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)再添發(fā)展新引擎
- 人機(jī)共生 · 智啟未來——2025高交會亞洲人工智能與機(jī)器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達(dá)“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實(shí)現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項(xiàng)目亮相上海創(chuàng)智學(xué)院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強(qiáng)技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實(shí)現(xiàn)實(shí)時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準(zhǔn)
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學(xué)習(xí)方案