Nvidia 與哈佛大學共同發表深度學習工具 AtacWorks 以 AI 加速基因分析

Nvidia與哈佛大學發展以應用深度學習來加速基因分析,使基因診斷疾病更快,難度及成本也更低。

Nvidia 與哈佛大學發展以應用深度學習來加速基因分析,使基因診斷疾病更快,難度及成本也更低。

Nvidia 與哈佛大學研究人員利用原本用於電腦視覺的神經網路,發展出一個能協助科學家研究罕見細胞型態的深度學習工具,稱為 AtacWorks,進一步找出致病的基因突變。他們也在期刊 Nature Communication 發表論文。

Nvidia 研究人員 Avantika Lal 指出,AtacWorks 能協助研究人員研究疾病和基因變異對特定類型的人體細胞有什麼樣的影響,也能進行過去做不到的生物學研究,有助於發現新的標靶藥物。

AtacWorks 可配合基因學上研究健康與疾病細胞內基因組常用的方法 ATAC-seq。人體細胞都會承載著基因組序列的複本。一個 DNA 序列大約有 30 億個鹼基對。但是不同部位的細胞,如肝、血液或皮膚細胞,只能取用形成相關功能的 DNA 區域。研究 DNA 的可取用區域可了解不同細胞的差異何在,以及疾病或病變對細胞有什麼影響。

ATAC-seq 研究法就是透過為每一組基因組產生訊號來找出這些 DNA。訊號的峰值意謂著可取用的 DNA 區域。但這種方法一般需要數萬個同類細胞才能取得乾淨的訊號,而在研究罕見細胞,如製造紅、白血球和血小板的幹細胞時,就會發生困難。

以 AtacWorks 神經網路來分析 ATAC-seq 資料時,Nvidia 和哈佛大學研究人員發現他們只需要數十個,而非數萬個同類細胞。研究團隊僅用了 50 個幹細胞即可辨識出發展出白血球的相關 DNA,以及發展出紅血球的 DNA 序列。

AtacWorks 是一個 PyTorch 的卷積神經網路,利用一對(一組是高品質資料集,一組充滿雜訊的資料集)標註的 ATAC-seq 資料集訓練而成的模型。這個模型能預測精確、高品質的資料集,辨識出訊號峰值。

AtacWorks 過去在 32 個 CPU 核心的系統上完成整個基因組的推論 (inference) 需要 15 小時,而跑在 Nvidia Tensor Core GPU 的系統上,只需不用 30 分鐘即可完成。

Lal 指出,研究人員現在可以在任何型態的細胞上訓練模型,然後用在其他類細胞樣本上。因此 AtacWorks 模型有助於提高多種疾病,包括心血管、阿茲海默症、糖尿病或神經性病變的研究。現在這套模型在 Nvidia 的 NGC 軟體實驗室供任何研究人員使用。

來源:ZDNet

關於我們

自 1990 年創刊 UXmaster 雜誌,1991 年獲得美國 LAN Magazine 獨家授權中文版,2006 年獲得 CMP Network Computing 授權,2009 年合併 CMP Network Magazine 獨家授權中文版,2014 年轉型為《網路資訊》雜誌網站,為台灣中小企業協助技術領導者落實企業策略,了解網路規劃及應用,為企業網路應用、管理、MIS、IT 人員必備之專業雜誌網站。


與我們聯絡

加入《網路資訊》雜誌社群

© Copyright 2022 本站版權所有,禁止任意轉載 網路資訊雜誌 / 心動傳媒股份有限公司 聯絡電話:+886 2 29432416