| 新媒體 | ||||||||||||
              
  | 
          ||||||||||||
新聞中心首頁
新華社杭州10月23日電(記者朱涵)百億參數(shù)人類基因組通用基礎(chǔ)模型“Genos”23日在浙江杭州召開的第二十屆國際基因組學(xué)大會上正式發(fā)布。
Genos基礎(chǔ)模型相關(guān)論文已于22日晚發(fā)表于生物學(xué)領(lǐng)域國際期刊《大數(shù)據(jù)科學(xué)》(GigaScience)上。記者了解到,在該基礎(chǔ)模型支持下,基因組研究邁向智能分析的時代,推動臨床疾病診斷、個人基因組解讀及前沿科學(xué)研究實(shí)現(xiàn)突破,助力人類加速讀懂“生命天書”。
該基礎(chǔ)模型由杭州華大生命科學(xué)研究院與之江實(shí)驗室聯(lián)合研發(fā)完成。杭州華大生命科學(xué)研究院院長劉龍奇表示,基因組學(xué)領(lǐng)域內(nèi)的現(xiàn)有模型大多基于一到兩個參考基因組進(jìn)行訓(xùn)練,難以捕捉人類豐富的遺傳多樣性。而Genos基礎(chǔ)模型則系統(tǒng)整合了多個權(quán)威公開資源,首次匯聚了全球范圍內(nèi)636個“端粒到端!奔墑e的高質(zhì)量人類基因組作為訓(xùn)練數(shù)據(jù)。這些數(shù)據(jù)覆蓋了全球不同人群,旨在從源頭減少“數(shù)據(jù)偏見”,更全面地代表人類遺傳多樣性。
目前,在科研領(lǐng)域,Genos基礎(chǔ)模型能僅憑DNA序列“秒級”預(yù)測RNA表達(dá)譜,極大提升了生物信息分析流程的速度。在直接面向臨床應(yīng)用的致病性突變解讀任務(wù)中,Genos基礎(chǔ)模型達(dá)到了92%的準(zhǔn)確性,結(jié)合之江實(shí)驗室021科學(xué)基礎(chǔ)模型后,準(zhǔn)確率能夠進(jìn)一步提升至98.3%,為臨床診斷提供了高效工具。
據(jù)介紹,為進(jìn)一步促進(jìn)全球科研合作,Genos基礎(chǔ)模型將全面開源開放,同時提供12億和100億參數(shù)兩個版本,滿足不同應(yīng)用場景的需求。目前,兩個版本的模型權(quán)重、架構(gòu)細(xì)節(jié)與完整訓(xùn)練流程均已公開發(fā)布。
![]()  | 
                        ![]()  | 
                        ![]()  | 
                      
                    
  | 
                ||||
| 焦作網(wǎng)免責(zé)聲明: | ||||||||
 
 
  | 
                    ||||||||
新華社杭州10月23日電(記者朱涵)百億參數(shù)人類基因組通用基礎(chǔ)模型“Genos”23日在浙江杭州召開的第二十屆國際基因組學(xué)大會上正式發(fā)布。
Genos基礎(chǔ)模型相關(guān)論文已于22日晚發(fā)表于生物學(xué)領(lǐng)域國際期刊《大數(shù)據(jù)科學(xué)》(GigaScience)上。記者了解到,在該基礎(chǔ)模型支持下,基因組研究邁向智能分析的時代,推動臨床疾病診斷、個人基因組解讀及前沿科學(xué)研究實(shí)現(xiàn)突破,助力人類加速讀懂“生命天書”。
該基礎(chǔ)模型由杭州華大生命科學(xué)研究院與之江實(shí)驗室聯(lián)合研發(fā)完成。杭州華大生命科學(xué)研究院院長劉龍奇表示,基因組學(xué)領(lǐng)域內(nèi)的現(xiàn)有模型大多基于一到兩個參考基因組進(jìn)行訓(xùn)練,難以捕捉人類豐富的遺傳多樣性。而Genos基礎(chǔ)模型則系統(tǒng)整合了多個權(quán)威公開資源,首次匯聚了全球范圍內(nèi)636個“端粒到端!奔墑e的高質(zhì)量人類基因組作為訓(xùn)練數(shù)據(jù)。這些數(shù)據(jù)覆蓋了全球不同人群,旨在從源頭減少“數(shù)據(jù)偏見”,更全面地代表人類遺傳多樣性。
目前,在科研領(lǐng)域,Genos基礎(chǔ)模型能僅憑DNA序列“秒級”預(yù)測RNA表達(dá)譜,極大提升了生物信息分析流程的速度。在直接面向臨床應(yīng)用的致病性突變解讀任務(wù)中,Genos基礎(chǔ)模型達(dá)到了92%的準(zhǔn)確性,結(jié)合之江實(shí)驗室021科學(xué)基礎(chǔ)模型后,準(zhǔn)確率能夠進(jìn)一步提升至98.3%,為臨床診斷提供了高效工具。
據(jù)介紹,為進(jìn)一步促進(jìn)全球科研合作,Genos基礎(chǔ)模型將全面開源開放,同時提供12億和100億參數(shù)兩個版本,滿足不同應(yīng)用場景的需求。目前,兩個版本的模型權(quán)重、架構(gòu)細(xì)節(jié)與完整訓(xùn)練流程均已公開發(fā)布。
                    
  | 
                ||||
| 焦作網(wǎng)免責(zé)聲明: | ||||||||
 
 
  | 
                    ||||||||
        
 
  | 
      
       
  |