
Meta聯(lián)合發(fā)布OMol25數(shù)據(jù)集與UMA模型,AI助力全球化學(xué)創(chuàng)新
2025-05-16
144
IT之家 5 月 16 日消息,Meta AI 公司于 5 月 14 日發(fā)布博文,發(fā)布了全新化學(xué)數(shù)據(jù)集 Open Molecules 2025(OMol25)以及通用原子模型 Universal Models for Atoms(UMA)。
OMol25 數(shù)據(jù)集:化學(xué)研究新利器
OMol25 是迄今為止規(guī)模最大的分子模擬數(shù)據(jù)集,由 Meta 與美國(guó)能源部勞倫斯伯克利國(guó)家實(shí)驗(yàn)室(Berkeley Lab)聯(lián)合打造,該數(shù)據(jù)集包含超過(guò) 1 億個(gè) 3D 分子快照,基于密度泛函理論(DFT)計(jì)算而成。
DFT 是一種強(qiáng)大的工具,能精確模擬原子間相互作用,幫助科學(xué)家預(yù)測(cè)每個(gè)原子的受力及系統(tǒng)能量,從而揭示分子運(yùn)動(dòng)和化學(xué)反應(yīng)的規(guī)律。
傳統(tǒng)的 DFT 計(jì)算需要巨大的計(jì)算資源,隨著分子規(guī)模增大,計(jì)算需求呈指數(shù)級(jí)增長(zhǎng),使用最先進(jìn)的計(jì)算設(shè)備,也難以模擬現(xiàn)實(shí)世界中復(fù)雜的分子系統(tǒng)。
基于 DFT 數(shù)據(jù)訓(xùn)練的機(jī)器學(xué)習(xí)原子間勢(shì)(MLIPs)能以快 1 萬(wàn)倍的速度提供同等精度的預(yù)測(cè),讓科學(xué)家能在普通計(jì)算系統(tǒng)上模擬大型原子系統(tǒng)。OMol25 作為化學(xué)多樣性最高的分子數(shù)據(jù)集,為訓(xùn)練 MLIPs 提供了前所未有的數(shù)據(jù)支持。
UMA 模型:通用預(yù)測(cè)工具問(wèn)世
Meta 公司還推出 UMA,是一個(gè)基于過(guò)去五年 Meta FAIR 公開(kāi)數(shù)據(jù)集構(gòu)建的通用原子間勢(shì)能模型群,覆蓋分子、材料、觸媒等化學(xué)領(lǐng)域,利用超過(guò) 50 億個(gè)原子組成的 3D 結(jié)構(gòu)作為訓(xùn)練數(shù)據(jù)。
UMA 分為 UMA-small 和 UMA-medium 兩種規(guī)模,采用“Mixture of Linear Experts”創(chuàng)新架構(gòu),其中 UMA-medium 模型擁有 14 億參數(shù),但單結(jié)構(gòu)計(jì)算僅用約 5000 萬(wàn)參數(shù),加快推理速度。
UMA 模型無(wú)需微調(diào),僅通過(guò)預(yù)訓(xùn)練即可應(yīng)對(duì)多種化學(xué)任務(wù),性能媲美甚至超越現(xiàn)有專用模型。研究表明,UMA 在分子特性預(yù)測(cè)、材料設(shè)計(jì)、觸媒開(kāi)發(fā)、能量存儲(chǔ)及半導(dǎo)體制造等領(lǐng)域表現(xiàn)出色,高精度與快速計(jì)算能力為科學(xué)研究和工業(yè)應(yīng)用開(kāi)辟了新路徑,推動(dòng)跨領(lǐng)域技術(shù)革新。