安捷倫:迄今最大規(guī)模覆蓋近1200萬個(gè)CCS值的代謝組學(xué)數(shù)據(jù)庫(kù)面世
復(fù)雜生物樣本中代謝物的準(zhǔn)確鑒定一直是困擾非靶向代謝組學(xué)發(fā)展的最大瓶頸。目前,代謝物的準(zhǔn)確鑒定主要依賴于標(biāo)準(zhǔn)物質(zhì)的二級(jí)碎片譜圖(MS/MS),其鑒定范圍嚴(yán)重受限于標(biāo)準(zhǔn)譜圖的數(shù)目。離子淌度質(zhì)譜(Ion Mobility-Mass Spectrometry)可以獲得代表化合物尺寸大小的碰撞截面積數(shù)據(jù)、區(qū)分電荷異構(gòu)體和同分異構(gòu)體,進(jìn)而提供超越傳統(tǒng)質(zhì)譜平臺(tái)的多維結(jié)構(gòu)鑒定信息,可極大提升對(duì)復(fù)雜生物樣品代謝組的有效鑒定。
近期,中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所生物與化學(xué)交叉研究中心的朱正江研究員課題組在 Nature Communication上發(fā)表的題為 Ion Mobility Collision Cross-Section Atlas for Known and Unknown Metabolite Annotation in Untargeted Metabolomics 的文章。
作者基于離子淌度質(zhì)譜,開發(fā)了目前最大、最全面的高精度小分子碰撞截面積數(shù)據(jù)庫(kù)平臺(tái) AllCCS,并結(jié)合多維代謝物鑒定方法,極大地提升了已知與未知代謝物注釋的準(zhǔn)確度,開創(chuàng)了非靶向代謝組學(xué)全面鑒定新策略。
基于離子淌度質(zhì)譜的代謝組學(xué)技術(shù)能夠全面表征生命體內(nèi)已知和未知的代謝物。我們通過發(fā)展了大規(guī)模、標(biāo)準(zhǔn)化的碰撞截面積數(shù)據(jù)庫(kù)平臺(tái) AllCCS,為基于離子淌度質(zhì)譜的應(yīng)用研究提供基礎(chǔ)支持;谠撈脚_(tái),我們發(fā)展了結(jié)合高精度 CCS 值的多維代謝物鑒定技術(shù),大大提高了代謝物鑒定的可靠性,并有助于發(fā)現(xiàn)新的未知代謝物,為復(fù)雜代謝組的研究提供更全面、準(zhǔn)確的分析。
AllCCS 平臺(tái)建立:
最大、最全面的碰撞截面積數(shù)據(jù)庫(kù)
首先,利用 Agilent 6560 離子淌度 Q-TOF 液質(zhì)聯(lián)用系統(tǒng)等不同儀器平臺(tái)獲取了 2193 個(gè)化合物共 5119 個(gè)實(shí)驗(yàn) CCS 值
通過五步標(biāo)準(zhǔn)化最終保留了 3539 個(gè) CCS 值,相比于其它 CCS 庫(kù),標(biāo)準(zhǔn)化操作可有效消除不同實(shí)驗(yàn)室、不同儀器導(dǎo)致的差異
發(fā)展新一代機(jī)器學(xué)習(xí)碰撞截面積預(yù)測(cè)算法,基于標(biāo)準(zhǔn)化后的實(shí)驗(yàn) CCS 值,實(shí)現(xiàn)對(duì)大于 160 萬個(gè)小分子化合物近 1200 萬個(gè) CCS 值的預(yù)測(cè);化合物覆蓋了 7 大主流數(shù)據(jù)庫(kù) KEGG、HMDB、LMSD、MINE、DrugBank、DSSTox 和 UNPD,最終建立了迄今最大、最全面的 CCS 數(shù)據(jù)庫(kù)
AllCCS 預(yù)測(cè)性能評(píng)估:
高準(zhǔn)確度與寬適用性
創(chuàng)新地發(fā)展了特征結(jié)構(gòu)相似性得分(RSS),對(duì) AllCCS 碰撞截面積預(yù)測(cè)誤差實(shí)現(xiàn)客觀評(píng)估。通過兩個(gè)獨(dú)立的外部驗(yàn)證集的驗(yàn)證和評(píng)估,發(fā)現(xiàn)實(shí)驗(yàn)值和預(yù)測(cè)值之間高度一致,預(yù)測(cè)誤差低至 2% 以內(nèi),并且無論對(duì)內(nèi)源性代謝物還是外源性化合物(如藥物、天然產(chǎn)物、環(huán)境污染物等),AllCCS 均可實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè)。
AllCCS 多維鑒定:
提升已知代謝物的注釋
目前非靶向代謝組學(xué)代謝物鑒定的最大挑戰(zhàn)是大數(shù)據(jù)庫(kù)檢索的冗余和假陽(yáng)性。利用建立的 AllCCS 庫(kù),發(fā)現(xiàn)引入CCS 值后,可將代謝物庫(kù)檢索的匹配候選化合物過濾掉約 75%,結(jié)合“m/z+MS/MS+CCS”多維鑒定策略,可進(jìn)一步提升準(zhǔn)確結(jié)構(gòu)鑒定的排名。
AllCCS 開創(chuàng)未知代謝物注釋新方法
未知代謝物相對(duì)已知代謝物的鑒定更加挑戰(zhàn),沒有標(biāo)準(zhǔn)的譜庫(kù)可以參照。本研究巧妙的基于 KEGG 中已知代謝物結(jié)合生物體內(nèi) 178 個(gè)代表性的生化轉(zhuǎn)化反應(yīng)及 117 種代謝酶進(jìn)行計(jì)算機(jī)模擬酶反應(yīng),從而構(gòu)建了新的大于 10 萬種未知代謝物的化學(xué)結(jié)構(gòu);并進(jìn)一步利用AllCCS及其它MS/MS工具進(jìn)行多維質(zhì)譜信息的預(yù)測(cè),通過“m/z+MS/MS+CCS”多維匹配和打分來提升代謝物鑒定的準(zhǔn)確性。AllCCS 對(duì)未知代謝物的鑒定策略極大的提升了代謝物的鑒定范圍,并有助于新代謝物的發(fā)現(xiàn),可以實(shí)現(xiàn)對(duì)更多代謝通路及通路活動(dòng)的探究。
本研究建立的迄今最大規(guī)模的 AllCCS 數(shù)據(jù)庫(kù)及多維鑒定策略,為非靶向代謝組學(xué)已知和未知代謝物的全面、準(zhǔn)確鑒定提供了突破性解決方案,將極大提升基于離子淌度質(zhì)譜的代謝組學(xué)深入洞察生物過程的機(jī)制研究。
(責(zé)任編輯:金利儀器lyh)