它可用于開發(fā)針對COVID-19或阿爾茨海默氏癥等疾病的治療方法。我們將機器學(xué)習(xí)算法與從數(shù)百個生物實驗中收集到的知識相結(jié)合,開發(fā)出 種技術(shù),使生物醫(yī)學(xué)研究人員能夠找出在細胞中開啟和關(guān)閉基因的蛋白質(zhì)(稱為轉(zhuǎn)錄因子)的功能。這些知識可以使開發(fā)治療多種疾病的藥物變得更加容易。
在COVID-19大流行的早期,研究出肺和腸細胞RNA分子遺傳密碼的科學(xué) 發(fā)現(xiàn),這些器官中只有 小部分細胞 容易被SARS-CoV感染。2病毒。這使研究人員能夠?qū)W⒂谧柚共《具M入這些細胞的能力。我們的技術(shù)可以使研究人員更容易找到此類信息。
我們使用的生物學(xué)知識來自這種RNA測序,它為研究人員提供了細胞中數(shù)十萬RNA分子被翻譯成蛋白質(zhì)的快照。廣受贊譽的機器學(xué)習(xí)工具Seurat分析平臺幫助 各地的研究人員在健康和患病器官中發(fā)現(xiàn)新的細胞群。這種機器學(xué)習(xí)工具處理來自單細胞RNA測序的數(shù)據(jù),而無需提前提供有關(guān)這些基因如何運作和相互關(guān)聯(lián)的任何信息。
我們的技術(shù)采用不同的方法,通過添加有關(guān)某些基因和細胞類型的知識來尋找有關(guān)細胞不同作用的線索。已經(jīng)有十多年的研究確定了轉(zhuǎn)錄因子的所有潛在目標(biāo)。
有了這些知識,我們使用了 種稱為貝葉斯推理的數(shù)學(xué)方法。在這種技術(shù)中, 驗知識被轉(zhuǎn)換為可以在計算機上計算的概率。在我們的例子中,它是基因受給定轉(zhuǎn)錄因子調(diào)控的概率。然后,我們使用機器學(xué)習(xí)算法來計算我們分析的數(shù)千個細胞中的每 個中轉(zhuǎn)錄因子的功能。
我們在GenomeResearch雜志上發(fā)表了我們的技術(shù),稱為貝葉斯推理轉(zhuǎn)錄因子活動模型,并免費提供該軟件,以便其他研究人員可以測試和使用它。
為什么重要
我們的方法適用于廣泛的細胞類型和器官,可用于開發(fā)COVID-19或阿爾茨海默氏癥等疾病的治療方法。如果這些藥物針對導(dǎo)致疾病的細胞并避免對其他細胞造成附帶損害,則治療這些難以治療的疾病的藥物效果 佳。我們的技術(shù)使研究人員更容易鎖定這些目標(biāo)。
正在進行的其他研究
單細胞RNA測序揭示了每個器官如何具有10、20甚至更多的特化細胞亞型,每個亞型都具有不同的功能。 個非常令人興奮的新發(fā)展是空間轉(zhuǎn)錄組學(xué)的出現(xiàn),其中RNA測序在空間網(wǎng)格中進行,使研究人員能夠研究器官中特定位置細胞的RNA。
個 近的 篇文章中使用貝葉斯統(tǒng)計辦法類似于我們要弄清楚細胞的不同作用,考慮到他們彼此接近時。另 個研究小組將空間數(shù)據(jù)與單細胞RNA測序數(shù)據(jù)相結(jié)合,研究了相鄰細胞的不同功能。
下 步是什么
我們計劃與同事合作,使用我們的新技術(shù)來研究復(fù)雜的疾病,如阿爾茨海默病和COVID-19,這些工作可能會為這些疾病帶來新的藥物。我們還希望與同事合作,以更好地了解細胞之間相互作用的復(fù)雜性。
伊利諾伊大學(xué)芝加哥分校的尚高和Jalees Rehman