极速11选5 網站地圖 | 聯系我們 | English | 中國科學院
首 頁 概 況 機構設置 研究隊伍 研究中心 國際交流 院地合作 研究生培養 創新文化 相關研究所
 

 
現在位置:首頁>新聞動態>圖片新聞
极速11选5成功構建環形RNA大數據整合挖掘和分析平台
發表日期: 2020-04-29 來源: 科研教育處
打印本頁 字號: 關閉

  2020428日,中科院极速11选5的趙方慶團隊在國際期刊Genome Biology發表題爲CircAtlas: an integrated resource of one million highly accurate circular RNAs from 1070 vertebrate transcriptomes的研究論文。該研究基于現有的海量轉錄組數據,采用多維數據智能整合分析手段,成功解析了跨物種、多組織、大樣本的環形轉錄本表達特征和進化規律,爲探索真核生物複雜多變的環形RNA全貌和産生機制提供了強有力的數據支持。 

  近年來,環形RNA作爲一類新型的內源性非編碼RNA在生物系統調控和疾病發展過程中的作用不斷被發現和擴展。高通量測序技術的快速發展和廣泛應用,更是將環形RNA研究帶入了大數據時代,使之迅速成爲 RNA研究領域的熱點之一。環形RNA轉錄組數據的大量積累,給研究人員帶了新的機遇和挑戰:如何從轉錄組數據海洋中高效篩選和獲取具有重要生物學功能的環形RNA分子。物種信息的日益豐富爲全面解讀複雜的環形RNA轉錄調控過程打開新的突破口:基于多物種的進化保守性分析將有助于篩選出具有潛在功能的環形轉錄本,而多組學數據的整合分析則可以從不同層次解析環形RNA的表達調控過程。 

  研究人員通過整合自有及公共轉錄組數據,獲得覆蓋6個物種(人、猴、小鼠、大鼠、豬和雞)的19個組織類型,共計1070個轉錄組數據集,構建了目前覆蓋物種最廣、數據最齊全的環形RNA整合數據資源平台circAltas (http://circatlas.biols.ac.cn)。該平台收錄超過100萬個高質量的環形RNA分子,其中>80%具有全長轉錄本序列。此外,通過整合功能組學數據和注釋信息,爲環形RNA數據挖掘和功能研究提供了重要的數據資源和技術保障。 

  在上述數據的基礎上,他們進一步提出了新的保守環形RNA識別方法和保守性多層次評估機制。通過結合全局比對和反向剪接位點的局部比對特征,篩選出超過12萬保守的環形RNA,並進一步結合物種間、組織間和個體間的表達一致性對其保守性進行打分(Multiple Conservation Score),直觀反映出環形轉錄本在不同層次的保守性和進化規律,對功能環形RNA分子的篩選具有重要意義。此外,研究人員還結合保守性和表達量信息,對收錄的環形RNA進行重新命名,並提供多個環形RNA數據庫間的名稱查詢和轉換功能,厘清了環形RNA領域存在的命名混亂問題。此外,利用重建的環形RNA全長序列,該團隊首次通過大規模分析其可能的ORFIRES序列,去預測其翻譯成蛋白質的潛力。進一步結合CLIP等多組學數據,構建環形RNAmRNAmiRNARBP的表達調控網絡,並結合網絡中衆多調控元件的注釋信息對環形RNA的功能進行預測。該研究爲環形RNA的功能挖掘和注釋提供了重要的分析工具。 

  该工作由赵方庆课题组的博士研究生吴婉莹和助理研究员冀培丰完成,并获得了国家自然科学基金委、科技部重点研发计划及中國科學院的经费支持。赵方庆团队在前期的工作中建立了环形RNA識別和質控、轉錄本組裝、可變剪接識別及定量等一系列方法和工具,相關研究發表在Genome Biology (2015, 2020)Nature Communications (20162020)Briefings in Bioinformatics (2017)Trends in Genetics (2018)Genome Medicine (2019)Cell Reports (2019)Bioinformatics (2020)。這些研究豐富了我們對環形RNA的表達和功能的認識,爲深入了解這一嶄新類型的非編碼RNA分子奠定了方法學基礎。 

論文鏈接

 

圖1.環形RNA整合數據資源和挖掘平台——circAtlas

图2. 保守性环形RNA的识别和打分策略

 

版权所有:极速11选5
地址:中国.北京市朝阳区北辰西路1号院5号 邮编:100101
电话:(+86)10-64874346 传真:(+86)10-84504120
网站地图