2022年10月29日,由深圳國家基因庫和深圳華大生命科學研究院共同研發(fā)的時空組學數據庫V1.0版本(STOmicsDB)在國家基因庫生命大數據平臺(CNGBdb)正式上線,致力于促進時空組學的數據探索和學術研究。 STOmicsDB率先建立時空組數據歸檔標準,實現時空組學不同層次數據的整合,并形成時空組學數據生態(tài)圈,是國際領先的時空組學綜合平臺。
數據資源 | 超全文獻+數據資源:STOmicsDB可實現時空組學不同層次數據的整合,對公共數據庫的6000多篇文獻進行數據挖掘,聯(lián)合時空數據匯交系統(tǒng),策劃了141個時空組學數據集,收錄超1000張時空切片數據,覆蓋全面的時空組文獻和數據資源。 數據歸檔 | 全新時空匯交標準 填補領域空白:面對全新的時空組數據類型,STOmicsDB率先建立時空組數據歸檔標準,以數據驅動的形式,為時空組數據的統(tǒng)一匯交和開放共享建立基礎。 數據生態(tài) | 時空組學數據生態(tài)圈:STOmicsDB提供一站式服務,包括:文獻追蹤→ 數據獲取→ 可視化探索 → 在線分析 → 數據歸檔→ 時空專輯數據庫發(fā)布,覆蓋時空組學數據全生命周期。 成果發(fā)表 | 時空專輯數據庫科研成果發(fā)布:STOmicsDB已支撐Nature、Science、Cell在內的11篇文章發(fā)表,包括【時空組學聯(lián)盟第一批生命發(fā)育時空圖譜】覆蓋小鼠、斑馬魚、果蠅、擬南芥四種模式生物胚胎或器官發(fā)育,【蠑螈腦再生時空圖譜】等。
為什么要搭建STOmicsDB? 時空組學技術從時間和空間維度上,對生命發(fā)育過程中的基因和細胞變化過程進行超高精度解析,在腦科學研究、疾病研究、物種發(fā)育、生命起源等領域開展研究,全面提升了人類對生命認知和疾病定義。 隨著時空組技術的發(fā)展,產生海量時空組數據,缺乏統(tǒng)一的數據歸檔標準和專業(yè)的數據資源庫,以數據驅動為導向的大數據整合、挖掘與解析面臨挑戰(zhàn),生命科學領域亟需建設一個時空組學數據庫。
STOmicsDB:“一站式”賦能時空組學研究 面對新挑戰(zhàn),深圳國家基因庫聯(lián)合深圳華大生命科學研究院共同研發(fā)時空組學綜合資源平臺——時空組學數據庫STOmicsDB,為充分探索時空組學數據,服務基礎科學研究,構建標準化數據分析流程,搭建結構化元信息審編模型,強力支撐時空領域的科學研究。
上圖STOmicsDB V1.0架構 ?科研資源多維解析 全面提升檢索效率 STOmicsDB通過機器學習和人工策劃,已收錄時空組學主題6000多篇文獻和141個數據集,建立了基于時空文獻的知識圖譜,從文獻、數據集、研究人員、數據分析方法、實驗技術,5個維度全面探索時空知識,以多維度的數據檢索,提升科研資源檢索效率。同時,我們邀請文章作者和專家對時空文獻進行文獻解讀,發(fā)布于文獻解讀專欄(Report板塊),方便科研人員在第一時間獲取最新的時空資訊。 ?時空數據生態(tài)閉環(huán) 推進領域科研轉化 STOmicsDB提供數據資源中心、數據在線分析、交互式可視化工具、數據歸檔服務,時空專輯數據庫等服務,形成時空組學數據生態(tài)圈,科研人員可以通過在STOmicsDB完成時空組學數據的安全管理、在線分析和可視化探索,實現最大化發(fā)現數據價值,加速時空組學領域科研成果發(fā)表和應用轉化。 【Dataset-時空組學數據集】 STOmicsDB通過時空數據匯交系統(tǒng)和深度挖掘公共數據資源,將相互獨立的公共數據資源,進行數據質控和標準化分析,整合不同層次時空組學數據,形成了一致可對比的數據集。 時空數據集搭載了時空圖譜可視化工具,基于WebGL引擎,兼容web瀏覽器,渲染高性能的交互式3D圖形,秒級響應百萬spot數據,有助于時空組可視化瀏覽和深度挖掘。 【Submission-時空組學數據歸檔】 STOmicsDB實現時空組學不同層次數據的收錄與整合,建立了空間轉錄組數據歸檔標準,為全球時空組數據的統(tǒng)一匯交和開放共享建立基礎。同時提供時空組數據可視化工具,將空間特異性數據用圖形界面進行展示,方便研究者更加直觀地探索和分析數據,以數據驅動的形式,支持前沿科學發(fā)現和技術創(chuàng)新。 【Analysis-時空組學數據分析】 Analysis模塊作為時空數據的分析利器,提供了Gene search、Compare、SingleR三種分析工具。通過跨數據集聯(lián)合分析的功能,幫助科研人員從全局角度對時空組數據進行對比,從多維度查看不同物種、不同發(fā)育階段、不同疾病進程、不同癌癥種類、正常與疾病分組的基因表達等數據差異。 【Collections-時空專輯數據庫】 STOmicsDB以“時空專輯數據庫”發(fā)布科研成果,構建數據庫是對測序數據和分析數據的最好管理方式,時空專輯數據庫提供時空圖譜可視化分析工具和3D可視化工具進行數據探索,支持Aspera等高速下載工具,全面提升成果轉化率,推動領域創(chuàng)新發(fā)展。 目前Collections模塊已發(fā)布7個時空組數據專輯,包括時空組學聯(lián)盟第一批生命時空圖譜專輯數據庫,覆蓋小鼠、斑馬魚、果蠅、擬南芥四種模式生物的時空圖譜,蠑螈腦再生時空圖譜,猴腦時空圖譜等。 【Codeplot-時空生態(tài)建設與人才培養(yǎng)】 此外,研發(fā)團隊在國家基因庫可信計算平臺Codeplot搭建了STOmicsDB數據集,部署了STUtility等時空組學分析工具,加強了時空數據的可拓展性,國家基因庫攜手一線科研工作者,將開展《時空組訓練營》公益課程,助力時空生態(tài)建設與人才培養(yǎng)。
如何訪問STOmicsDB? 搜索引擎搜索“國家基因庫生命大數據平臺” → 訪問【國家基因庫生命大數據平臺】→ 導航欄點擊【科學數據庫】→ 點擊【STOmicsDB:空間轉錄組學數據庫】 * STOmicsDB由CNGBdb團隊設計開發(fā),如果您有任何問題和建議, 可隨時聯(lián)系CNGBdb@cngb.org。 |