科研進(jìn)展
西北高原所發(fā)表藏羚首個(gè)染色體水平的高質(zhì)量基因組
藏羚(Pantholops hodgsonii)是世居青藏高原的典型反芻動(dòng)物,平均分布海拔3,250-5,500 m,屬鯨偶蹄目(Cetartiodactyla),??疲˙ovidae),藏羚屬(Pantholops),是藏羚屬唯一物種。19世紀中期至20世紀初,猖獗的非法盜獵使藏羚的種群數量下降了約90%,2000年被IUCN紅色瀕危物種名錄評估為瀕危物種。經(jīng)過(guò)30多年的保護,藏羚的種群數量恢復到了20多萬(wàn)只,IUCN對其評級也從瀕危降為近危。藏羚不僅是世界上分布海拔最高的反芻動(dòng)物之一,也是青藏高原唯一具有長(cháng)距離遷徙行為的物種,是研究高海拔適應性機制和遷徙行為的良好模型。然而迄今為止,公開(kāi)數據庫中仍缺少藏羚高質(zhì)量的染色體水平基因組,嚴重限制了基于遺傳特征解析其物種適應、進(jìn)化及種群生態(tài)相關(guān)工作的開(kāi)展。
中國科學(xué)院西北高原生物研究所動(dòng)物生態(tài)與資源保護研究團隊聯(lián)合青海大學(xué),基于PacBio HiFi三代基因組測序、Hi-C測序和DNBSEQ-T7二代基因組survey測序三種測序技術(shù),成功組裝了藏羚染色體級別的基因組。結果顯示,藏羚基因組大小為3.1 Gb,Contig N50為84.6 Mb,所有基因掛載到30條染色體上(29?。),與之前的核型研究一致。數據評估顯示,藏羚基因組BUSCO得分為98.2%(S:92.3%,D:5.9%,F:0.8%,M:1.0%),平均QV值為70.14,表明組裝的連續性好,完整度和準確性高?;贓DTA和RepeatModeler從頭預測的藏羚基因組中重復序列注釋結果表明,藏羚基因組重復序列主要由SINEs、LINEs、LTRs 和DNA transposons四種類(lèi)型組成,序列總長(cháng)度為1.65 Gb,占基因組的52.47%;基于蛋白同源預測、蛋白從頭預測和深度學(xué)習等多種策略,在藏羚基因組上共注釋到28,330個(gè)功能基因。綜上,通過(guò)多種技術(shù)手段,首次獲得了藏羚染色體水平的高質(zhì)量基因組和注釋信息,為藏羚的適應進(jìn)化遺傳機制、保護遺傳學(xué)研究及進(jìn)一步探索物種遷徙行為的遺傳機制提供了重要的基因組資源。
相關(guān)研究結果以?A high-quality chromosome-level reference genome assembly of Tibetan antelope?。≒antholops hodgsonii) 為題,于11月12日在Nature旗下綜合性科學(xué)期刊Scientific Data(中國科學(xué)院二區)在線(xiàn)發(fā)表。西北高原所博士研究生徐波和青海大學(xué)陳家瑞副教授為共同第一作者,西北高原所張同作研究員和青海大學(xué)魏青副教授為共同通訊作者。該工作得到青海省自然科學(xué)基金團隊項目(2023-ZJ-901T)的資助。
論文鏈接:https://www.nature.com/articles/s41597-024-04089-z
藏羚基因組的組裝和注釋結果
藏羚的基因組特征及與近緣物種之間的基因組共線(xiàn)性結果