
繪圖:黃怡可
泛基因組(Pan-genome)是一個(gè)物種內所有基因組信息的總和,它比單一參考基因組涵蓋了更多的遺傳多樣性。
近年來(lái),科學(xué)家已經(jīng)獲得了多個(gè)作物的泛基因組。如何利用這些更為全面的基因組信息培育下一代良種,成為科學(xué)家們關(guān)心的課題。
北京時(shí)間2022年6月8日,《自然》在線(xiàn)發(fā)表了中國農業(yè)科學(xué)院深圳農業(yè)基因組研究所(以下稱(chēng)“基因組所”)黃三文團隊有關(guān)泛基因組的兩項研究成果。
一篇論文中,他們首次獲得了番茄的圖泛基因組,并借此找回了番茄育種中“丟失的遺傳力”,為解析生物復雜性狀的遺傳機制提供了新思路。論文評審專(zhuān)家認為,“這項工作是對圖泛基因組概念最全面的分析。” “圖泛基因組將可能成為基因組分析和作物基因組育種的標準,在這個(gè)意義上,這篇論文是奠基性的(foundational)”。
另一篇論文中,他們首次解析了二倍體馬鈴薯的泛基因組,研究了茄科茄屬(Genus Solanum)的物種進(jìn)化,破解了馬鈴薯如何結薯的分子機制,并為雜交馬鈴薯育種改良提供了豐富的遺傳變異信息?!蹲匀弧吠诎l(fā)表的觀(guān)點(diǎn)性文章指出,組裝數量如此之多的異交和高雜合馬鈴薯高質(zhì)量基因組,是一項非凡的成就(remarkable feat)。泛基因組全面鑒定了參與重要生物學(xué)過(guò)程的基因,能夠賦能馬鈴薯育種。
意味著(zhù)更準確更詳盡
“在一個(gè)物種內,有些基因是某些個(gè)體所特有的。比如任意兩個(gè)番茄所含有的基因是不完全相同的,基因不同可能導致口感不同。” 論文通訊作者黃三文在接受《中國科學(xué)報》采訪(fǎng)時(shí)解釋道,番茄有很多品種,如大果番茄、櫻桃番茄和醋栗番茄等,如果只是用大果番茄的參考基因組進(jìn)行研究,那其中不會(huì )包含櫻桃番茄和醋栗番茄特有的基因組信息。
黃三文說(shuō),把一個(gè)物種所有的基因都找到,并按照順序排列,就形成了泛基因組。而圖泛基因組 (graph pangenome)是借助數學(xué)和計算機中被稱(chēng)為圖(graph)的數據結構來(lái)展示一個(gè)物種所有的基因排列和結構。
論文第一作者、基因組所副研究員周姚告訴《中國科學(xué)報》,由于泛基因組比單一參考基因組更加準確和詳盡地代表了整個(gè)物種的遺傳多樣性,而詳盡和準確的變異對下游的遺傳學(xué)分析提供了完美的基礎,所以借助泛基因組做研究不容易漏掉重要的基因和信息。
“此前有很多作物都獲得了泛基因組圖譜,如水稻、玉米、小麥、大麥、棉花、番茄、油菜等。這次我們首次獲得了番茄的圖泛基因組,并第一次完成了二倍體馬鈴薯的泛基因組。”黃三文說(shuō)。
在關(guān)于番茄圖泛基因組的研究中應用了“圖”這個(gè)概念。“圖是數學(xué)和計算機科學(xué)中一種常見(jiàn)的數據結構。已有研究發(fā)現,利用該數據結構整合泛基因組,可以減少單一基因組帶來(lái)的參考基因組偏差問(wèn)題。”周姚說(shuō),為了構建一個(gè)準確的圖泛基因組,他們首先利用高準確率的三代測序技術(shù)重新組裝了骨架基因組,其組裝質(zhì)量在完整性、連續性和準確性等指標上均優(yōu)于之前的版本。
隨后,他們選取了31份具有代表性的番茄材料進(jìn)行了組裝,并鑒定出相關(guān)的遺傳變異;在整合已公布的結構變異和短片段測序信息后,最終構建了來(lái)自838個(gè)番茄基因組的圖泛基因組。
法國農業(yè)科學(xué)研究院研究員Mathilde Causse認為,圖泛基因組資源對番茄遺傳和基因組研究非常重要,促進(jìn)了后續的基因定位。這篇文章將成為番茄研究領(lǐng)域里的基石。
二倍體馬鈴薯泛基因組論文的第一作者、基因組所博士生唐蝶告訴《中國科學(xué)報》,為了獲得高質(zhì)量的二倍體馬鈴薯泛基因組,他們挑選了地方栽培種、野生種、近緣野生種等44份具有代表性的二倍體馬鈴薯種質(zhì)進(jìn)行了重測序和基因注釋?zhuān)罱K完成了第一個(gè)二倍體馬鈴薯泛基因組。
審稿人評價(jià)說(shuō),馬鈴薯泛基因組的構建和分析結果令人印象深刻。這項研究展示了基于廣泛選材的“馬鈴薯組”和“類(lèi)馬鈴薯組”泛基因組學(xué)的力量,能為其他作物泛基因組研究提供參考方法。
好吃的番茄:找回“丟失的遺傳力”
黃三文告訴記者,作物的性狀由遺傳因素和環(huán)境因素的共同作用而決定??茖W(xué)家用“遺傳力”這個(gè)概念表示一種作物的性狀受遺傳調控的比例。遺傳力越高,說(shuō)明性狀的決定過(guò)程中遺傳因素占比越大,環(huán)境因素占比越小。
在未來(lái)的作物育種中,基因組選擇技術(shù)將被廣泛應用。當番茄還是幼苗的時(shí)候,就對它的基因組進(jìn)行測序,以此來(lái)預測它是否抗病、產(chǎn)量如何、好吃不好吃等。
然而,現在的預測還不是很準。“這是因為調控上述復雜性狀的基因有很多,有些基因的作用明顯,其遺傳力容易被檢測到;而另一些基因的作用比較微弱,這些基因難于檢測到的遺傳力被稱(chēng)為‘丟失的遺傳力’。”黃三文說(shuō),“遺傳力丟失”是一個(gè)經(jīng)典的數量遺傳學(xué)問(wèn)題,即通過(guò)遺傳標記估計的遺傳力以及通過(guò)全基因組關(guān)聯(lián)分析(GWAS)發(fā)現的所有相關(guān)基因所貢獻的遺傳力總和均低于實(shí)際的遺傳力。
“找回這些丟失的遺傳力,將有助于理解復雜性狀的遺傳機制。”周姚說(shuō),遺傳力是研究基因型與表型相關(guān)性的基礎,如何更準確和系統地找到更多的決定表型的遺傳變異是作物育種中的基礎問(wèn)題。無(wú)論是分子標記輔助育種還是分子設計精準育種,都需要大量的已知功能的遺傳變異來(lái)指導品種選擇或改良。

受訪(fǎng)者供圖
“目前認為遺傳力丟失的主要原因有以下幾個(gè):遺傳標記與真實(shí)影響表型的基因之間存在著(zhù)不完全連鎖,導致模型估計產(chǎn)生偏差;稀有等位基因的貢獻不易被察覺(jué);某個(gè)基因的不同突變表現出相同的表型使得遺傳分析遺漏;基因與基因的互作和基因與環(huán)境的互作增加了分析的復雜性。傳統短片段測序可對長(cháng)度較小的變異進(jìn)行鑒定,但對復雜結構變異的檢測能力較差,無(wú)法全面評估復雜結構變異對遺傳力的具體影響。”論文共同第一作者、基因組所張智洋說(shuō)。
此前,在人類(lèi)中遺傳力丟失問(wèn)題研究最為豐富。但受限于技術(shù),這些研究主要關(guān)注單核苷酸變異與表型之間的聯(lián)系,而忽視了更多的隱藏的大結構變異對表型的影響。
由于番茄的遺傳資源豐富,其馴化歷史、表達調控以及風(fēng)味代謝方面都已有了相關(guān)的研究基礎,為進(jìn)一步研究遺傳力丟失奠定了基礎。
論文共同第一作者、基因組所鮑志貴說(shuō),通過(guò)構建番茄圖泛基因組,他們的研究準確鑒定了番茄基因組中的結構變異,并發(fā)現大的結構變異是遺傳力丟失的關(guān)鍵原因之一,為遺傳力丟失問(wèn)題提供了新的解決思路。
進(jìn)一步研究發(fā)現,與利用單一參考基因組相比,基于圖泛基因組的遺傳變異可將估計的遺傳力提高24%,展現了圖泛基因組在找回“丟失的遺傳力”上的重要作用。
以影響番茄產(chǎn)量和糖度的重要代謝物可溶性固形物為例,采用上述分析方法,該團隊共鑒定出2個(gè)潛在的與可溶性固形物含量高度相關(guān)的結構變異,可以用于未來(lái)的分子標記輔助選擇。通過(guò)對影響番茄風(fēng)味的33種代謝物進(jìn)行分析發(fā)現,利用全部的結構變異作為分子標記進(jìn)行基因組選擇的效果最佳。
因此,他們進(jìn)一步精心構建了一個(gè)包含近2.1萬(wàn)個(gè)結構變異的數據集。如果利用該數據集設計育種芯片,評估基因組選擇的準確率可能超過(guò)利用全部的單核苷酸多態(tài)性。
西湖大學(xué)教授楊劍長(cháng)期從事數量遺傳學(xué)研究。他在接受《中國科學(xué)報》采訪(fǎng)時(shí)說(shuō),遺傳力丟失的問(wèn)題不只局限在番茄里,它是各個(gè)物種,包括人類(lèi)中廣泛存在的數量遺傳學(xué)問(wèn)題。這篇論文“很好地利用番茄這個(gè)作物回答了這個(gè)廣義的普遍性問(wèn)題”。
該團隊通過(guò)圖泛基因組鑒定了大量結構變異后,提出了一個(gè)重要問(wèn)題:結構變異是否能解決遺傳力丟失的問(wèn)題?結果是肯定的。“結構變異的神秘面紗被揭開(kāi)了,它們才是遺傳力這輛‘汽車(chē)’的‘司機’,發(fā)揮著(zhù)主導作用,而簡(jiǎn)單變異可以說(shuō)是‘乘客’。”楊劍說(shuō),這篇論文將讓大家更加重視對結構變異的研究。
培育“優(yōu)薯”:破解結薯密碼
作為世界第三大主糧作物,傳統馬鈴薯栽培以四倍體為主,依靠薯塊無(wú)性繁殖。然而,四倍體遺傳分析復雜,育種不可積累;薯塊運輸成本高,易感染病蟲(chóng)害。
為徹底打破產(chǎn)業(yè)發(fā)展中的障礙,2017年,在農業(yè)農村部、深圳市和中國農科院的支持下,黃三文聯(lián)合國內外優(yōu)勢單位發(fā)起了“優(yōu)薯計劃”,旨在用基因組學(xué)和合成生物學(xué)指導馬鈴薯產(chǎn)業(yè)的綠色革命,即用二倍體替代四倍體,用雜交種子替代薯塊,對馬鈴薯育種和繁殖方式進(jìn)行顛覆性創(chuàng )新。
“馬鈴薯種質(zhì)資源豐富,自然界中70%的馬鈴薯是二倍體,其中大部分是野生材料,充分利用這些資源中的優(yōu)異性狀,有利于加快馬鈴薯的遺傳改良。此外,馬鈴薯無(wú)性繁殖方式對馬鈴薯基因組的影響以及薯塊形成的遺傳演化機制還沒(méi)有被充分解析。”黃三文說(shuō),目前已發(fā)表馬鈴薯的基因組序列只捕獲馬鈴薯有限的生物多樣性,不足以全面了解馬鈴薯基因組以用于育種指導。

約70%的馬鈴薯是二倍體。受訪(fǎng)者供圖
唐蝶介紹,在構建二倍體馬鈴薯泛基因組的同時(shí),他們還挑選了馬鈴薯姊妹類(lèi)群——類(lèi)馬鈴薯組(Section Etuberosum)的兩個(gè)種進(jìn)行基因組的組裝和注釋。同番茄一樣,Etuberosum也是馬鈴薯的近緣物種,其植株外型和馬鈴薯非常相似,也會(huì )形成地下分枝,不同的是Etuberosum不會(huì )產(chǎn)生薯塊。以往的分類(lèi)學(xué)研究關(guān)于馬鈴薯、番茄和Etuberosum的系統發(fā)生關(guān)系一直存在爭議。
“高質(zhì)量的基因組為解析馬鈴薯及近源物種的系統發(fā)生關(guān)系提供了契機。”唐蝶說(shuō),他們發(fā)現馬鈴薯與近源物種番茄、Etuberosum之間,以及馬鈴薯類(lèi)群內部,都存在廣泛的種間雜交和不完全譜系分選現象,說(shuō)明馬鈴薯類(lèi)群經(jīng)歷了復雜的演化歷史。
利用高質(zhì)量的泛基因組,他們發(fā)現相比于番茄和Etuberosum,馬鈴薯的抗病基因拷貝數明顯擴張。“我們推測,這是由于馬鈴薯依賴(lài)于生長(cháng)在土壤中的薯塊進(jìn)行無(wú)性繁殖,其相比于種子更容易受到病原菌的侵染。馬鈴薯的無(wú)性繁殖可能促使了抗病基因數量的擴張以應對病原菌對薯塊的侵染。”論文共同第一作者、基因組所博士生李宏博說(shuō)。
馬鈴薯類(lèi)群、番茄類(lèi)群和Etuberosum類(lèi)群是進(jìn)化距離很近的近緣物種,但只有馬鈴薯演化出了薯塊這一重要的生物學(xué)性狀。論文共同第一作者、基因組所博士后賈玉鑫說(shuō),Etuberosum和馬鈴薯都會(huì )產(chǎn)生地下分枝,但Etuberosum的地下分枝向上生長(cháng)發(fā)育成新的植株;而馬鈴薯的匍匐莖向下生長(cháng),并在頂端膨大形成薯塊;番茄不含有地下分枝,也不形成薯塊。“因此我們推測Etuberosum是薯塊形成的過(guò)渡態(tài)。”
通過(guò)對上述三者的多組學(xué)比較分析,該團隊鑒定到一個(gè)可能在薯塊發(fā)育過(guò)程中發(fā)揮關(guān)鍵作用的TCP轉錄因子。
進(jìn)一步地,他們在二倍體馬鈴薯中創(chuàng )制了上述轉錄因子的基因純合缺失突變體。表型觀(guān)察發(fā)現,相比于野生型,突變體匍匐莖頂端無(wú)法正常膨大形成薯塊,轉而發(fā)育成了側枝。“這證明該基因在薯塊發(fā)育的起始時(shí)期發(fā)揮關(guān)鍵作用。”論文共同第一作者、中國農科院蔬菜花卉所助理研究員張金喆說(shuō)。該基因被命名為薯塊身份基因。

馬鈴薯和不結薯種都存在地下分枝,前者發(fā)育成匍匐莖并在頂端膨大形成薯塊,后者向上生長(cháng)發(fā)育成新的植株。受訪(fǎng)者供圖
進(jìn)一步發(fā)現栽培馬鈴薯內部共線(xiàn)性缺失現象,這說(shuō)明栽培馬鈴薯材料中廣泛的遺傳多樣性。在對馬鈴薯進(jìn)行雜交育種時(shí),必須謹慎考慮這些共線(xiàn)性缺失片段,以及可能導致共線(xiàn)性缺失的大結構變異帶來(lái)的連鎖累贅等影響。他們發(fā)現,馬鈴薯基因組中存在很多大的結構變異,而馬鈴薯的無(wú)性繁殖方式很難將這些結構變異清除出去的。
其中,馬鈴薯3號染色體的倒位事件與薯塊中控制類(lèi)胡蘿卜素積累的基因緊密連鎖,在自交后代中該倒位區域重組率顯著(zhù)下降。這意味著(zhù)在育種中選擇黃肉薯塊這個(gè)重要的營(yíng)養性狀,就選擇了該倒位區間的所有基因,這可能帶來(lái)嚴重的連鎖累贅現象。
“水稻、玉米等作物是二倍體,用種子來(lái)繁殖,育種改良相對方便。我們平時(shí)吃到的馬鈴薯都是四倍體,塊莖繁殖,遺傳改良一直很慢。”上海師范大學(xué)生命科學(xué)學(xué)院教授、水稻基因組專(zhuān)家黃學(xué)輝告訴《中國科學(xué)報》,2021年《細胞》發(fā)表的黃三文團隊培育的第一代高純合的二倍體馬鈴薯自交系和雜交馬鈴薯品系“優(yōu)薯1號”改變了這種情況。
作為優(yōu)薯計劃的后續,充分挖掘二倍體馬鈴薯中的等位變異將是進(jìn)一步育種改良的關(guān)鍵。該團隊在高質(zhì)量馬鈴薯泛基因組基礎上,獲得了一些重要的基因功能線(xiàn)索,尤其是成功鑒定了馬鈴薯結薯的核心調控基因,發(fā)現其在薯塊發(fā)育過(guò)程中發(fā)揮關(guān)鍵作用。
“優(yōu)良的變異要怎樣聚合到新品種中?如何優(yōu)中選優(yōu)?這份成果獲得的大量遺傳多樣性信息將對未來(lái)二倍體馬鈴薯改良產(chǎn)生重要作用。”黃學(xué)輝說(shuō)。
瑞典斯德哥爾摩大學(xué)生態(tài)、環(huán)境與植物科學(xué)系Juanita Gutiérrez-Valencia和Tanja Slotte在《自然》同期發(fā)表的觀(guān)點(diǎn)性文章中說(shuō),該研究大大擴展了馬鈴薯的基因組資源,利用泛基因組鑒定的遺傳變異無(wú)疑會(huì )推進(jìn)其基礎和應用研究。
“了解與薯塊形成相關(guān)的基因可以幫助育種家選育高產(chǎn)馬鈴薯品種,而對抗病基因的全面分析使得從野生種中定向引入抗性基因成為可能,從而提高馬鈴薯的抗病性。”文中寫(xiě)道,該研究提供的組學(xué)信息資源將助力基因組學(xué)輔助育種。
該研究將為馬鈴薯研究供豐富的基因組大數據支持,加深對馬鈴薯重要生物學(xué)性狀的理解,有力地推動(dòng)雜交馬鈴薯育種,并加速馬鈴薯作為重要主糧作物的育種進(jìn)程。
相關(guān)論文信息:
https://doi.org/10.1038/s41586-022-04822-x
https: //doi.org/10.1038/s41586-022-04808-9
https://doi.org/10.1038/d41586-022-01419-2