選育和推廣優質、多抗、抗逆、高產水稻新品種是實現我國糧食安全的重要途徑。目前大多數育種工作仍以表型選擇和育種者經驗為主,育種效率低;另壹方面,生物信息數據庫中積累的數據量極其龐大,但由於缺乏必要的數據集成技術,育種者可獲得的信息非常有限。水稻分子設計育種將在多個層次上研究水稻各組成部分的網絡互作行為和生長發育過程中環境響應的動態行為;然後利用各種“組學”數據,在計算機平臺上預測水稻的生長發育和外界反應行為;然後,根據具體的育種目標,構建品種設計藍圖;最後結合育種實踐,培育出符合設計要求的水稻新品種。
設計育種的核心是建立以分子設計為目標的育種理論和技術體系。通過多種技術的集成和整合,在從基因(分子)到整體(系統)的不同層面上對生物進行設計和操作,在實驗室中對育種方案中的各種因素進行模擬、篩選和優化,提出最佳親本選擇和後代選擇策略,實現從傳統的“經驗育種”向定向高效的“精準育種”的轉變。
1作物分子設計與育種基礎研究現狀及發展趨勢,
1.1生物信息學基因信息庫中的數據“爆炸”了
類型“增長”
1.2分子標記技術發展日新月異。
已經廣泛研究了1.3基因和QTL的作圖。
應用了1.4基因的電子定位和延伸。
我國發展分子設計育種的時機已經成熟。
模式植物擬南芥和水稻的全基因組測序使得植物基因組學研究從結構基因組學迅速發展到功能基因組學。在生物信息學的幫助下,基因組學和蛋白質組學可以幫助人們了解植物亞細胞的生理活動以及真核細胞在分子水平上是如何組織的。
為了實現其復雜的功能,各種“組學”將傳統生物學帶入了系統生物學的新時代,這種革命性的變化催生了分子設計的概念。目前很多研究機構都在做準備工作,向這個方向發展。美國農業部已經投資了十幾個研究機構。
各種作物的數據庫,而這些數據庫的整合將成為未來分子設計和育種的重要基礎。其他有影響的研究機構,如美國先鋒公司、澳大利亞昆士蘭大學和CSIRO、國際玉米小麥改良中心等,都做過基因型-表型建模、基因型-環境互作分析、育種模擬等方面的研究。
進行研究。2004年,中國水稻研究所提出了水稻基因設計育種的概念,即在水稻全基因組測序後,在明確主要農藝性狀功能的基礎上,通過對有利基因的切割和聚合,培育產量、米質和抗性均有突破的超級稻新品種。
目前我國開展分子設計育種的時機已經成熟,主要表現在以下四個方面。(1)中國擁有生物信息學的研究實力和技術。中國是世界上首次對水稻全基因組進行測序,並對水稻4號染色體進行精細測序的國家之壹。在測序過程中,生物信息學是完成序列組裝和分析的關鍵。能夠完成這些海量的測序任務,說明中國的生物信息學研究水平很高。此外,在從基因組序列、EST信息和全長cDNA序列中發現新的標記和基因方面也取得了壹些進展。(2)開展了虛擬分子育種。中國在利用分子數量遺傳學和計算機技術進行QTL制圖和QTL與環境關系的研究方面處於國際水平。國家高技術研究發展計劃(863計劃)資助了主要農作物虛擬育種研究,在回交育種、聚合物育種、雜種優勢預測、親本選擇的計算機模擬等方面取得了壹定進展。(3)具備建立大規模數據采集和處理系統的技術和經驗。中國國家農作物種質資源信息系統已經建立多年。目前系統中存儲了數千萬條數據,在大型數據庫的建立、完善和維護方面積累了豐富的經驗。(四)已具備基因圖譜、比較基因組學研究、等位基因多樣性研究等關鍵技術。我國作物基因定位的發展比國外晚,但近年來取得了很大的進展,涉及了各種重要作物的大部分重要性狀。利用DNA和蛋白質序列信息來繪制特定基因或基因類型的圖譜,在除水稻以外的其他作物中也得到了迅速發展。此外,我國開展了小麥種間和禾本科作物間的比較基因組學研究,取得了壹定進展,正在進行的等位基因多樣性研究也取得了初步成果。與國外同類研究相比,我們的差距主要存在於以下三個方面。(1)主要農藝性狀的基因發現和功能研究存在壹些不足。近十年來,我國利用分子標記在水稻、小麥、玉米等主要作物上開展了大量的基因(尤其是QTL)定位研究,積累了大量的遺傳信息。但這些信息仍處於碎片化狀態,缺乏集中、歸納和總結;對QTL效應、QTL的多個等位基因以及不同遺傳背景和環境條件下不同QTL間的互作研究不夠系統和全面,不利於QTL作圖成果轉化為實際育種效益。重要農藝性狀的遺傳基礎、形成機制和代謝網絡的研究還很缺乏,而這些正是分子設計育種的重要信息基礎。同時,缺乏具有自主知識產權的計算機軟件,限制了現有基因或QTL信息在實際育種中的應用。(2)與分子設計和育種相關的信息系統不完善。在國家高技術研究發展計劃(863計劃)和國家重點基礎研究發展計劃(973計劃)的大力支持下,主要農作物主要經濟性狀的遺傳研究取得了重大進展。國家已經啟動了水稻等主要糧食作物主要經濟性狀的功能基因組研究,但還遠未完全了解作物所有性狀的遺傳基礎。在我國現有的生物信息學數據庫中,具有明確功能和表達調控機制的基因信息相對匱乏;國際上在轉錄組學、蛋白質組學、代謝組學和表型學方面的研究差距較大,農作物種質資源信息系統中可以通過分子設計和育種直接應用的信息仍然有限。(3)分子設計育種的理論研究相對落後。目前,我國已經開始意識到分子設計育種將成為未來作物育種的發展方向,但大多還停留在概念上,分子設計育種的理論建模和軟件開發還沒有真正開展起來。
3 .我國作物分子設計和育種的研究重點
我國作物分子設計和育種的研究應著重於以下三個方面。通過高效挖掘π QTL構建水稻、小麥、玉米、大豆和棉花的高世代回交導入系,結合定向選擇消除復雜遺傳背景對π QTL定位精度的不利影響,從而高效挖掘種質資源中重要農藝性狀的π QTL。通過對不同輪回親本和供體親本配制的高世代回交組合的定位結果的分析比較,得到基因π QTL的信息,如壹因多效、同壹基因π QTL位點的多個等位基因、基因π QTL間的上位性互作、基因π QTL與遺傳背景的互作、基因π QTL與環境的互作等。高世代回交導入的遺傳背景高度純化,便於直接精細定位主效應大、表達穩定的π QTL。
建立核心種質與骨幹親本之間的遺傳信息鏈接。核心種質以最少的資源數量代表最大的遺傳多樣性,即盡可能保持最小的種群和最大的遺傳多樣性;骨幹親本在作物育種中應用廣泛,並取得了良好的育種效果,其中蘊含著大量有利的基因資源。通過探索這兩類材料中的遺傳信息,建立它們的分子設計育種信息系統和鏈接,可以快速獲得親本攜帶的基因及其與環境互作的信息,為分子設計育種模型提供信息支持,準確預測不同親本的雜交後代在不同生態環境中的表現。建立主要育種性狀的GP(基因型到表型)模型,描述不同的基因和基因型,以及基因和環境如何相互作用最終產生不同性狀的表型,從而識別出滿足不同育種目標和生態條件的目標基因型。因此,GP模型是分子設計育種的關鍵組成部分。GP模型利用挖掘出的基因信息提供的信息,核心種質和骨幹親本的遺傳信息鏈接,結合不同作物的生物學特性和不同生態區域的育種目標,模擬優化育種過程中的各項指標,預測不同親本的雜交後代產生理想基因型和選育優良品種的概率,大大提高育種效率。
分子設計育種的4個例子
Peleman和van der Voort註冊了術語“Breedingby design”。他們認為分子設計育種應分三步進行:(1)定位所有相關農藝性狀的QTL;(2)評估這些基因座的等位基因變異;(3)發展設計育種。這是我們對水稻的壹些研究結果。
結果顯示了分子設計育種的過程。
育種目標性狀的QTL研究
這壹過程包括構建作圖群體、篩選多態性標記、構建標記連鎖圖、評價數量性狀表型和QTL分析。有壹個包含65個染色體片段代換系(CSSL)的群體,產生該群體的兩個親本是粳稻Asominori(背景或輪回親本)和秈稻IR24(供體或非輪回親本)。每個CSSL包含壹個或幾個來自IR24的染色體片段,其余的染色體來自背景親本Asominori。所有供體染色體片段覆蓋了IR24的整個基因組,不同的染色體片段由不同的RFLP標記代表。根據粒長的觀測值,通過分析不同標記基因型間粒長的顯著差異,可以判斷哪些片段攜帶了影響粒長的QTL。QTL存在的可能性通常用LOD值來衡量(圖12A)。圖12A清楚地表明,標記M23和M34所代表的染色體片段含有控制粒長的QTL,分別占粒長表型變異的3619%和819%,因此可以認為是壹個主QTL,尤其是在M23染色體片段上。然而,這兩個QTL的加性效應方向相反(圖22 B),即對於標記M23上的QTL,來自IR24的等位基因增加了粒長,而來自Asominori的等位基因減少了粒長;對於標記M34上的QTL,來自IR24的等位基因降低粒長,而來自Asominori的等位基因增加粒長。
在實踐中,可以根據不同的研究目的選擇LOD臨界值來判斷QTL的存在。如果研究目的是克隆和分析QTL的功能,應選擇更高的LOD臨界值,如310或更高,以確定QTL的存在,避免假陽性。如果目的是預測基因型,假陽性不會對結果產生很大的負面影響。此時,可以選擇較低的LOD臨界值,如110,以確保影響較小的QTL也能被識別。在上面的例子中,當采用臨界值0183(對應於0105的顯著水平)時,我們鑒定了13個控制粒長的QTL和8個控制粒寬的QTL,還鑒定了壹些上位性QTL。
在結合育種目標設計目標基因型的過程中,我們利用已經鑒定的各種重要育種性狀的QTL信息,包括QTL在染色體上的位置、遺傳效應、QTL之間的互作、QTL與背景親本和環境的互作等。,模擬和預測各種可能基因型的表型,選擇符合特定育種目標的基因型。在我們的例子中,Asominori是壹個短粒寬粒品種,IR24是壹個長粒窄粒品種,但它們的CSSL後代在兩個性狀和四個方向上都與親本分離,所以兩個性狀的協同QTL和消減QTL應該分布在兩個親本中。通過對粒長的QTL作圖,發現染色體片段M6、M12、M14、M23和M25上的5個QTL具有正效應,即對於這些位點上的QTL,來自IR24的等位基因增加了粒長;對於粒寬,只有壹個QTL有正效應,表明大多數增加粒寬的基因來自Asominori。此外,還發現了壹些染色體片段,如M10、M12、M14和M23,它們攜帶控制粒長和粒寬的QTL。在M10片段中,QTL對粒長和粒寬有正效應。在其他片段中,QTL對粒長和粒寬有相反的影響。這與根據表型估計的相關系數r =- 0.34壹致。
根據以上信息可以預測各種可能基因型的表型(圖2),發現最小和最大粒長基因型的粒長分別為4.20 mm和6.21 mm,最小和最大粒寬基因型的粒寬分別為2.12 mm和3.07 mm。假設育種目標是長粒型和寬粒型,不可能獲得圖2中同時具有最大粒長和最大粒寬的基因型,因為有些QTL在兩個性狀上存在負的壹因多效。通過模擬,我們找到了壹個粒長6.05 mm,粒寬3.00 mm的設計基因型,接近最大粒長6.21 mm,最大粒寬3.07mm(圖2)。到目前為止,我們已經設計了壹種最符合長粒和寬粒型育種目標的基因型。
分析達到目標基因型的途徑
為了獲得圖2中設計的基因型,需要IR24的四個染色體片段,即M1、M6、M23和M25。在65個CSSL中,CSSL5含有片段M6;CSSL16包含片段M1和M23CSSL19包含片段M25因此,它可以作為親本材料來生產設計的基因型。但是CSSL19中包含了我們不需要的M12段,在選擇過程中需要用Asominori的段替換。
三親本間的三交(也叫頂交)組合可能聚合出我們需要的染色體片段,產生三交組合有三種方式,即三交組合1:(CSS l5×CSS l 16)×CSS l 19;三向組合2:(cssl 5×cssl 19)×cssl 16和三向組合3:(cssl 16×cssl 19)×cssl 5。假設使用標記輔助的方法來選擇目標基因型,有許多選擇,這裏只考慮其中的兩種。標記選擇方案1: 100個三交F1個體產生,每個個體產生30個F2個體,通過單粒傳遞* * *,產生3 000個F8家系,然後選擇目標基因型;標記選擇方案二:產生100個三重F1個體,通過標記輔助選擇只選擇含有目標染色體片段的個體,每個選擇的個體產生30個F2個體,通過單粒傳遞產生F8家系,然後選擇目標基因型。上述過程是通過遺傳育種模擬工具QuCim實現的。對於每個三向組合,通過兩種標記選擇方案獲得的F8家族系數是相等的(表1)。從三交1,三交2得到2365,438+08,三交3得到165,438+08,平均得到765,438+06個目標基因型的F8家系(表1)。然而,從兩個標記選擇方案1來看,每個選擇的F8家系要測試的DNA樣品數是395,而對於標記選擇方案2,這個數字只有60。因此,包括兩個標記選擇階段的方案2可以大大降低基因聚合過程中實驗室標記確定的成本。不同的三向組合獲得目標基因型的概率顯著不同。
不壹樣。三路組合2的概率最高,達到0181%,組合1的概率最低,只有0125%。因此,三向組合2和標記選擇方案2的組合是實現目標基因型的最佳途徑。分子設計育種的展望作物分子設計育種是壹種新概念,它以生物信息學、基因組學和蛋白質組學為基礎,在作物育種過程中,整合作物遺傳學、生理學、生物化學、栽培學和生物統計學等所有學科的有用信息,根據特定作物的育種目標和生長環境,在計算機上設計出最佳方案,進而進行作物育種實驗的分子育種方法。與常規育種方法相比,作物分子設計育種首先在計算機上模擬實現,考慮的綜合因素越來越多,選擇的親本組合和選擇途徑更加有效,能夠滿足育種需要,大大提高育種效率。值得指出的是,分子設計育種在未來的實施過程中將是壹個結合了分子生物學、生物信息學、計算機科學、作物遺傳學、育種學、栽培學、植保學、生物統計學、土壤學、生態學等學科的系統工程。作物分子設計育種是壹個綜合性的新研究領域,將對作物育種理論和技術的未來發展產生深遠的影響。因此,應抓住機遇,充分利用植物基因組學、生物信息學等前沿學科的重大成果,及時開展品種分子設計的基礎理論研究和技術平臺建設。實現分子設計育種的目標,將大大提高作物育種的理論和技術水平,帶動傳統育種向高效、定向發展。