1,ESTs和基因識別
EST技術最常見的用途是基因識別。傳統的全基因組測序並不是尋找基因的最有效的方法,它既昂貴又耗時。由於基因組中只有2%的序列編碼蛋白質,壹些科學家支持先對基因的轉錄產物進行大規模測序,即從真正編碼蛋白質的mRNA構建各種cDNA文庫,對文庫中的克隆進行大規模測序。Adams提出的表達序列標簽概念標誌著大規模cDNA測序時代的到來。雖然ests序列數據對不準確,最高準確率達97%,但實踐證明,EST技術可以大大加快新基因的發現和研究。Medzhitov等人通過果蠅體內的TOLL蛋白檢索了dbEST數據庫,該蛋白已被證明在成熟果蠅的抗真菌反應中起重要作用。通過同源分析,找到了相應的人同源EST(登錄號H48602),為下壹步研究人TOLL同源蛋白的功能提供了良好的條件。HMSH5基因與釀酒酵母MSH5有30%的同壹性,它與hMSH4特異性相互作用,hm sh4在減數分裂和精子發生中起壹定作用。因此,利用EST技術,我們可以跳過生物分類學的界限,從生物模型的公認基因中快速克隆更復雜的未知基因。生物之間在核苷酸水平上購買商品的差異阻礙了傳統的基於PCR的雜交或基因克隆策略,即使是密切相關的生物,如秀麗隱桿線蟲和布氏隱桿線蟲,它們在2000-5000萬年前才分化和形成。計算機對dbEST的數據庫篩選是壹種電子雜交實驗,提供了更廣泛的基因鑒定途徑,允許基因組之間的差異,使基因鑒定和新的基因克隆策略發生了革命性的變化,也提供了足夠大和復雜的基因數據庫。目前,無害環境技術的數量正以平均每月6.5438億+的速度增加。
2.ESTs和物理地圖構建
est在構建許多基於基因的人類和植物基因組物理圖譜中起著重要作用。在這種應用中,從ESTs發展而來的PCR或雜交分析可用於鑒定YACs、BACs或其它含有插入克隆的大片段的載體,這是構建基因組物理圖譜的基礎。通過將ESTs與基因組物理圖進行比較,我們可以識別出包含殘余基因序列的基因組區間,包括調節基因表達的DNA控制元件。通過分析這些元素,有可能獲得對基因功能的詳細了解。物理圖譜和遺傳圖譜之間的相互參照形成了具有更廣泛用途的綜合資源。在獲得這個綜合圖譜後,研究人員可以根據孟德爾的遺傳特征定位基因組區間內的相關基因,通過查詢基於ESTs的圖譜,可以獲得這個區間內所有基因的列表。這種綜合資源的使用取決於EST數據庫中基因的數量。目前,人和小鼠ESTs的不斷擴增,使其應用更加廣泛和方便。
3.ESTs和基因組序列註釋
EST數據庫並不完善,因為ESTS不能切割成單列序列位點,所以準確率只能達到97%。此外,ESTs存在表達偏倚,因為產生ESTs的cDNA是由組織中豐富的mRNA按壹定比例反轉錄而來的,所以發現EST數據庫中表達水平低,而表達水平高的基因過量存在於EST數據庫中。雖然可以通過富集初始mRNA或由其合成雙鏈cDNA來減少cDNA文庫,但cDNA文庫中仍然存在大量的高豐度cDNA克隆。因此,壹個理想的cDNA文庫必須消除或盡量消除多學科信息克隆的影響,這就涉及到cDNA文庫的預處理技術。歸壹化,減少與豐富編碼基因相關的cDNA數量;消減雜交,應用序列標記的cDNA來識別和去除文庫中的冗余突變,這些技術的發展使得基因識別更加依賴EST技術,甚至可以通過該技術獲得精確的基因組DNA序列。在華盛頓大學基因組測序中心和桑格中心的共同努力下,秀麗隱桿線蟲基因組6543.8+0億堿基對的測序工作已基本完成。因此,ESTs是壹系列基因搜索工具中不可或缺的壹部分,而這些工具都是基於基因組序列的。EST技術在基因組DNA序列上的其他應用還包括精確預測基因內含子和內含子排列、識別選擇性接合事件、識別異常基因組排列結構等。
醫生赤腳於2006年7月9日下午03: 58
4.est和“電子”基因克隆
計算機輔助基因克隆被稱為“sillcon克隆”,是與定位克隆和定位候選克隆策略並行的方法之壹,即通過生物信息學對EST序列進行延伸,獲得基因的部分或全長cDNA序列。EST數據庫的迅速擴大已經並將繼續導致識別和克隆新基因策略的革命性變化。
4.1EST序列采集
計算機輔助克隆的第壹步是獲得感興趣的EST。在dbest數據庫中查找EST最好的方法就是找到同源序列。標準是:長度≥100bp,同源性在50%以上85%以下。可以通過幾個萬維網圈使用BLAST檢索度來實現,其中最常用的有NCBI的eneBank(國家生物技術信息中心)、意大利Tigem的ESTmachine(包括EST提取器和EST匯編器)、THC(暫定人類共有序列)數據庫、ESTBlast檢索程序——通過英國人類基因組圖譜計劃資源中心(HGMP-RC)的服務器訪問。然後,將檢測的序列組裝成重疊群,並將該重疊群用作檢測的序列。重復BLAST檢索和序列組裝以延伸重疊的樣品系列,並重復上述過程,直到不再檢測到重疊的ESTs或重疊群序列不能延伸,有時可以獲得全長基因編碼序列。獲得這些EST序列數據後,測試它們與GeneBank核酸數據庫的相似性。如果馮有精確匹配的基因,將EST序列數據按照6個EST讀碼框翻譯成蛋白質,然後與蛋白質序列數據庫進行比對。基因分析的結果有三種:壹是已知基因,已經被人類識別和了解;第二種是以前沒有鑒定過的新基因;三是未知基因,這些基因之間沒有同源或異源基因匹配。新的和未知的基因將進壹步用於生物學研究。
4.2基因的電子定位
NCBI的電子PCR程序對基因的電子位置進行搜索,以確定EST序列上是否存在序列標簽位點(STS)。STS作為基因組中的單拷貝序列,是新壹代的遺傳標記系統,數量多,覆蓋密度高,平均達到每1kb壹個STS以上。通過將搜索到的STS與相應的染色體進行比較,可以將該序列定位在該染色體上。
4.3圖像克隆的獲取
通過基因組及其表達的整合分子分析(IMAGE)方案,通過免疫可以獲得許多對應於ESTs的cDNA克隆,這是對電子基因克隆的補充。圖像協議由美國LLNL國家實驗室主持,其目的是* * *在排列好的cDNA文庫中共享克隆重量。Merk &等大型EST測序項目;Cow公司投資的人類ESTs項目都加入了圖像協議。當研究人員通過另壹種途徑獲得部分基因序列,通過同源性搜索發現該片段與圖像方案中加入的EST序列高度同源時,可以免費獲得其原始克隆,並可以通過美國典型培養物保藏中心獲得,從而避免或減輕篩選全長基因的麻煩,集中精力進行基因的功能研究。
5.結論
人類基因組計劃已經進入後基因組時代,基因組學的研究已經從結構基因組學轉向功能基因組學。利用結構基因組學的共存數據,充分發揮EST技術的優勢,將為大規模的基因鑒定、克隆和表達分析提供前所未有的動力,為生物藥理學的作用提供廣闊的空間。