高通量測序技術(shù)技術(shù)的應(yīng)用及前景
高通量測序技術(shù)是對(duì)傳統(tǒng)測序一次的改變, 一次對(duì)幾十萬到幾百萬條DNA分子進(jìn)行序列測定, 因此在有些文獻(xiàn)中稱其為下一代測序技術(shù)(next generation sequencing)足見其劃時(shí)代的改變, 同時(shí)高通量測序使得對(duì)一個(gè)物種的轉(zhuǎn)錄組和基因組進(jìn)行細(xì)致全貌的分析成為可能, 所以又被稱為深度測序(deep sequencing). 高通量測序平臺(tái)的代表是羅氏公司(Roche)的454測序儀(Roch GS FLX sequencer), Illumina公司的Solexa基因組分析儀(Illumina Genome Analyzer)和ABI的SOLiD測序儀(ABI SOLiD se-quencer). 2008年4月Helico BioScience公司的Timothy等人在Science上報(bào)道了他們開發(fā)的真正的單分子測序技術(shù), 并利用該技術(shù)對(duì)一個(gè)M13病毒基因組進(jìn)行重測序. 這項(xiàng)技術(shù)之所以被稱為真正的單分子測序, 是因?yàn)樗邕^了上述3種高通量測序依賴的基于PCR擴(kuò)增的信號(hào)放大過程, 真正達(dá)到了讀取單個(gè)熒光分子的能力, 向1000美元測定一個(gè)人類基因組的目標(biāo)邁出了一大步.
這些平臺(tái)共同的特點(diǎn)是的測序通量, 相對(duì)于傳統(tǒng)測序的96道毛細(xì)管測序, 高通量測序一次實(shí)驗(yàn)可以讀取40萬到400萬條序列. 讀取長度根據(jù)平臺(tái)不同從25堿基到450堿基, 不同的測序平臺(tái)在一次實(shí)驗(yàn)中, 可以讀取1G到14G不等的堿基數(shù), 這樣龐大的測序能力是傳統(tǒng)測序儀所不能比擬的.
高通量測序的應(yīng)用
高通量測序可以幫助研究者跨過文庫構(gòu)建這一實(shí)驗(yàn)步驟, 避免了亞克隆過程中引入的偏差. 依靠后期強(qiáng)大的生物信息學(xué)分析能力, 對(duì)照一個(gè)參比基因組(reference genome)高通量測序技術(shù)可以非常輕松完成基因組重測序(re-sequence), 2007年van Or-souw等人[56]結(jié)合改進(jìn)的AFLP技術(shù)和454測序技術(shù)對(duì)玉米基因組進(jìn)行了重測序, 該重測序?qū)嶒?yàn)發(fā)現(xiàn)的超過75%的SNP位點(diǎn)能夠用 SNPWave 技術(shù)驗(yàn)證, 提供了一條對(duì)復(fù)雜基因組特別是含有高度重復(fù)序列的植物基因組進(jìn)行多態(tài)性分析的技術(shù)路線. 2008年Hillier對(duì)線蟲CB4858品系進(jìn)行Solexa重測序, 尋找線蟲基因組中的SNP位點(diǎn)和單位點(diǎn)的缺失或擴(kuò)增. 但是也應(yīng)該看到, 由于高通量測序讀取長度的限制, 使其在對(duì)未知基因組進(jìn)行從頭測序(de novo sequencing)的應(yīng)用受到限制, 這部分工作仍然需要傳統(tǒng)測序(讀取長度達(dá)到850堿基)的協(xié)助. 但是這并不影響高通量測序技術(shù)在全基因組mRNA表達(dá)譜, microRNA表達(dá)譜, ChIP-chip以及DNA甲基化等方面的應(yīng)用.
2008年Mortazavi等人對(duì)小鼠的大腦、肝臟和骨骼肌進(jìn)行了RNA深度測序, 這項(xiàng)工作展示了深度測序在轉(zhuǎn)錄組研究上的兩大進(jìn)展, 表達(dá)計(jì)數(shù)和序列分析. 對(duì)測得的每條序列進(jìn)行計(jì)數(shù)獲得每個(gè)特定轉(zhuǎn)錄本的表達(dá)量, 是一種數(shù)碼化的表達(dá)譜檢測, 能檢測到豐度非常低的轉(zhuǎn)錄本. 分析測得的序列, 有大于90%的數(shù)據(jù)顯示落在已知的外顯子中, 而那些在已知序列之外的信息通過數(shù)據(jù)分析展示的是從未被報(bào)道過的RNA剪切形式, 3′末端非翻譯區(qū), 變動(dòng)的啟動(dòng)子區(qū)域以及潛在的小RNA前體, 發(fā)現(xiàn)至少有3500個(gè)基因擁有不止一種剪切形式. 而這些信息無論使用芯片技術(shù)還是SAGE文庫測序都是無法被發(fā)現(xiàn)的. 同年Sugarbaker利用mRNA深度測序?qū)盒孕啬ち龊蛯?duì)照樣品進(jìn)行比較, 發(fā)現(xiàn)了腫瘤中存在的15個(gè)不同的點(diǎn)突變.
高通量測序另一個(gè)被廣泛應(yīng)用的領(lǐng)域是小分子RNA或非編碼RNA(ncRNA)研究. 測序方法能輕易的解決芯片技術(shù)在檢測小分子時(shí)遇到的技術(shù)難題(短序列, 高度同源), 而且小分子RNA的短序列正好配合了高通量測序的長度, 使得數(shù)據(jù)“不浪費(fèi)”, 同時(shí)測序方法還能在實(shí)驗(yàn)中發(fā)現(xiàn)新的小分子RNA. 在衣藻、斑馬魚、果蠅、線蟲、人和黑猩猩中都已經(jīng)成功地找到了新的小分子RNA. 在線蟲中獲得了40萬個(gè)序列, 通過分析發(fā)現(xiàn)了18個(gè)新的小RNA分子和一類的小分子RNA, 通過對(duì)人胚胎干細(xì)胞發(fā)育前后的分析, 獲得了334個(gè)小RNA的表達(dá)譜帶, 包括新發(fā)現(xiàn)的104個(gè)小RNA.
在DNA-蛋白質(zhì)相互作用的研究上, 染色質(zhì)免疫沉淀-深度測序(ChIP-seq)實(shí)驗(yàn)也展示了其非常大的潛力. 染色質(zhì)免疫沉淀以后的DNA直接進(jìn)行測序, 對(duì)比ref seq可以直接獲得蛋白與DNA結(jié)合的位點(diǎn)信息, 相比ChIP-chip, ChIP-seq可以檢測更小的結(jié)合區(qū)段、未知的結(jié)合位點(diǎn)、結(jié)合位點(diǎn)內(nèi)的突變情況和蛋白親合力較低的區(qū)段. 2007年Johnson等人用ChIP-seq 對(duì)轉(zhuǎn)錄因子NRSF在DNA上的結(jié)合位點(diǎn)進(jìn)行了全基因組的篩查, 獲得了1946個(gè)結(jié)合位點(diǎn), 小能分辨的結(jié)合位點(diǎn)為50個(gè)堿基, 這些高質(zhì)量的ChIP-seq結(jié)果提供了研究新的DNA-蛋白相互作用的內(nèi)容, 其中包括了胰島發(fā)育調(diào)控網(wǎng)絡(luò)中的重要轉(zhuǎn)錄因子. 同年Robertson等人用同樣的方法檢測轉(zhuǎn)錄因子和基因組DNA的結(jié)合情況. 這兩項(xiàng)研究同時(shí)驗(yàn)證了以往用ChIP-chip實(shí)驗(yàn)檢測到的結(jié)合位點(diǎn), 同時(shí)發(fā)現(xiàn)新的結(jié)合位點(diǎn), Robertson等人發(fā)現(xiàn), ChIP-seq的分辨率可達(dá)40堿基. 2008年Chen等人在Cell上發(fā)表論文, 用ChIP-seq檢測了Nanog, Oct4, STAT3, Smad1, Sox2等13個(gè)序列特異性的轉(zhuǎn)錄因子與基因組DNA的結(jié)合情況, 這些轉(zhuǎn)錄因子都是LIF和BMP途徑的重要調(diào)控分子. 這些轉(zhuǎn)錄因子在ES細(xì)胞里結(jié)合位點(diǎn)為我們揭示了ES細(xì)胞內(nèi)決定ES細(xì)胞發(fā)育方向的調(diào)控網(wǎng)絡(luò).
5基因芯片和高通量測序技術(shù)的應(yīng)用前景
高通量測序技術(shù)雖然建立的時(shí)間不長, 但是在基因組的各個(gè)研究領(lǐng)域都顯示出其非凡的魅力, 而且日益顯示出其對(duì)基因芯片“取而代之”的咄咄態(tài)勢. 那么, 基因芯片向何處去呢?
基因芯片技術(shù)經(jīng)過近15年的發(fā)展已經(jīng)形成了一個(gè)系統(tǒng)的平臺(tái), 從樣品制備、芯片制作、芯片雜交、數(shù)據(jù)掃描到后期的數(shù)據(jù)管理, 儲(chǔ)存以及深度數(shù)據(jù)挖掘都有了標(biāo)準(zhǔn)化的流程、堅(jiān)實(shí)的理論和實(shí)驗(yàn)的支持, 成為一個(gè)非常穩(wěn)定可信的實(shí)驗(yàn)技術(shù), 為廣大的研究者所運(yùn)用, 同時(shí)也積累了龐大的公共數(shù)據(jù)庫. 深度測序要建立這樣的一個(gè)體系同樣需要若干年的完善. 芯片雜交結(jié)果直觀, 分析快速, 適合對(duì)生物學(xué)樣品進(jìn)行已知信息的檢測, 同時(shí)芯片數(shù)據(jù)分析有成熟完整的理論, 為后期數(shù)據(jù)分析提供強(qiáng)大的支持.
基因芯片的缺點(diǎn), 就在于它是一個(gè)“封閉系統(tǒng)”, 它只能檢測人們已知序列的特征(或有限的變異). 而深度測序的強(qiáng)項(xiàng), 就在于它是一個(gè)“開放系統(tǒng)”, 它的發(fā)現(xiàn)能力和尋找新的信息的能力, 從本質(zhì)上高于芯片技術(shù). 研究者可以充分享受這兩個(gè)平臺(tái)的比較優(yōu)勢,在獲取新信息的基礎(chǔ)上, 利用芯片的強(qiáng)項(xiàng), 即對(duì)已知信息的高通量、低成本(相對(duì))的檢測能力, 對(duì)樣品進(jìn)行快速檢測, 短時(shí)間內(nèi)獲得有有效的數(shù)據(jù).
作為兩個(gè)高通量的基因組學(xué)研究技術(shù), 在應(yīng)用的某些方面存在重疊和競爭, 但是在更多方面是優(yōu)勢互補(bǔ), 兩種方法聯(lián)合使用, 將解決以前的單種技術(shù)難以解決的問題. 如Euskirchen等人同時(shí)用ChIP- chip和ChIP-seq對(duì)STAT1的結(jié)合位點(diǎn)進(jìn)行了檢測, 結(jié)果非常有趣, 兩種技術(shù)對(duì)于強(qiáng)陽性的區(qū)段具有非常好的相關(guān)性, 而對(duì)于一些弱的結(jié)合位點(diǎn), ChIP-chip和ChIP-seq都會(huì)丟失部分信息, 而一種方法丟失的信息又恰好能被另一種方法所檢出, 完整的數(shù)據(jù)是來自兩部分的整合. 同樣的情況也發(fā)生在mRNA表達(dá)譜檢測上, 一種技術(shù)能彌補(bǔ)另一種技術(shù)遺漏的部分. 因此對(duì)一個(gè)生物學(xué)問題的回答需要不同實(shí)驗(yàn)技術(shù)的協(xié)同配合. 例如目前新興的Target sequencing 或者叫做序列捕獲, Sequence Capture, 技術(shù), 就是結(jié)合了芯片和深度測序, 利用芯片探針捕獲待測片段, 再用深度測序技術(shù)分析核酸序列, 利用高密度芯片和454測序儀曾成功的捕獲了6726個(gè)500堿基長度的外顯子和200 kb到5 Mb的DNA區(qū)段, 測序結(jié)果顯示大多數(shù)的捕獲DNA是符合設(shè)計(jì)要求的目的片段, 該實(shí)驗(yàn)驗(yàn)證了序列捕獲的特異性和可行性, 芯片的序列捕獲技術(shù)將來有可能在對(duì)基因組區(qū)段測序的研究中取代多重PCR過程. 芯片這種高通量技術(shù)顯示出其在樣品選擇和富集方面的優(yōu)勢和潛力.
隨著科學(xué)技術(shù)的, 能不斷地給一項(xiàng)技術(shù)帶來新的增長點(diǎn), 基因芯片和深度測序是點(diǎn)雜交技術(shù)和測序的高通量革命, 兩大分子生物學(xué)經(jīng)典實(shí)驗(yàn)技術(shù)都發(fā)展到了高通量的時(shí)代, 正如他們以前對(duì)生命科學(xué)研究所做出的貢獻(xiàn)一樣, 今后這兩大技術(shù)必將繼續(xù)協(xié)同配合推動(dòng)生命科學(xué)研究進(jìn)入新的紀(jì)元.