生物芯片與第二代測序技術是兩種重要的高通量基因組學研究方法,在生命科學研究領域有著極其廣泛的應用前景。經(jīng)過近20年的發(fā)展,生物芯片技術逐漸成熟,正在向著“高密度,靈活定制,微量樣品”的方向發(fā)展,從一個實驗室技術發(fā)展成一個基因組學研究所依賴的,快速產(chǎn)生海量數(shù)據(jù)的常規(guī)手段,正在逐步走向產(chǎn)業(yè)化。第二代測序技術是最近幾年建立的高通量技術,其特點是一次測序反應可以產(chǎn)生千萬到億條序列,而測序的成本大大降低,到2010年已經(jīng)進入數(shù)千美元測定一個人全基因組的時代。
那么,二代測序會不會取代芯片技術呢?是不是Sanger測序(一代測序不用了呢)?下面主要針對在一個帖子上發(fā)的問題總結一下,主要討論二代測序與基因芯片的區(qū)別與優(yōu)缺點:
討論 1 二代測序與基因芯片的區(qū)別與優(yōu)缺點。
生物芯片與第二代測序都是基因組學研究的重要手段。經(jīng)過近20多年的發(fā)展,生物芯片相對第二代測序而言,優(yōu)勢在于價格便宜,便于分析。缺點則在于必須有參考序列(因為生物芯片的探針設計就是根據(jù)參考序列設計的)。當然還有很多技術上的優(yōu)缺點,這里主要討論他們的本質,來消除很多人對于二者的誤解,認為基因芯片被二代測序取代至少在目前看來還是比較片面的。
相同點:
高通量和一些應用領域上的重合(比如表達譜,SNP)
不同點:
1.本質不同:
基因芯片的本質是核酸雜交。只不過是同時進行上萬個核酸雜交而已;第二代測序在本質上是PCR.先用PCR的方法構建測序文庫(SOLiD的油包水PCR,Solexa的橋式PCR),隨后再以“邊合成邊測序”或者“連接介導的測序”,得到序列信息。
2.應用不同:
由于是核酸雜交,不需要擴增。因此基因芯片是個相對封閉的系統(tǒng),只能檢測序列已知的片段的濃度;另外,由于不需要擴增,保真性也較好。第二代測序本質上是測序,因此是個開放的系統(tǒng),能檢測到那些沒有參考序列的片段,并且給出序列。由于在構建測序文庫的過程中有PCR放大的過程,因此相對靈敏度較高(需要高覆蓋倍數(shù)的測序深度配合),但也由于PCR放大過程的不均衡性,樣品中片段的內在濃度比例常常會被破壞掉。所以:
(1)microarray不能發(fā)現(xiàn)新序列,而NGS可以發(fā)現(xiàn)一些以前沒有檢測到的基因。![[轉載]microarray和二代測序(NGS)的區(qū)別 ngs測序技術](http://img.aihuau.com/images/01111101/01010440t01d1f4518942624a34.jpg)
(2)由于NGS本質上還是PCR,在建庫的過程中樣本被擴增上千倍,因此樣本中基因的量的線性關系會有所偏差。因此NGS定量不是很好。如果想檢測基因的表達量,還是用microarray的好。
因此,基因芯片和第二代測序技術在應用上雖然有交集,但還是有差別的。如果是比較參考序列良好的物種的表達譜,基因芯片好一些,而且基因芯片發(fā)展成熟,后續(xù)數(shù)據(jù)分析較方便。而如果想發(fā)現(xiàn)新的轉錄本,或者研究基因表達的可變剪接,3’UTR的變化等等,還是用第二代測序的好。我們現(xiàn)在傾向于認為基因芯片和第二代測序技術是兩種不同的技術,兩者有交集,但更多的是不同。至于選擇哪種技術,還是要看具體想解決的問題是什么。簡而言之,如果是想發(fā)現(xiàn)新東西,做探索性的實驗,用NGS好些。如果研究對象是那些已知的東西,對定量的準確度要求很高,那么還是microarray的好。還有很多研究當基因組信息未知的時候,先用NGS測序全基因組序列,再用microarray進行分析。
討論 2.Sanger與二代測序的比較
一下問題我想用在一個網(wǎng)站(后面有鏈接)上的帖子來說明。帖子挺好的,建議大家看看
問題:現(xiàn)在有幾株噬菌體需要測序,不知道選用哪種方法好。一類是傳統(tǒng)的sanger法,另一類是solexa。如果用solexa測的話,小基因組可能會有比較多的gaps,拼接效果沒有sanger法好,但是費用低。我們的噬菌體基因組在100kb左右。請問我選用哪種方法好呢?謝謝!
答:如果你只有一株噬菌體的話,我建議你用Sanger法測序。100Kb的基因組很小,保守假設Sanger法測序每次能測500bp,那么理論上只需200次就可以覆蓋一次基因組了,而且數(shù)據(jù)質量好,價格也不貴。
但是,如果你有好幾株噬菌體的話,我還是建議你用第二代測序,因為可以設置Barcode,好幾株噬菌體一起測序,這樣測序的費用會大大降低。但是如果是denovo 測序的話都存在需要用sanger法補gap的可能性。
討論 3.關于二代測序的幾種方法
問題1.我想問下各個基因組測序方法之間的區(qū)別是什么?例如solex和denovo測序法。
答: Solexa并不是一種測序方法,而是一種第二次測序儀器。
目前,第二代測序的儀器主要有3家:(1)Roche 454 Genome Sequencer FLX;(2)IlluminaGenome Analyzer IIx (Solexa);(3)ABISOLiD3。當然Illumina和ABI現(xiàn)在都已經(jīng)發(fā)布了新的測序儀,分別是Hiseq 2000和SOLiD4。
關于測序方法,則主要是以下幾類:
1、De novo測序:即從頭測序,不需要任何現(xiàn)有的序列資料就可以對某個物種進行測序,利用生物信息學分析手段對序列進行拼接,組裝,從而獲得該物種的基因組圖譜。
2、基因組重測序:對有Reference Sequence的物種進行測序,尋找基因差異。
3、轉錄組測序:對轉錄組(RNA)進行測序。
此外,還有第二代測序與其它技術相結合,還有ChIP-Seq;甲基化測序等。
問題2.我是在讀碩士,老板說我的課題方向做某種微生物的全基因組測序。但該生物的基因NCBI上,還有必要測嗎?如果要測,請問我要提供什么樣品?量為多少?測序后的拼接是你們做還是我們自己做?測完后可以做什么分析?做這種低等生物的全基因組測序,周期大概多長?
答:如果已經(jīng)存在參考序列,那么再測一次就叫做重測序(re-sequence)。重測序的話,可以發(fā)現(xiàn)基因組的改變,一些SNV,smallindel等。這些都很有意義。
例如:研究某種微生物的耐藥性。那么可以將已經(jīng)產(chǎn)生耐藥性的菌株重測序,與參考相比較,發(fā)現(xiàn)有哪些基因發(fā)生改變,那些基因可能正是耐藥性產(chǎn)生的根源。
如果要測序的話,提供DNA就可以了,5微克應該夠了。測序后的拼接和數(shù)據(jù)分析,上海伯豪都有專門的生物信息學團隊完成。測序周期的話要根據(jù)測序量來定。
問題3.請問如果要對人類的腫瘤組織進行全基因組測序,是進行de novo 還是Re-Sequence?人類的全基因組測序結果已經(jīng)公布(千人基因組),但是腫瘤組織每種腫瘤、不同病理類型、不同種族差異很大。
答:對人類樣本測序都是Re-Sequence。因為已經(jīng)有參考序列,在NGS中,參考序列的意義是搭建一個框架,然后NGS得到的數(shù)據(jù)就可以根據(jù)這個框架搭建上去(拼接)。
雖然不同的個體,不同的腫瘤組織基因組序列不同,但是框架是一樣的。NGS得到的數(shù)據(jù)依靠框架重新拼接起來,就可以得到各個組織獨特的基因組序列。
討論 4.關于SNP和GWAS
問題1.如果我要對一個病人的家系做全基因組測序,以探求其可能的致病基因,應該用什么樣的方法比較好?做GWAS都有什么儀器?羅氏454是不是其中一種?
答:GWAS(全基因組連鎖分析)是指比較病人群體和正常人群體之間的基因、外顯子或SNP差異,從而找到致病基因的技術路線,目前比較流行。您對家系的研究不算GWAS。GWAS是散發(fā)型的Case/control的研究,一般樣本量大于800例。您對家系的研究,應該算是連鎖分析(linkage),需要至少垂直三代的數(shù)據(jù)。但是比GWAS還是少得多。目前比較病人群體與正常人群體之間的差異,一般有第二代測序(NGS)和生物芯片(microarray)兩類。
NGS:基因組重測序(比較基因組差異);外顯子捕獲測序(比較外顯子編碼差異)。
microarray:SNP芯片(比較SNP差異);CGH芯片(比較基因組結構差異)
你所說的羅氏454是第二代測序的一種,可以用來做連鎖分析。但是羅氏454費用較高,一般不推薦。一般推薦ABISOLiD,因為您的研究對象是人,參考序列良好,而SOLiD測序準確率高。
問題2.根據(jù)NCBI上可以得到線蟲的SNP,我從一顆樹上取下一推線蟲(由于線蟲太小,無法分離)來提取基因組,想通過再測序知道我的樣本中SNP是否與數(shù)據(jù)庫一致,另外還想知道SNP發(fā)生的頻率是多少。請問哪種方法可以得到我想要的結果呢?
答:你的樣本實際上是一個線蟲基因組DNAPool。這樣的樣本拿來測序,得到的數(shù)據(jù)是可以與NCBI數(shù)據(jù)庫比對的,你可以發(fā)現(xiàn)一些那棵樹上的線蟲種群所特有的SNP位點。但是,以此來推算SNP位點的頻率是不行的。因為那個線蟲基因組DNAPool是不均勻的。
舉個例子,那棵樹上有兩只線蟲A和B。A的基因組大些,為2ug;B的基因組小些,為1ug。在某個SNP位點,線蟲A為C,線蟲B為T。
然后你逮到了線蟲A和B,然后混合提取基因組DNA。所提取到的基因組DNApool為3ug(A占2ug,B占1ug)。假設測序的擴增過程是完全線性的,那么最后的測序結果中,在那個SNP位點,67%的比率為C,33%的比率為T。
這樣的測序結果,你能說在這個SNP位點C的頻率為67%嗎?當然是不能的。
因此。你想發(fā)現(xiàn)新的SNP位點是可以的。但是想估算SNP頻率是不行的。
討論 5. 關于轉錄組測序
問題1.請問全轉錄組測序,可以同時檢測mRNA、miRNA及其他非編碼RNA嗎?
答:首先需要向您講明一個事實。目前,第二代測序的長度有不同的選擇。SolexaGAIIx的測序長度是36bp,75bp和100bp;ABISOLiD3的測序長度是25bp和50bp。不同的測序長度的費用是不同的!目前,我們通常根據(jù)測序樣品長度的不同而選擇不同的測序長度。例如:mRNA測序通常會需要75bp的讀長,而microRNA則只需要36bp或者50bp的讀長就足夠了。
關于您所提的問題,技術上是可行的,我們可以以75bp的讀長測mRNA的同時測其中包含的microRNA。但是在經(jīng)濟上是不劃算的。microRNA比較短,PCR擴增倍數(shù)多,形成的cluster多,占用了很多本該屬于mRNA測序的資源,而它們本身又用不完75bp的讀長,所以造成浪費。
一般來講,如果要進行 microRNA測序的話。我們希望能將microRNA分離出來,單獨測序。
問題2. 請 教miRNA芯片服務和LncRNA芯片服務的價格比較簡單的技術區(qū)別。
答:miRNA芯片和LncRNA芯片實際上是兩類相差很大的芯片。miRNA比較短,因此芯片公司在設計檢測miRNA的探針時,在探針頭部加了一個發(fā)夾結構,整個探針像一個鉤子一樣。這樣能將microRNA前體與成熟的microRNA區(qū)分開,提高檢測的特異性。而LncRNA比較長,檢測LncRNA的探針設計和普通mRNA一樣。目前LncRNA的研究還不深入,對于生物芯片之類比較依賴于參考序列的實驗技術來講,LncRNA芯片不是很成熟。因此,如果您是想比較兩組樣品之間miRNA的差異表達,可以選用microRNA芯片(定量較準)。如果您是想發(fā)現(xiàn)新的microRNA,或者對LncRNA進行研究。我建議您使用第二代測序。
生物芯片與第二代測序技術丁香園答疑帖精選(上)
http://www.ebioservice.com/show_news.asp?id=770
生物芯片與第二代測序技術丁香園答疑帖精選(下)
http://www.ebioservice.com/show_news.asp?id=1259
愛華網(wǎng)


