Irys單分子基因組結構成像系統
讓我們組織,而不是堆砌數據
在過去的幾年里,二代測序的高通量***直主導著基因組研究的發展。
但是二代測序技術可以廉價的獲得大量的測序數據,但是受制于較短的讀長,這使得科學***們無法簡單而直觀地看到整個基因組范圍的結構變化。現在,針對更長片段的分析方法對于基因組結構研究顯得越來越重要。另外,由于基因組的復雜性,諸如重復序列和結構變異,限制了基因組的重構和對功能元件的理解。Irys系統克服了這些困難,利用***種新的方法去獲取單分子,尤其是長鏈DNA分子的圖像。
長鏈DNA分子
Irys系統的核心是已經獲得專利的芯片技術。這種芯片可以使盤繞的DNA長鏈隨機解開、拉直,進入納米***通道。這些納米通道可以防止半卷曲的DNA分子重新纏繞,并且將大量長鏈DNA分子拉直,平行排列在***起直接拍照成像(圖1)。
IrysPrep 試劑盒可以通過限制性內切酶在特異位點進行剪切,然后連接上帶有熒光的堿基使長鏈DNA分子被標記。軟件會將長鏈上的熒光點翻譯成相應的序列信息,以幫助組裝基因組圖譜。成像后,DNA分子會從納米通道中排出,新***批的DNA分子會進入。這種動態的,多循環的技術使Irys系統可以實現每小時內完成幾個GB的DNA分子的線性化和成像。
圖1:長鏈DNA分子在納米通道中平等排列,生成高質量的圖像
關聯的基因組
在單分子水平上對全基因組結構的可視化,不但可以減少了由于DNA擴增和打斷等引起的偏差,而且也為***個全基因組的物理圖譜提供了骨架,使測序結果更有效,更完整。在圖譜中,長序列的基因組結構得以保存,這對發現生物學上特異的結構變異是很有裨益的。Irys所測讀的超長片段,對于全基因組圖譜的構建,連接功能單元,錨定contigs,確定gap的大小,衡量重復單元的大小,分辨拷貝數變化,插入片段以及異位都是非常必要的。
應用
IrysPrep試劑盒和IrysView軟件分析系統支持結構變異檢測,組裝驗證,骨架和NGS數據以及客戶自定義的***些長片段單分子數據。
結構變異分析
Irys是***款非常適合做結構變異分析的儀器。NGS的短讀長不僅在de novo測序數據的拼裝上存在困難,也限制了其在CNVs方面的應用。而其他的方法,比如array-CGH,缺少位置信息而且依賴于探針,因此只能應用在已有參考序列的模式物種上。Irys通過長讀長,實現了基因組范圍內的結構變異檢測。長鏈基因組的自然狀態,染色體平衡異位以及插入(重復)具體位置信息都可以被直接觀察到。(圖2)另外,利用單分子檢測,而不是NGS和CGH數據的疊加,可以讓群體中的每個個體都能夠被直接檢測到。
圖2:直觀的變異位點分析。通過和果蠅的參考序列(綠色)比對,可以準確的發現拷貝數的多態性(串聯重復),該果蠅只有單拷貝(藍色),并且通過高覆蓋度得到了驗證。
NGS錨定
Irys在de novo應用中可以拼裝出更加完整的數據,和NGS相比,可以在更短時間內提供更完整的基因圖譜。任何短讀長的測序方法都會造成重復序列很難被正確組裝,而Irys特有的超長片段讀長,完全可以跨越重復片段和***些包含復雜元件的序列,能夠使contig數量和gap數量大大減少(圖3)。
其他***些基于限制性內切酶的長片段讀取方法會丟失***些小的片段(比如重復序列),但是Irys系統的剪切和加標簽的化學方法完全不會破壞DNA長鏈結構。(圖4)
圖3:NGS組裝。人類MHC區域通過NGS獲得5個contigs,通過Irys系統,可以準確地確定它們在基因組中的位置及gaps的大小。(Lam et al, Nature Biotech, 2012).
圖4:長鏈單分子DNA可通讀重復片段。酵母的著絲粒區含有很多重復片段,參考序列中并沒有完整地呈現它的拷貝數,Irys系統可以通讀長鏈單分子DNA片段,使這***結果清晰呈現。
組裝驗證
Irys系統得到的基因組圖譜可以與NGS數據拼裝出的基因組圖譜實現非常完美的交叉驗證。在IrysView軟件中,可以在圖表瀏覽器中看到與已導入的NGS的組裝序列的差異,并且以表格的形式列出,這有助于研究人員進行更深層的單分子成像的研究,同時,Irys還可以幫助科研人員快速地設計新的驗證及測序實驗。
在IrysPrep試劑的支持下,Irys系統可以作為***個開放的平臺為研究人員提供多種形式的遺傳分析。基于Irys系統的長鏈單分子熒光標記方法,更多領域的應用都在不斷的研發中。