一区二区在线免费视频_91精品国产一区二区_一级裸体视频_精品久久网_成人乱码一区二区三区不卡视频_91在线一区

新聞詳情

新檢索方法可在幾分鐘內(nèi)找到靶DNA序列

日期:2025-07-17 23:14
瀏覽次數(shù):806
摘要: 新檢索方法可在幾分鐘內(nèi)找到靶DNA序列 從數(shù)據(jù)庫(kù)中檢索DNA序列需要花費(fèi)生物學(xué)家和醫(yī)學(xué)研究人員幾天的時(shí)間,多虧美國(guó)卡耐基梅隆大學(xué)計(jì)算機(jī)科學(xué)家們開(kāi)發(fā)出的一種新的檢索方法,如今這種檢索只需幾分鐘時(shí)間就可完成。 由計(jì)算生物學(xué)副教授Carl Kingsford和計(jì)算生物學(xué)系博士生Brad Solomon開(kāi)發(fā)的這種方法旨在檢索所謂的短測(cè)序片段(short reads),即由高通量測(cè)序技術(shù)產(chǎn)生的DNA和RNA序列。它依賴(lài)一種新的被稱(chēng)作序列布隆樹(shù)(Sequence Bloom Tree, SBT)的索引數(shù)據(jù)結(jié)構(gòu)。研究人員在于2016年2月8日在線發(fā)表在Nature Biotechnology期刊上的...

新檢索方法可在幾分鐘內(nèi)找到靶DNA序列

從數(shù)據(jù)庫(kù)中檢索DNA序列需要花費(fèi)生物學(xué)家和醫(yī)學(xué)研究人員幾天的時(shí)間,多虧美國(guó)卡耐基梅隆大學(xué)計(jì)算機(jī)科學(xué)家們開(kāi)發(fā)出的一種新的檢索方法,如今這種檢索只需幾分鐘時(shí)間就可完成。

由計(jì)算生物學(xué)副教授Carl Kingsford和計(jì)算生物學(xué)系博士生Brad Solomon開(kāi)發(fā)的這種方法旨在檢索所謂的短測(cè)序片段(short reads),即由高通量測(cè)序技術(shù)產(chǎn)生的DNA和RNA序列。它依賴(lài)一種新的被稱(chēng)作序列布隆樹(shù)(Sequence Bloom Tree, SBT)的索引數(shù)據(jù)結(jié)構(gòu)。研究人員在于2016年2月8日在線發(fā)表在Nature Biotechnology期刊上的一篇標(biāo)題為“Fast search of thousands of short-read sequencing experiments”的論文中,描述了這種數(shù)據(jù)結(jié)構(gòu)。

美國(guó)國(guó)家衛(wèi)生院維護(hù)著一個(gè)龐大的被稱(chēng)作序列片段歸檔(Sequence Read Archive)的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)總共含有(3×1015)個(gè)堿基對(duì)。這種信息對(duì)很多研究人員---從對(duì)基礎(chǔ)生物學(xué)過(guò)程提出問(wèn)題的那些研究人員到研究潛在癌癥**方法的那些研究人員---有用。

Kingsford說(shuō),“這種數(shù)據(jù)庫(kù)含有未知數(shù)量的迄今為止尚未發(fā)現(xiàn)的新認(rèn)識(shí),而且被人們大量地使用。它的主要問(wèn)題是檢索比較困難。”

它需要上千個(gè)硬盤(pán)來(lái)儲(chǔ)存這些序列。他注意到,通過(guò)短測(cè)序片段---通常每個(gè)片段長(zhǎng)50到200個(gè)堿基對(duì)---進(jìn)行搜索以便觀察哪些短測(cè)序片段能夠組裝成可能長(zhǎng)1萬(wàn)個(gè)堿基對(duì)的靶基因,是比較繁瑣的,在某些情形下需要數(shù)天時(shí)間才能完成。

正如索引能夠加快書(shū)本或目錄檢索,這種由Kingsford和Solomon開(kāi)發(fā)的基于SBT的索引能夠極大地加快這種生物信息學(xué)數(shù)據(jù)庫(kù)檢索。利用被稱(chēng)作布隆過(guò)濾器(Bloom filters)的數(shù)據(jù)結(jié)構(gòu),他們實(shí)際上將每個(gè)短測(cè)序片段描述為一個(gè)固定長(zhǎng)度的子序列集合。布隆過(guò)濾器能夠高效地在小空間中儲(chǔ)存信息,并且能夠測(cè)試一種元素是不是一個(gè)集合的成員。

在**查詢(xún)水平上,SBT能夠判別靶DNA序列是否包含在這個(gè)數(shù)據(jù)庫(kù)中。如果包含的話,那么這種檢索進(jìn)行到下一個(gè)水平:SBT指示這種序列是否存在于這個(gè)數(shù)據(jù)庫(kù)的前半部分還是后半部分。在每個(gè)水平上,這種查詢(xún)以某種方式擴(kuò)散開(kāi)去直到所需檢索的序列被檢索到。

Kingsford和Solomon利用2652項(xiàng)人血液、乳腺和大腦實(shí)驗(yàn)---其中每項(xiàng)實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù)經(jīng)常含有十億多個(gè)RNA序列堿基對(duì)---產(chǎn)生的數(shù)據(jù)庫(kù)測(cè)試了它們的技術(shù)。他們發(fā)現(xiàn)對(duì)這種數(shù)據(jù)庫(kù)的絕大多數(shù)的檢索可以在平均20min內(nèi)完成。作為比較,他們利用現(xiàn)有的被稱(chēng)作SRA-BLAST和STAR之類(lèi)的技術(shù)估計(jì)了所需的檢索時(shí)間:SRA-BLAST需要2.2天,而STAR需要921天。

他們注意到,進(jìn)一步的加快檢索是可能的,這是因?yàn)檫@種新檢索方法每批次能夠同時(shí)進(jìn)行20萬(wàn)多個(gè)查詢(xún)。

滬公網(wǎng)安備 31011702004399號(hào)

主站蜘蛛池模板: 亚洲免费精品 | 亚洲视频免费在线播放 | av色偷偷| 国产精品激情福利视频 | 成人小视频在线观看 | 波多久久亚洲精品AV无码 | 亚洲经典在线中文字幕 | 欧美日屁 | 2022国产成人精彩在线视频 | 激情六月丁香婷婷 | 久久综合玖玖爱中文字幕 | 色狠狠婷婷97 | 欧美91精品国产自产 | 免费亚洲视频在线观看 | 日韩欧美国产精品 | 男人与女人做爰毛片A片 | 精品在线视频一区 | 亚洲伊人成综合网 | 中文字幕一区在线观看视频 | 正规成人啪啪 | 中文字幕亚洲欧美 | 欧美视频国产 | 五月天色网址 | 日韩经典中文字幕 | 成人婷婷 | 荷兰欧美一级毛片 | a在线免费观看 | 麻豆md国产在线观看 | 欧美日韩在线一区二区 | 久热中文字幕在线精品首页 | 欧美大片一区二区 | 日韩三区| 久久综合久久精品 | 国产成人免费全部网站 | 国产高清在线91福利 | 欧美在线成人影院 | 欧美国产日韩在线观看 | 精品中文字幕在线观看 | 日本一级毛片不卡免费 | 国产99视频在线 | 9久热这里只有精品视频在线观看 |