《GenBank數(shù)據(jù)庫檢索.ppt》由會員分享,可在線閱讀,更多相關(guān)《GenBank數(shù)據(jù)庫檢索.ppt(67頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、GenBank數(shù)據(jù)庫檢索及其應用Entrez檢索功能,NCBI網(wǎng)站網(wǎng)址: http://www.ncbi.nlm.nih.gov,簡介,檢索入口,基本檢索功能,特征欄輔助檢索,檢索結(jié)果的顯示,GenBank數(shù)據(jù)庫是由美國國立生物技術(shù)信息中心(NCBI)維護的一級核酸序列數(shù)據(jù)庫。,GenBank數(shù)據(jù)庫的數(shù)據(jù)來源有三種: 1、直接來源于測序工作者提交的序列; 2、與其它數(shù)據(jù)機構(gòu)協(xié)作交換的數(shù)據(jù); 3、美國專利局提供的專利數(shù)據(jù)。,簡介,檢索界面,簡介,1、基本檢索界面,,Nucleotide 數(shù)據(jù)庫分為三個子數(shù)據(jù)庫:,EST :表達序列標記數(shù)據(jù)庫 GSS :基因組測序序列數(shù)據(jù)庫 CoreNucleot
2、ide :包含所有未被以上兩個子數(shù)據(jù)庫收錄的核苷酸序列,,檢索界面,簡介,1、基本檢索界面,2、跨庫檢索界面,,簡介,檢索界面,基本檢索功能,(一)字段限制檢索、強制短語檢索,(二)特殊標志符檢索,(四)范圍檢索,(三)序列長度檢索,簡介,檢索界面,基本檢索功能,(一)字段限制檢索、強制短語檢索,,,,,,,,rasGENE,,,,,,,檢索限定詞:,1、基因名稱的檢索限定詞:GENE or GENE NAME 2、生物體名稱的檢索限定詞:ORGN or ORGANISM 3、作者姓名的檢索限定詞:AUTH or AUTHOR,獲取所需要的基因序列,,,顯示方式,,序列號,,物種信息,,作者信
3、息,,選擇顯示模式為FASTA,,序列信息,保存序列信息,,點擊send選擇file,格式為FASTA,,選擇顯示方式為Graphics,,編碼蛋白質(zhì)的序列信息,,點擊顯示蛋白質(zhì)編碼序列,,,,蛋白質(zhì)氨基酸序列,簡介,檢索界面,基本檢索功能,(二)特殊標志符檢索,(一)字段限制檢索、強制短語檢索,特殊標志符的格式(核酸序列):,2、GenBank/EMBL/DDBJ序列接受號: (1) 1個字母+5個阿拉伯數(shù)字 e.g.:U12345 (2) 2個字母+6個阿拉伯數(shù)字 e.g.:AY123456,Af123456,1、序列辨認號 (GI):一串阿拉伯數(shù)字 e.g.:1944073
4、3,(1)mRNA 記錄(NM_*): e.g.: NM_000492 (2)基因組的DNA重疊群(NT_*): e.g.: NT_000347 (3)完整的基因組或染色體(NC_*): e.g.: NC_000907 (4)基因組的局部區(qū)域(NG_*): e.g.: NG_000019 (5)從人類基因組注釋、加工得到的序列模型(XM,XP,or XR_*): e.g.: XM_000483,特殊標志符的格式(核酸序列):,3、RefSeq(Reference Sequence)序列接受號:,特殊標志符的格式(核酸序列):,4 、 PDB序列接受號:個阿拉伯數(shù)字個字母 e.g.:
5、TUP,序列接受號的檢索限定詞為ACCN or ACCESSION,簡介,檢索界面,基本檢索功能,(一)字段限制檢索、強制短語檢索,(二)特殊標志符檢索,(三)序列長度檢索,序列長度的檢索限定詞:SLEN,,,簡介,檢索界面,基本檢索功能,(一)字段限制檢索、強制短語檢索,(二)特殊標志符檢索,(四)范圍檢索,(三)序列長度檢索,范圍檢索:中間用冒號連接,1、序列接受號范圍檢索: AF114696:AF114714ACCN 2、序列長度范圍檢索: 3000:4000SLEN 3、日期范圍檢索: 2005/01:2006/09/26MDATorPDAT,簡介,檢索界面,基本檢索功
6、能,特征欄輔助檢索,限制檢索(Limits),高級檢索(Advanced Search),檢索史管理(History),剪貼板管理(Clipboard),詳細匹配過程(Details),限制檢索,高級檢索,簡介,檢索界面,基本檢索功能,特征欄輔助檢索,限制檢索(Limits),限制基因位點,限制序列片段的顯示,限制數(shù)據(jù)來源,限制數(shù)據(jù)發(fā)布日期,限制數(shù)據(jù)修訂日期,簡介,檢索界面,基本檢索功能,特征欄輔助檢索,限制檢索(Limits),高級檢索(Advanced Search),預檢索輸入框,添加檢索詞,索引檢索,,,,預檢索結(jié)果,簡介,檢索界面,基本檢索功能,特征欄輔助檢索,限制檢索(Limits
7、),高級檢索(Advanced Search),檢索史管理(History),,,簡介,檢索界面,基本檢索功能,特征欄輔助檢索,限制檢索(Limits),高級檢索(Advanced Search),檢索史管理(History),剪貼板管理(Clipboard),,,簡介,檢索界面,基本檢索功能,特征欄輔助檢索,限制檢索(Limits),高級檢索(Advanced Search),檢索史管理(History),詳細匹配過程(Details),剪貼板管理(Clipboard),,簡介,檢索入口,基本檢索功能,特征欄輔助檢索,檢索結(jié)果的顯示,,序列相似性搜索,,,啟動相似性搜索,,輸入序列號,,選擇
8、搜索的數(shù)據(jù)集,,點擊開始搜索,,相似性序列信息,,GenBank記錄中特性表中的主要關(guān)鍵詞:,,GenBank記錄中特性表中的限定詞:,GenBank和PubMed(序列數(shù)據(jù))檢索的比較:,1、GenBank的檢索結(jié)果是序列及其注釋信息; PubMed的檢索結(jié)果是與序列數(shù)據(jù)相關(guān)的文獻信息。 2、GenBank數(shù)據(jù)更新早于PubMed,GenBank數(shù)據(jù)庫的檢 全率高于PubMed。 3、GenBank可對序列數(shù)據(jù)進行限制檢索,而PubMed只能對文獻、雜志、作者等進行限制檢索,因而GenBank數(shù)據(jù)庫的檢準率也高于PubMed。,課后練習,用 GenBank 數(shù)據(jù)庫搜索 ”SARS coronavirus BJ01” 的全基因組序列信息并下載保存,查詢該基因所產(chǎn)生的蛋白質(zhì)序列信息。 用BLAST模塊對該基因序列進行相似性搜索。,謝 謝!,