欧美精品一二区,性欧美一级,国产免费一区成人漫画,草久久久久,欧美性猛交ⅹxxx乱大交免费,欧美精品另类,香蕉视频免费播放

信息檢索與檢索系統(tǒng).ppt

上傳人:w****2 文檔編號:14754725 上傳時間:2020-07-30 格式:PPT 頁數(shù):32 大?。?.84MB
收藏 版權(quán)申訴 舉報 下載
信息檢索與檢索系統(tǒng).ppt_第1頁
第1頁 / 共32頁
信息檢索與檢索系統(tǒng).ppt_第2頁
第2頁 / 共32頁
信息檢索與檢索系統(tǒng).ppt_第3頁
第3頁 / 共32頁

下載文檔到電腦,查找使用更方便

9.9 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《信息檢索與檢索系統(tǒng).ppt》由會員分享,可在線閱讀,更多相關(guān)《信息檢索與檢索系統(tǒng).ppt(32頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、第2章 信息檢索與檢索系統(tǒng),2.1 信息檢索的含義和作用 2.2 檢索工具的基本功能及類型 2.3 檢索系統(tǒng)的構(gòu)成 2.4 檢索語言,2.1 信息檢索的含義和作用,1. 信息檢索的含義,(1)“信息檢索”(Information Retrieval)是指將信息按一定方式組織和存貯起來,并針對信息用戶的需求找出所需要的信息的過程。信息檢索的廣義概念包括兩個部分,即信息存儲和信息檢索,狹義則僅指該過程的后一部分,即信息的查找過程。信息檢索的目的是為了解決特定的信息需求和滿足信息用戶的需要。它根據(jù)檢索(查找)對象的不同,又可以分為文獻(xiàn)檢索、事實(shí)檢索和數(shù)據(jù)檢索。 信息檢索的本質(zhì)是信息用戶的需求和一定的

2、信息集合的比較和選擇的過程,即“匹配”的過程,也就是用戶需求的主題概念或提問表達(dá)式同一定信息系統(tǒng)的檢索語言相適應(yīng)的過程。,(2)科技信息檢索 是應(yīng)用現(xiàn)代信息檢索理論并借助一定的檢索工具和技術(shù),從浩如煙海的科技信息資源中查找所需信息的過程。 (3)信息檢索方式 按照信息存儲手段和載體形式,可以分為手工檢索(手檢)和計算機(jī)檢索(機(jī)檢)。 手工檢索是針對印刷型檢索工具的,計算機(jī)檢索使用的對象是計算機(jī)檢索系統(tǒng)(包括各種數(shù)據(jù)庫、檢索軟件及相關(guān)應(yīng)用軟件、計算機(jī)硬件和通信設(shè)施等)。 無論是手檢還是機(jī)檢,按檢索過程和最終結(jié)果的關(guān)系可分為直接檢索和間接檢索兩種方式。直接檢索是指查閱一次信息(或一次文獻(xiàn))直

3、接獲取所需信息的方法,其效率很低(手檢)。間接檢索主要是指利用各種檢索工具或檢索系統(tǒng)獲取信息線索的方法,再通過信息線索獲取原始信息,這種方式效率要高得多,因而是現(xiàn)代信息檢索的主要方式。,(4)信息檢索入口 又稱檢索點(diǎn)或檢索標(biāo)識,是指信息內(nèi)部特征或外部特征的屬性值的集合。檢索標(biāo)識是系統(tǒng)標(biāo)引員和信息用戶所共同遵循的“接口”,是信息用戶檢索信息的出發(fā)點(diǎn)和依據(jù)。檢索標(biāo)識主要包括主題詞、關(guān)鍵詞、分類號、著者、標(biāo)題、機(jī)構(gòu)名稱或代碼等。 (5)信息檢索的類型 按檢索結(jié)果的內(nèi)容來劃分,可以劃分為文獻(xiàn)檢索、數(shù)據(jù)檢索、事實(shí)檢索和概念檢索。 文獻(xiàn)檢索(Documents Retrieval)是目前信息檢索的主要類

4、型,它是通過二次文獻(xiàn)查找所需的一次文獻(xiàn)或(和)三次文獻(xiàn)。 數(shù)據(jù)檢索(Data Retrieval)是滿足數(shù)據(jù)需求的檢索過程,如數(shù)理化等科學(xué)數(shù)據(jù)、經(jīng)濟(jì)數(shù)據(jù)、歷史地理數(shù)據(jù)等。這里的數(shù)據(jù)指大量的數(shù)值、數(shù)字和相應(yīng)的在邏輯層次結(jié)構(gòu)上緊密相關(guān)的信息內(nèi)容,它不等同于狹義的數(shù)學(xué)上的含義。,事實(shí)檢索(Fact Retrieval)是對特定事實(shí)或事件的檢索。事實(shí)內(nèi)容包括大量的科學(xué)事件和社會事件,例如傳統(tǒng)的報刊檢索和現(xiàn)代的網(wǎng)絡(luò)新聞檢索就是查找“何時何地發(fā)生的具體事件”。 概念檢索(Concept Retrieval)是查找特定概念的含義、作用、原理或使用范圍等解釋性內(nèi)容或說明。最常見的概念檢索是查找各種參考工具

5、書,例如字詞典、百科全書、名錄、手冊、指南等參考工具書。,2. 信息檢索的作用,(1)信息檢索是信息社會個人素質(zhì)的一個重要組成部分 (2)信息檢索是實(shí)現(xiàn)信息資源共享的重要途徑 (3)信息檢索是科學(xué)研究和技術(shù)創(chuàng)新的重要組成部分 (4)信息檢索是提高個人競爭力的重要因素,2.2 檢索工具的基本功能及類型,1. 檢索工具的基本功能,信息檢索工具的主要功能表現(xiàn)在存儲和檢索兩個方面。報道及時全面、存儲規(guī)范有序、檢索方便準(zhǔn)確是對檢索工具的基本要求。因此,檢索工具應(yīng)具備下列基本功能: (1)報道功能 以高度壓縮的形式簡要揭示信息的內(nèi)容特征(如標(biāo)題、主題、摘要和分類等)和外部特征(如書刊名、著者和號碼等)。,

6、(2)標(biāo)識功能 對著錄信息進(jìn)行多種標(biāo)識,如序號、代碼號、主題詞、關(guān)鍵詞、學(xué)科類目等。 (3)輔助檢索功能 檢索工具須提供多種輔助檢索手段,如分類索引、主題索引、著者索引、機(jī)構(gòu)索引和代碼索引等。輔助檢索功能的完善程度不僅是檢索工具的主要質(zhì)量指標(biāo),而且也是影響信息用戶能否充分實(shí)現(xiàn)信息資源共享的一個關(guān)鍵因素。,2. 檢索工具的基本類型,(1)按載體形式劃分 書刊型檢索工具,即以圖書或期刊形式出版的常用檢索工具。又可分為期刊式、單卷式和附錄式等形式。 卡片型檢索工具,將文獻(xiàn)的各種檢索標(biāo)識著錄在卡片上并按一定方法排列組織而成的傳統(tǒng)檢索工具。 縮微型檢索工具,以縮微膠卷或平片的形式報道文獻(xiàn)線索的檢索工具,

7、需要專用的縮微閱讀設(shè)備。 機(jī)讀型檢索工具,以計算機(jī)為主要手段進(jìn)行信息存儲和信息檢索的工具。它是信息檢索工具(系統(tǒng))發(fā)展的主導(dǎo)形式和方向。,(2)按著錄信息的特征劃分 目錄(Contents) 以文獻(xiàn)的外部特征為著錄依據(jù),記錄具體出版事項及其收藏信息的報道性檢索工具。按組織形式和范圍可劃分為國家書目、聯(lián)合目錄、館藏目錄、報刊目錄、聯(lián)機(jī)性和網(wǎng)絡(luò)性目錄等多種類型,按報道信息的學(xué)科范圍可將目錄劃分為專題目錄和綜合目錄。 索引(index) 將文獻(xiàn)的一些外部特征和內(nèi)容特征作為著錄依據(jù),并依此線索揭示文獻(xiàn)原始信息內(nèi)容的檢索工具,如著者索引、主題索引、分類索引、關(guān)鍵詞索引等。,文摘(abstract) 在著

8、錄文獻(xiàn)外部特征的基礎(chǔ)上,另外增加揭示內(nèi)容特征的摘要部分,它是系統(tǒng)地報道、積累和檢索文獻(xiàn)信息的主要工具,是傳統(tǒng)檢索工具的核心。根據(jù)文摘揭示信息內(nèi)容的深度,可以分為指示性文摘和報道性文摘。 參考工具書(reference) 是分析和著錄大量具體而常用的科學(xué)數(shù)據(jù)與事實(shí)、以備查用的各種常用工具書的總稱。 搜索引擎(searching engine) 將網(wǎng)絡(luò)信息按一定分類方法組織起來,通過檢索網(wǎng)址的方式來檢索信息的檢索工具。如百度、Google、搜狐、yahoo等。,,(3)檢索工具的其它分類方法 按檢索手段可分為手工檢索工具和計算機(jī)檢索工具; 按報道的信息來源可分為單一型和多類型檢索工具; 按收錄信息

9、的學(xué)科范圍可分為綜合型和專業(yè)型檢索 工具; 按檢索的對象和結(jié)果可分為文獻(xiàn)信息和事實(shí)數(shù)據(jù)檢索 工具。,2.3 檢索系統(tǒng)的構(gòu)成,1. 檢索系統(tǒng)的構(gòu)成,信息檢索系統(tǒng)是由存儲在一定載體上的有序化信息集合,相應(yīng)的檢索技術(shù)和設(shè)備,以及配套協(xié)調(diào)機(jī)制共同構(gòu)成的具有信息存儲和檢索功能的共享信息環(huán)境。,(1)檢索文檔 經(jīng)過有序化處理并附有檢索標(biāo)識的信息集合。如各種手檢工具和機(jī)檢數(shù)據(jù)庫。檢索文檔包括順排文檔和倒排文檔,順排文檔的檢索是對庫中主文檔的檢索,倒排文檔是抽取具有檢索意義的字段再重新組成的索引文檔(檢索屬性和信息地址的有序集合)。,(2)檢索設(shè)備 用以存儲信息和檢索標(biāo)識、實(shí)現(xiàn)信息查詢及其結(jié)果傳遞的技術(shù)手段

10、。如主機(jī)、終端及通信設(shè)施等。 (3)系統(tǒng)規(guī)則 規(guī)范信息采集分析、標(biāo)引著錄、組織管理、檢索與傳輸?shù)冗^程的各種標(biāo)準(zhǔn)體系。 (4)作用于系統(tǒng)的人 包括信息采集、分析和標(biāo)引人員,系統(tǒng)管理和維護(hù)人員,信息用戶和信息檢索服務(wù)人員等。 以上四要素是針對廣義的信息檢索系統(tǒng)而言的。狹義的檢索系統(tǒng)僅指軟件環(huán)境的核心部分,即:手工檢索系統(tǒng)由正文、輔助索引、分類表和主題詞表、說明、文獻(xiàn)來源目錄等5部分組成;計算機(jī)檢索系統(tǒng)由數(shù)據(jù)庫的字段、記錄、文檔、主題與分類索引、輔助咨詢等部分組成。,良好的信息檢索系統(tǒng)須具備以下特征: 須有規(guī)范的檢索語言作環(huán)境支持(包括適宜的操作系統(tǒng)); 須有一部數(shù)據(jù)字典或詞表作后盾; 對信息特征

11、的標(biāo)引和著錄務(wù)求詳細(xì)準(zhǔn)確; 須具備多種系統(tǒng)檢索標(biāo)識; 全部檢索標(biāo)識必須有序化并相互協(xié)調(diào); 提供多種檢索方法和途徑; 檢索過程簡易高效,符合“用戶努力最小”原則; 準(zhǔn)確的信息傳遞和信息輸出; 多種檢索系統(tǒng)之間須具有兼容性和通用性。,2. 檢索系統(tǒng)的基本原理,,,,,,,,,,,,,,,,,,采集,轉(zhuǎn)換,,,,,信息存儲過程,信息檢索過程,,,,,錄入,輸出,信息檢索系統(tǒng)基本原理框圖,,,,2.4 檢 索 語 言,1.檢索語言的概念,檢索語言是用于描述信息系統(tǒng)中信息的內(nèi)部特征和外部特征及其表達(dá)信息用戶需求提問的一種專門語言。 或者說,檢索語言是信息存儲和信息檢索共同遵循的一種約定性語言。 檢索

12、語言又稱為標(biāo)引語言、索引語言、存儲語言等。 信息檢索的匹配過程就是通過檢索語言的匹配過程實(shí)現(xiàn)的。,2. 檢索語言的基本要求和特點(diǎn),(1)易于標(biāo)引和檢索:這是衡量檢索語言的首要指標(biāo)。其基本因素有:詞語或符號的含義必須明確,不能有歧義或交叉語言概念豐富,概括面廣,讓各種文獻(xiàn)信息都能有類可歸(即有詞或有號)標(biāo)識的簡潔直觀性檢索語言的語法必須嚴(yán)密規(guī)范; (2)檢索語言須具有實(shí)用性; (3)具有較高的查全率和查準(zhǔn)率; (4)滿足多種檢索要求,提供多種檢索途徑; (5)檢索語言之間的通用性和兼容性。,3. 檢索語言的類型,(1)檢索語言按是否受控劃分為人工語言和自然語言 人工語言:對檢索語言的概念加以規(guī)

13、范和控制,把各種同義詞、多義詞、同形異義詞等進(jìn)行規(guī)范化處理,使每一個檢索詞只能表達(dá)一個概念,分類語言、標(biāo)題詞和主題詞(敘詞)語言都屬于人工規(guī)范語言; 自然語言:對檢索語言中的同義詞、多義詞等不加處理,取其自然狀態(tài),單元詞和關(guān)鍵詞屬于這一類。 (2)按檢索時的組配實(shí)施狀況劃分為先組式和后組式檢索語言 先組式檢索語言:在檢索前,檢索詞已被預(yù)先組配好,檢索時用戶只能嚴(yán)格按照預(yù)先設(shè)定的檢索詞去查找信息而不能任意組配。如分類索引中的各級分類款目、標(biāo)題索引中的標(biāo)題詞都是如此。,后組式檢索語言:在檢索前檢索詞沒有被預(yù)先組配,檢索時可以對檢索詞任意組配,構(gòu)成所需要的檢索概念。其組配的基本原理是:具體概念可通過

14、一般概念組配而成。單元詞、敘詞、關(guān)鍵詞都屬于這一類。 (3)按內(nèi)容性質(zhì)劃分為分類語言和主題語言 分類語言:是用分類號和相應(yīng)分類款目來表達(dá)各種概念,以學(xué)科體系為基礎(chǔ),將各種概念按學(xué)科性質(zhì)和邏輯層次結(jié)構(gòu)進(jìn)行分類和系統(tǒng)排序。其特點(diǎn)是能集中體現(xiàn)學(xué)科的系統(tǒng)性,反映事物的從屬派生關(guān)系,便于按學(xué)科門類進(jìn)行族性檢索。按照分類方式的不同,又可分為體系分類語言、組配分類語言和混合分類語言。,主題語言:是對信息主題內(nèi)容特征的主題詞匯概念,經(jīng)規(guī)范化處理所形成的檢索語言。由于主題詞表達(dá)概念準(zhǔn)確,所以主題途徑是檢索信息的主要途徑。主題詞匯按一定規(guī)則構(gòu)成主題詞表,詞表通過參照方式揭示詞匯之間的相互關(guān)系,用作信息標(biāo)引和信息檢

15、索的參考依據(jù)。主題語言按照主題性質(zhì)的不同,可以分為標(biāo)題詞(subject heading)語言、單元詞(uniterm)語言、敘詞(descriptor)語言、關(guān)鍵詞(keyword)語言等。,4. 體系分類語言,體系分類語言是目前世界上最流行的檢索語言,常見的有杜威十進(jìn)制分類法(DDC)、國際專利分類法(IPC)、美國國會圖書館分類法(LC)、英國國會圖書館分類法(LCC)、中國圖書館圖書分類法(中圖法)、中國科學(xué)院圖書館圖書分類法(科圖法)等。體系分類語言的具體表現(xiàn)形式就是分類表及其輔助說明,一部完整的分類法由三個部分組成,即:分類表、輔助表和使用說明?,F(xiàn)以中圖法和科圖法為例予以簡單說明。

16、,(1)中圖法分類表的構(gòu)成 分類表:是選擇、類分、組織和檢索信息的依據(jù),分為: 編制說明:對類的設(shè)置與排序、標(biāo)引和查閱方法等問題的說明。 基本部類:將全部知識劃分為馬列毛鄧、哲學(xué)、社會科學(xué)、自然科學(xué)和綜合性圖書五個部分。又稱基本序列。 大綱:也稱基本大類,構(gòu)成分類表的一級類目。中圖法把知識體系分為22個基本大類。,簡表:即基本類目表,是整個分類表的骨架。 詳表:又稱主表,即分類表的正文,由類號、類目和注釋組成。 復(fù)分表:是祥表的一系列標(biāo)準(zhǔn)子目表,用于對祥表中指定需要劃分的類目作進(jìn)一步的細(xì)分。 輔助表:即中國圖書館圖書分類法索引,用于引導(dǎo)用戶從信息主題的角度迅速準(zhǔn)確地確定分類號。 使用說

17、明:是中圖法的配套使用手冊。 圖22(P.34)列出了中圖法各級類目展開的示例。 (2)科圖法簡介:中科院系統(tǒng)圖書情報機(jī)構(gòu)幾乎全部采用科圖法。 科圖法與中圖法都屬于體系分類語言,其編排體例與結(jié)構(gòu)類似于中圖法,如圖23所示。,5. 主題詞語言,主題詞語言是以概念為基礎(chǔ)(包括正式主題詞和非正式主題詞)、經(jīng)過規(guī)范化處理的具有檢索意義和組配性能的單詞或詞組的有機(jī)集合。主題詞是從主題途徑組織信息和檢索信息的依據(jù)。非正式主題詞是用來指引正式主題詞的一種措施,即引導(dǎo)詞,正式主題詞是用于主題標(biāo)引和檢索的受控詞。主題詞語言的具體表現(xiàn)形式是主題詞表和主題索引,幾乎所有檢索系統(tǒng)或檢索工具均提供主題檢索途徑。常見的比

18、較重要的主題詞表有漢語主題詞表和英國科學(xué)文摘主題詞表(INSPEC Thesaurus)。 示例見教材P3942。,漢語拼音 Dianshi xianxiangguan 款目主題詞 電視顯象管 56CE 范疇號 英文譯名 Kinescope Television tube 用項符號 Y 顯象管 同義詞 (正式主題詞) 漢語拼音 Gaowenfa 款目主題詞 高溫閥 67G 范疇號 含義注釋(溫度450) 英文譯名 High temperature valves 屬項符號 S 閥門* 族首詞符號

19、廣義詞、族首詞 漢語主題詞表的主表主題詞款目舉例 1,,漢語拼音 Xianxiangguan 款目主題詞 顯像管 56E 范疇號 英文譯名 Kenescope Picture tube 代項符號 D 電視顯像管 < 同義詞 監(jiān)視管 (非正式主題詞) 分項符號 F 彩色顯像管 狹義詞 固體顯像管 黑白顯像管 屬項符號 S 電子束管 廣義詞 族項符號 Z 電子管* < 族首詞符號 族首詞 參項符號 C 顯示管 < 相關(guān)詞 指示管 漢語主題詞

20、表的主表主題詞款目舉例 2,acoustic wave velocity UF acoustic velocity NT ultrasonic velocity BT velocity TT velocity RT acoustic dispersion acoustic impedance acoustic wave propagation acoustic wave velocity measurement acoustic waves liquid helium sound propagation Mach number shock waves

21、CC A4300 A5140 A6260 A6265 FC a4300-z a5140+g a6260+y a6265+a= DI January 1973 INSPEC主題詞表的字順表結(jié)構(gòu),說明: UF(Used For), 表示主題詞所替代的非規(guī)范詞, UF后的詞不能用作檢 索詞。 NT(Narrower Term), 狹義詞, 表示主題詞的下位詞。 BT(Broader Term), 廣義詞, 指明主題詞的上位詞。 TT(Top Term), 族首詞, 指明主題詞的最上位詞。 RT(Related Term), 相關(guān)詞, 表示與主題詞有關(guān)聯(lián)的詞。 CC(Classification Code), 分類代碼, 由分類號和SA分輯號組成。 FC(Full form of Code), 表示輸入數(shù)據(jù)庫的代碼。 DI(Date of Input), 表示輸入計算機(jī)的時間。,acoustic applications ultrasonic applications biomedical ultrasonics ultrasonic materials testing ultrasonic welding INSPEC 主題詞表等級表結(jié)構(gòu),

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!