CIDP14公共文化信息資源的組織.ppt
《CIDP14公共文化信息資源的組織.ppt》由會員分享,可在線閱讀,更多相關(guān)《CIDP14公共文化信息資源的組織.ppt(35頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第6講文化信息資源的組織,時間:1月11日14:00~16:00地點:A306,文化產(chǎn)業(yè)管理專業(yè)《文化信息資源開發(fā)規(guī)劃》課程,內(nèi)容,信息資源組織原理信息資源的描述與揭示網(wǎng)絡(luò)信息資源的組織,1.信息資源組織原理,信息組織也稱信息整序,是利用一定的規(guī)則、方法和技術(shù)對信息的外部特征和內(nèi)容特征進行揭示和描述,并按給定的參數(shù)和序列公式排列,使信息從無序集合轉(zhuǎn)換為有序集合的過程。,1.信息資源組織原理,信息的外部特征是指信息的物理載體直接反映的信息對象,構(gòu)成信息的外在的、形式的特征,如信息載體的物理形態(tài)、題名、作者、出版或發(fā)表日期、流通或傳播的標記等方面的特征。信息的內(nèi)容特征就是信息包含的內(nèi)容,它可以由關(guān)鍵詞、主題詞或者其他知識單元表達。信息組織的基本對象就是信息的外部特征和內(nèi)容特征。,1.信息資源組織原理,(1).信息選擇:從采集到的、處于無序狀態(tài)的信息流中甄別出有用的信息,剔除無用的信息,是信息組織過程的第一步。(2).信息分析:按照一定的邏輯關(guān)系從語法、語義和語用上對選擇過的信息內(nèi)、外特征進行細化、挖掘、加工整理并歸類的信息活動。(3)信息描述與揭示:也稱為信息資源描述,根據(jù)信息組織和檢索的需要,對信息資源的主題內(nèi)容、形式特征、物質(zhì)形態(tài)等進行分析、選擇、記錄的活動。(4).信息存貯:將經(jīng)過加工整理序化后的信息按照一定的格式和順序存貯在特定的載體中的一種信息活動。,1.信息資源組織原理,信息組織的類型:(1)按信息表現(xiàn)形式劃分文字信息組織圖像信息組織聲音信息組織視頻信息組織(2)按信息的加工程度劃分一次信息組織二次信息組織三次信息組織,1.信息資源組織原理,(3)按信息的傳播載體劃分文獻信息源非文獻信息源在這里,非文獻信息源特指網(wǎng)絡(luò)環(huán)境下沒有以傳統(tǒng)文獻載體形式出現(xiàn)的信息源,如程序代碼、網(wǎng)頁、超文本等。為了學(xué)習(xí)的方便,我們統(tǒng)稱為網(wǎng)絡(luò)信息源。,1.信息資源組織原理,1.元數(shù)據(jù)的概念:元數(shù)據(jù)(metadata)是關(guān)于數(shù)據(jù)的數(shù)據(jù)(dataaboutdata),是專門用來描述數(shù)據(jù)的特征和屬性,描述和組織信息資源,發(fā)現(xiàn)信息資源的語言和工具。2.元數(shù)據(jù)的描述對象:早期:元數(shù)據(jù)主要指網(wǎng)絡(luò)資源的描述數(shù)據(jù)后來:逐步擴大到各種以電子形式存在的信息資源的描述數(shù)據(jù)?,F(xiàn)在:元數(shù)據(jù)適用于各種類型信息資源的描述記錄。,1.信息資源組織原理,元數(shù)據(jù)的基本功能(1)識別。確認并對要進行組織的信息資源進行個別化描述,使用戶能識別被組織的資源對象。(2)定位。提供信息資源位置的信息,以便用戶訪問時使用。(3)檢索。通過在描述數(shù)據(jù)中提供檢索點,便于用戶對資源的檢索和利用。(4)選擇。通過記錄信息資源的特征,諸如主題、作者、類型、物理形式、層次和日期等,供用戶對信息資源的使用價值進行判斷,決定是否使用該資源。,2.信息資源的描述與揭示,1.文獻信息的著錄(1)著錄的基本概念:著錄:是指在編制文獻目錄時,對文獻內(nèi)容和形式特征進行分析、選擇和記錄的過程??钅浚褐浀慕Y(jié)果是款目,它是反映文獻內(nèi)容和形式特征的著錄項目的組合。目錄:將一批款目按照一定的次序編排而成的一種文獻報道和檢索工具。,2.信息資源的描述與揭示,(2)著錄的標準化:在國家或國際范圍內(nèi),對文獻著錄的原則、內(nèi)容、格式等做出具有一定約束力的規(guī)范。國際:1971年,國際圖書館協(xié)會聯(lián)合會(IFLA),單行著作國際標準書目著錄ISBD(M);1976年,出版了國際標準數(shù)目著錄總則ISBD(G)。中國:1983年7月,正式發(fā)表了全國文獻著錄標準系列中的《文獻著錄總則》(GB3792.1-83),其后,先后出版了各個分則。,2.信息資源的描述與揭示,文獻信息的標引(1)標引的基本概念:信息標引:指分析信息的內(nèi)容屬性(特征)及相關(guān)外表屬性,并用特定語言表達分析出的屬性或特征,從而賦予信息檢索標識的過程。標引語言:表達信息主題概念和檢索需求主題概念的簡明性、單義性和關(guān)聯(lián)性的概念標識系統(tǒng)。,2.信息資源的描述與揭示,信息標引包括主題分析和轉(zhuǎn)換標識兩個環(huán)節(jié)。主題分析:在了解和確定信息的內(nèi)容屬性以及幫助揭示內(nèi)容的某些外表屬性之后,將這些屬性概括為主題并用自然語言表述,同時分析主題概念之間或主題概念因素之間的結(jié)構(gòu)關(guān)系。轉(zhuǎn)換標識:用專門的主題概念或概念因素,構(gòu)成一定形式的檢索標識。,2.信息資源的描述與揭示,(2)標引的兩種主要類型:分類標引:采用分類語言的標引。分類語言用分類號表達主題概念,依據(jù)知識分類將主題概念組織、排列成類目體系,主要以類目體系的自身結(jié)構(gòu)顯示概念之間的關(guān)系。主題標引:采用主題語言的標引。主題語言是一種由受控的自然語言語詞直接表達主題概念,按語詞字順排列主題,主要用參照顯示概念之間關(guān)系的標引語言。,2.信息資源的描述與揭示,20世紀80、90年代誕生的大量規(guī)范:《文本編碼倡議》(TextEncodedInitiative,簡稱TEI)《都柏林核心集》(DublinCore,簡稱DC)《政府信息定位服務(wù)》(GovernmentInformationLocatorService,簡稱GILS)《多媒體內(nèi)容描述接口》(MultimediaContentDescriptionInterface,簡稱MPEG-7),2.信息資源的描述與揭示,1.MachineReadableCatalogue:MARC標準;起源:美國國會圖書館,1965年提出了“標準機器可讀目錄記錄款式的建議”,即MARCⅠ。1967年MARCⅡ誕生。特點:共有001~999個字段,其中999字段為用戶自定義字段;字段內(nèi)容著錄詳盡,字段下又設(shè)子字段以及重復(fù)字段;字段作用強化,可檢索的字段多每條MARC記錄可分為頭標區(qū)、目次區(qū)和數(shù)據(jù)區(qū)。,2.信息資源的描述與揭示,(1)USMARC(美國國會圖書館機讀目錄通信格式)在1995年,美國NDLP啟動,對USMARC做了一些修改:增加了“電子資源地址與存取”字段即856字段。(2)UNIMARC(國際機讀目錄通信格式)(3)CNMARC(中國機讀目錄格式),2.信息資源的描述與揭示,2.DublinCore(都柏林核心集)(1)起源于1995年在美國俄亥俄州都柏林市召開的元數(shù)據(jù)講習(xí)班。目前,已得到廣泛的承認和應(yīng)用,成為國際RFC2413和美國Z39.85標準。(http://dublincore.org)(2)作用:為描述網(wǎng)絡(luò)資源提供了一種規(guī)范。(3)15個核心元素DC元數(shù)據(jù)有15個核心內(nèi)容元素(element)。這15個元素組成了都柏林核心元數(shù)據(jù)元素集(DublinCoreElementSet)。,2.信息資源的描述與揭示,元素名稱說明Title標題資源標題Subject主題資源內(nèi)容的主題Description主題關(guān)于資源的簡要描述Type資源類別資源的內(nèi)容類別Source來源產(chǎn)生該資源的其他資源Relation關(guān)聯(lián)關(guān)系與其他資源的關(guān)系Coverage覆蓋范圍資源地理、時間或管理的范圍,2.信息資源的描述與揭示,元素名稱說明Creator創(chuàng)作者資源內(nèi)容的主要創(chuàng)作者Contributor其他貢獻者對資源做出其他貢獻的對象Publisher出版者資源的提供、發(fā)表、出版者Rights權(quán)限資源所屬或管理的權(quán)限信息Date日期資源生命周期中的特定日期Format資源格式資源的格式Language語言資源所使用的語言Identifier標識符對資源進行標識的識別信息,2.信息資源的描述與揭示,(4)DC的主要優(yōu)點:簡單易懂:15個元素通俗易懂運用靈活:它即可以用于規(guī)范的資源描述,也可以用于非專業(yè)領(lǐng)域國際通用:目前已有10多種不同語言的版本可擴展性:不僅有15個核心標記元素,子元素和擴展元素,還可以與其他元數(shù)據(jù)連接使用,3.網(wǎng)絡(luò)信息資源的組織,網(wǎng)絡(luò)信息的特點:組織的對象從各種類型的數(shù)據(jù)發(fā)展到更加豐富多彩的信息、信息鏈甚至知識;②組織的范圍從文獻內(nèi)、外特征深入到信息單元、知識單元;③組織的結(jié)果從靜態(tài)的文本格式發(fā)展到動態(tài)的多模式的鏈接;④組織的形式從數(shù)據(jù)結(jié)構(gòu)發(fā)展到知識表示。即要求信息組織的透明化、易用性;⑤組織的技術(shù)從手工單一發(fā)展到半自動化、自動化、智能化,即要求組織的標準化、兼容化。,3.網(wǎng)絡(luò)信息資源的組織,文件方式優(yōu)點:(1)簡單方便;(2)是存貯非結(jié)構(gòu)化信息的天然單元。缺點:(1)難以平衡網(wǎng)絡(luò)負載與文件數(shù)量的關(guān)系;(2)不能充分地顯示結(jié)構(gòu)化信息之間的結(jié)構(gòu)關(guān)系;(3)文件本身可看做信息單元,需要作為對象來管理。,3.網(wǎng)絡(luò)信息資源的組織,數(shù)據(jù)庫方式數(shù)據(jù)庫組織方式:是將所有已獲得的網(wǎng)絡(luò)信息資源以固定的記錄格式存貯,用戶通過關(guān)鍵詞及其組配查詢,就可以找到所需要的信息線索(即相關(guān)站點鏈接),并通過信息線索直接鏈接到相應(yīng)的網(wǎng)絡(luò)信息資源。,,,,檢索結(jié)果,,結(jié)構(gòu)化查詢,,,檢索結(jié)果,輸入檢索式,客戶端,服務(wù)器,數(shù)據(jù)庫,3.網(wǎng)絡(luò)信息資源的組織,優(yōu)點:(1)利用數(shù)據(jù)模型對信息進行了規(guī)范化處理,優(yōu)化了數(shù)據(jù)的查詢,提供一整套數(shù)據(jù)控制和操作的方法,利用信息項之間的聯(lián)系進行信息的重組和查詢,提高數(shù)據(jù)操作的靈活性;(2)數(shù)據(jù)的管理與應(yīng)用程序完全分離,大大降低了網(wǎng)絡(luò)傳輸?shù)呢撦d;(3)為多媒體信息、半結(jié)構(gòu)化信息以及非結(jié)構(gòu)化信息的組織提供良方。,3.網(wǎng)絡(luò)信息資源的組織,缺點:(1)不能提供數(shù)據(jù)信息之間的知識關(guān)聯(lián);數(shù)據(jù)庫組織方法是基于語用的組織,有嚴格的數(shù)據(jù)模型,單個數(shù)據(jù)項缺乏行為能力,所以難以顯示信息單元的知識內(nèi)容之間的語義關(guān)聯(lián)。(2)對用戶和服務(wù)器端都提出了較高的要求。,3.網(wǎng)絡(luò)信息資源的組織,主題樹組織方式:將信息資源按照某種事先確定的概念體系結(jié)構(gòu),分門別類地逐層加以組織,用戶通過瀏覽的方式逐層加以選擇,層層遍歷,并通過信息線索直接找到相應(yīng)的網(wǎng)絡(luò)信息資源。,3.網(wǎng)絡(luò)信息資源的組織,優(yōu)點:(1)簡單易用,屏蔽了網(wǎng)絡(luò)鏈接技術(shù)和資源獲取技術(shù)對用戶的復(fù)雜性,提供了一種基于樹型的瀏覽方式、簡單易用的信息檢索和利用界面;(2)信息檢索按照一定的范疇分類體系,逐次查看,對用戶而言,目的性強,查準率較高;(3)采用樹型目錄結(jié)構(gòu)組織信息資源,具有良好的可擴充性和較嚴密的系統(tǒng)性。,3.網(wǎng)絡(luò)信息資源的組織,缺點:(1)必須事先建立一套完整的范疇體系,用戶對使用的范疇體系有一定的了解,增加用戶的智力負擔;(2)要保證主題樹的結(jié)構(gòu)清晰性和資源可用性,主題范疇體系的結(jié)構(gòu)就不能過于復(fù)雜,每一類目下的信息檢索條目不宜過多,這就降低了該方式所能容納的信息資源的數(shù)量。,3.網(wǎng)絡(luò)信息資源的組織,超媒體技術(shù):是超文本技術(shù)與多媒體技術(shù)的結(jié)合,它將文字、圖像、聲音、視頻等多媒體信息以超文本的方式組織起來,用戶通過高度超級鏈接的網(wǎng)絡(luò)結(jié)構(gòu)在各種信息庫中航行,從而找到所需要的信息。,線性文本,多媒體,超文本,超媒體,,加大表現(xiàn)力,加大表現(xiàn)力,,,,引入網(wǎng)絡(luò)結(jié)構(gòu),引入網(wǎng)絡(luò)結(jié)構(gòu),3.網(wǎng)絡(luò)信息資源的組織,優(yōu)點:(1)是網(wǎng)絡(luò)信息組織未來的發(fā)展方向,是符合人們跳躍性思維習(xí)慣的非線性組織方式,具有良好的包容性和可擴充性;(2)超越媒體類型對信息組織與檢索的限制,實現(xiàn)了鏈接瀏覽的搜尋方式;(3)避免了檢索語言的復(fù)雜性。,3.網(wǎng)絡(luò)信息資源的組織,缺點:(1)采用瀏覽的方式搜尋信息,當超媒體網(wǎng)絡(luò)過于龐大時,很難迅速而準確地的定位;(2)很難保存瀏覽過程中的所有記錄,難以避免“迷航”現(xiàn)象。,教學(xué)總結(jié),,筆記整理,,Q&A,感謝您的關(guān)注!請您多多指導(dǎo)!,- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- CIDP14 公共 文化 信息資源 組織
鏈接地址:http://www.3dchina-expo.com/p-11495036.html