18禁网站免费,成年人黄色视频网站,熟妇高潮一区二区在线播放,国产精品高潮呻吟AV

學習啦>論文大全>管理論文>

關于信息組織論文(2)

時間: 家文952 分享

  關于信息組織論文篇二

  從Archie談網絡信息組織模式

  關鍵詞:網絡信息組織;Archie;元數(shù)據(jù);標簽

  摘要:回溯網絡信息組織模式的發(fā)展歷程,簡析歷史上曾流行的網絡信息組織模式存在的問題。如Archie花費用戶較多的時間去檢索信息、Gopher搜索信息耗費的時間較長,搜索引擎的查準率仍有待提高等。為此人們提出了元數(shù)據(jù)――一種提供關于信息資源或數(shù)據(jù)的結構化的數(shù)據(jù),試圖借助該方法來提高網絡信息組織與檢索。

  中圖分類號:G252文獻標識碼: A文章編號:1003-1588(2012)01-0080-05

  前言

  網絡信息資源存在著分布廣泛、格式多樣和易于變化等特點。如何使網絡信息有序化、為需求者所用是當代網絡信息組織者亟待解決的問題。十多年來,研究者付出了不懈的努力,提出并實踐了各種各樣的組織模式。從早期的Archie和Gopher系統(tǒng),到近期的搜索引擎和主題指南,都是這方面的努力成果1。每個信息組織模式的出現(xiàn),都使用戶以為網絡信息組織的問題已被解決,但是在后來的使用中人們仍然發(fā)現(xiàn)存在一些問題。為此,人們提出了元數(shù)據(jù)――一種提供關于信息資源或數(shù)據(jù)的結構化的數(shù)據(jù),試圖借助該方法來提高網絡信息組織與檢索。

  1網絡信息組織任務

  1.1 網絡信息組織

  隨著網絡覆蓋范圍的不斷擴大以及網絡技術的發(fā)展,網絡信息資源以光速度傳播并迅速增長。網絡成為一個越來越龐大且無序的信息資源集合,時效性很難掌握和控制。網絡共享性與開放性使得人人都可以借助互聯(lián)網索取、存放信息,形成了一個紛繁復雜的信息世界。因此對網絡信息進行組織非常必要,否則將給用戶選擇、利用網絡信息帶來很大不便。

  網絡信息組織是指采用一定的方法與模式,按照一定的原則將因特網上某一領域大量的、分散的、雜亂無章的、良莠不齊的信息通過搜索、評價、篩選、分析、標引、著錄、排序、存貯等手段進行加工處理,使其形成一個有序的、便于用戶獲取與利用的信息系統(tǒng)的過程,其根本目的在于促進網絡信息被更快捷、方便地檢索與利用2。網絡信息組織的結果不應僅局限于建立有序的信息空間和便于用戶獲取信息,還應該有利于用戶理解、判斷與獲得知識。這就賦予了網絡信息組織更多的任務。

  1.2網絡信息組織任務

  (1)能根據(jù)語義、應用和結構需要對信息進行標記、定義、描述、驗證、識別和解釋。

  (2)能運用邏輯、語義、語法對信息內容進行確認、指向、析取、過濾、鏈接、集合和重組。

  (3)能根據(jù)語義關系、知識體系或用戶對象對信息內容組織格式和表現(xiàn)形式進行標記、定義和轉換。

  (4)能以計算機可識別、理解和解析的方式實現(xiàn)上述功能,支持只能代理對信息內容及其交流處理過程的自動處理。

  (5)能根據(jù)用戶的具體需要和應用環(huán)境調整上述能力及其實現(xiàn)方式。能根據(jù)新的文獻形式、技術能力、媒體形式和系統(tǒng)形態(tài)調整和發(fā)展上述能力及其實現(xiàn)方式3。

  如圖1表示了網絡信息組織任務的模塊與流程。通過此信息組織任務框架,信息將能真正根據(jù)用戶在其信息活動過程中動態(tài)地獲取、析取、組織、轉換、集成信息。

  圖1信息組織任務系統(tǒng)

  鐘瑩:從Archie談網絡信息組織模式*

  2網絡信息組織模式發(fā)展歷史

  十多年來,研究者付出了不懈的努力,提出并實踐了各種各樣的組織模式來序化網絡信息資源,讓其更好、更快地為人們服務。網絡信息組織模式經歷了從早期的Archie系統(tǒng)、Gopher系統(tǒng),到后來的搜索引擎,每個信息組織模式的出現(xiàn)都解決了當時用戶使用過程中遇到的一些問題。

  2.1Archie系統(tǒng)

  2.1.1Archie系統(tǒng)簡介

  Archie系統(tǒng)指自動追蹤Inerne上匿名文件傳輸站點及其收藏的文件名稱,并定期更新上述信息,以供用戶查詢的系統(tǒng)。我們能通過Archie服務器對Inerne上的FP服務器進行文件信息查找,從而得知該文件現(xiàn)在在什么地方能下載,有多大,最新版本號等4。

  使用Archie服務器有三種途徑:方法一,通過遠程登錄到Archie主機,用Archie注冊成功后,一個Archie客戶程序將自動執(zhí)行,用戶逐一輸入指令告訴Archie想查尋的內容,Archie 將檢索自己的數(shù)據(jù)庫并顯示檢索的結果; 方法二,利用Archie客戶機的程序,用戶只需告訴Archie客戶機程序想要的內容,該程序就自動聯(lián)結到一臺 Archie 服務器上申請執(zhí)行查尋,并代表用戶接受查尋結果輸出,然后顯示結果;方法三,通過郵件獲得Archie服務,Archie將執(zhí)行用戶郵件的請求,并寄回執(zhí)行結果。

  2.1.2Archie系統(tǒng)優(yōu)評價

  Archie對FP資料庫定期更新,用戶聯(lián)機查詢時,它就直接在自己的資料庫里找,而不是在Inerne資料庫中查找,導致有時搜索出的文件內容和文件夾名并不相符,用戶需要花時間把查到的文件都瀏覽確認,才能從中挑出真正有用的信息。這樣,既浪費了用戶的時間和精力,而且也占用了網絡資源。

  2.2Gopher系統(tǒng)

  2.2.1 Gopher系統(tǒng)簡介

  Gopher系統(tǒng)是在美國明尼蘇達大學(Universiy of Minnesoa)設計完成的,Gopher客戶程序和Gopher服務器相連接,使用菜單結構顯示其中的菜單、文檔或文件,并進行索引,同時可通過elne遠程訪問其他應用程序。Gopher協(xié)議使得Inerne上的所有Gopher客戶程序,能夠與Inerne上的所有已“注冊”的Gopher服務器進行對話。 Gopher是Inerne工具中最激動人心的發(fā)展之一,它使用戶不必具備專門的技術水平,就能在網絡中迅速找到很多資源。

  使用Gopher 系統(tǒng)時,只需用Nescape在Address正文框中輸入gopher://URL即可。Gopher菜單選項由一些鏈接代表,單擊一個鏈接就可以選中一個選項。如果這個選項引導另一個菜單,那么它會在窗口中顯示出來。如果它引導一個某種類型的文件,這個文件將以標準方式被傳輸,并且如果Nescape能夠顯示和播放它,就可以顯示完整的信息5。隨時代發(fā)展,如今的Gopher的特性很類似于信息傳播系統(tǒng),可以被用來傳播信息,也可以被用作商業(yè)客戶服務系統(tǒng)等。

  2.2.2Gopher系統(tǒng)評價

  Gopher是一個分散式文件查詢系統(tǒng),用戶通過簡單的畫面選單,就能搜尋、索取資料。用戶要連上某一臺Gopher服務器,才能一層層進入全球各處的Gopher系統(tǒng)。至于各個Gopher服務器提供什么服務,就必須進入各個服務器后才知道。Gopher系統(tǒng)在使用上較為直觀、便捷,但是搜索資料時仍然需要花費較多的時間。

  2.3搜索引擎

  2.3.1搜索引擎簡介

  搜索引擎(Search engine)是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務,將用戶檢索的信息展示給用戶的系統(tǒng)。

  搜索引擎服務方式分為目錄服務和關鍵字檢索兩種服務方式。通過目錄服務方式,用戶可按照分類目錄找到所需要的信息。目錄索引雖然有搜索功能,但嚴格意義上不能稱為真正的搜索引擎,只是按目錄分類的網站鏈接列表而已。應用關鍵字檢索方式時,用戶則依靠關鍵詞(Keywords)進行查詢,用戶輸入關鍵詞后,搜索引擎從索引數(shù)據(jù)庫中找到匹配該關鍵詞的網頁,為了用戶便于判斷,除了網頁標題和URL外,還會提供一段來自網頁的摘要以及其他信息。

  2.3.2搜索引擎評價

  搜索引擎查準率比較低。目前通過搜索引擎檢索的網絡信息資源相關性非常差,浪費了用戶大量時間去進行判斷。每一個搜索引擎都有自己的檢索規(guī)則,用戶利用不同的搜索引擎需要不同的過程進行適應,增加了用戶的負擔。多數(shù)搜索引擎采用關鍵詞檢索,并提供高級檢索功能,但用戶很難通過組配關鍵詞來準確表達自己的信息需求,導致檢索效率低下。隨著網絡信息數(shù)量的指數(shù)增長,引擎數(shù)據(jù)庫急劇膨脹,檢索速度也將會變慢 6。

  3使用元數(shù)據(jù)改進網絡信息組織模式

  研究者在這十多年進行了多種嘗試,并且建立了多種網絡信息資源組織模式來序化網絡信息資源。然而,這些組織模式總是無可避免地存在著不同的缺陷。如Archie花費用戶較多的時間去檢索信息,Gopher搜索信息耗費的時間較長,搜索引擎的查準率仍有待提高等。這些組織模式都暫時無法真正滿足用戶對網絡信息資源的使用要求,直到元數(shù)據(jù)的出現(xiàn)。

  3.1元數(shù)據(jù)簡介

  3.1.1元數(shù)據(jù)及其主要形態(tài)

  作為“描述數(shù)據(jù)的數(shù)據(jù)”,元數(shù)據(jù)是有效組織、管理、利用信息資源的一種工具。Amanda Xu 認為元數(shù)據(jù)包括用于描述信息對象的內容和位置的數(shù)據(jù)元素集,促進了網絡環(huán)境中信息對象的發(fā)現(xiàn)和檢索 7。1999年9月,國際圖聯(lián)將元數(shù)據(jù)定義為描述數(shù)據(jù)的數(shù)據(jù),以及可用來協(xié)助對網絡電子資源進行辨識、描述與指示其位置的任何數(shù)據(jù) 8。同年,Arlene G. aylor提出:“元數(shù)據(jù)是對信息包(Informaion package)的編碼描述,元數(shù)據(jù)之目的在于提供一個中間級別的描述,使得人們據(jù)此就可以做出選擇,確定孰為其想要瀏覽或檢索的信息包,而無需檢索大量不相關的全文文本。” 9

  元數(shù)據(jù)是多樣化的。隨著網絡技術的發(fā)展,不同領域的數(shù)據(jù)特點和應用需要,眾多的Meadaa格式在不同的領域出現(xiàn),呈現(xiàn)出不同的形態(tài),主要包括網絡資源、數(shù)字圖像、連續(xù)圖像、地理空間信息、社會科學數(shù)據(jù)集、檔案庫與資源信息等。

  3.1.2描述網絡信息的元數(shù)據(jù)

  網絡資源領域最重要的元數(shù)據(jù)是ROADS(Resource Organizaion and Discovery in Subjec-based Service),即主題信息服務的資源組織和發(fā)現(xiàn)。ROADS是英國高等教育系統(tǒng)對互聯(lián)網信息資源進行收集、組織并提供檢索服務的系統(tǒng),其主要目標是建立一個主題信息網關平臺,幫助信息服務機構快速構建能夠有效組織和檢索專業(yè)領域信息的系統(tǒng) 10。ROADS網關建立在包括ROADS記錄的數(shù)據(jù)庫之上,這些記錄描述了網絡資源,其中包括資源題名、資源擁有者、關鍵詞等信息。同時ROADS也有一個高度可構造的開放式的軟件工具箱。這些軟件高度是可設置的,它提供一種極富彈性的網管管理(gaeway adminisraion)的方法,允許用戶根據(jù)自己的需要設置用戶界面。

  ROADS系統(tǒng)利用一組元數(shù)據(jù)應用模板來定義和組織元數(shù)據(jù),包括資源集合(Collecion)、數(shù)據(jù)集(Daase)、文件(Documen)、柏林核心元數(shù)據(jù)集(Dublin Core)、服務(Service)等。該模板基于IAA(Inerne Anonymous FP Archive)格式,可以描述不同類型的互聯(lián)網資源,并且可以實現(xiàn)與其他元數(shù)據(jù)的映射。ROADS將關于機構、個人、代理、登錄控制的元素組合成相應的元素組,供各個應用元數(shù)據(jù)模板根據(jù)實際需要復制這些元素組的相關元素。

  3.2元數(shù)據(jù)在網絡信息組織的作用

  3.2.1描述作用

  根據(jù)元數(shù)據(jù)的定義,它最基本的功能就在于對信息對象的內容和位置進行描述,從而為信息對象的存取與利用奠定必要的基礎 11。元數(shù)據(jù)對信息對象描述的詳簡程度,隨所采用元數(shù)據(jù)格式不同而有所差異。

  3.2.2定位作用

  網絡信息資源沒有具體的實體存在,因此,明確它的定位至關重要。元數(shù)據(jù)包含有關網絡信息資源位置方面的信息,由此便可確定資源的位置所在,促進了對網絡環(huán)境中信息對象的發(fā)現(xiàn)和檢索。此外,在信息對象的元數(shù)據(jù)確定以后,信息對象在數(shù)據(jù)庫或集合體中的位置也就確定了。

  3.2.3搜尋作用

  元數(shù)據(jù)提供搜尋的基礎,進而在著錄的過程中將信息對象中的重要信息抽出并加以組織,賦予語意,并在其中建立相互關系,使檢索結果更加準確。從而有利于用戶識別資源的價值,發(fā)現(xiàn)其真正需要的資源。

  3.2.4選擇作用

  處于不同情境下,用戶需要借助不同的資源去解決各種各樣的實際問題。如何從海量資源庫中選取適宜的資源往往就是用戶首先面臨的難題。應用元數(shù)據(jù)后,這個難題將得以解決:根據(jù)元數(shù)據(jù)所提供的描述信息,參照相應的評估標準,結合使用環(huán)境,用戶便能夠對信息對象進行取舍,選擇合適的資源 12。

  3.3網絡信息組織對元數(shù)據(jù)的高度依賴

  從上述元數(shù)據(jù)的作用分析可以看出,在網絡信息組織中,元數(shù)據(jù)具有非常重要的作用,網絡信息組織對元數(shù)據(jù)有著高度的依賴性。

  3.3.1信息的描述與揭示離不開元數(shù)據(jù)

  (1)使用元數(shù)據(jù)描述網絡信息內容和本質特征,存儲相應的檢索路徑,使網絡信息便于被發(fā)現(xiàn),提高信息資源的查全率和查準率。

  (2)使用元數(shù)據(jù)提供數(shù)據(jù)之間的關系,指出相關數(shù)據(jù)的地址和存取方法。

  (3)使用對網絡信息資源進行分類,便于日后有效選擇用戶所感興趣的信息。

  (4)使用對某些缺少文本的數(shù)據(jù)(如聲音、圖像等)進行文字說明,對描述對象有一個完整的描述。

  3.3.2信息的發(fā)現(xiàn)與選擇離不開元數(shù)據(jù)

  網絡的迅速發(fā)展為信息資源的生成帶來了極大便利,任何人都可以成為信息資源的創(chuàng)建者。然而,資源創(chuàng)建者自身素質的差異和網絡出版監(jiān)督機制的缺乏,造成了網絡信息資源質量的良莠不齊。因此,網絡信息組織的一個重要任務是通過信息資源創(chuàng)建者提供的簡單元數(shù)據(jù),對良莠不齊的信息資源進行嚴格的篩選和整合,形成高品質的信息提供給用戶使用。

  3.3.3信息的整合與集成離不開元數(shù)據(jù)

  在網絡信息資源組織中,元數(shù)據(jù)是操作數(shù)據(jù)后面的數(shù)據(jù),它的目標是提供數(shù)據(jù)資源的全面指南。在對數(shù)據(jù)操作的每一個環(huán)節(jié)上,都有兩種類型的數(shù)據(jù)在進行交換,一種是原始數(shù)據(jù),它是用戶所需要的實際數(shù)據(jù);另一種是元數(shù)據(jù),它為原始數(shù)據(jù)提供上下文環(huán)境。這種上下文環(huán)境可以從數(shù)據(jù)的靜態(tài)或結構特征擴展到動態(tài)的或者運動的特征。元數(shù)據(jù)體系就發(fā)揮了這種整合、集成的功能,承擔了各種元數(shù)據(jù)系統(tǒng)的轉換與解釋,為用戶提供統(tǒng)一的集成服務。

  3.4元數(shù)據(jù)的應用

  元數(shù)據(jù)的應用范圍非常廣泛。Sheh等認為元數(shù)據(jù)可應用于視頻、圖像檢索、導航和圖像集合的瀏覽,結構化的文獻管理,地理和環(huán)境信息系統(tǒng),數(shù)字圖書館,支持信息存取的混合多媒體等 13。

  以雅虎2008年推出的搜索開發(fā)平臺Search Monkey為例,此搜索開發(fā)平臺使用結構數(shù)據(jù)來改善搜索結果,并添加增強標記使得信息呈現(xiàn)得“更有意義”。具體工作原理如下(見圖2)。

  (1) 元數(shù)據(jù)被嵌入到網頁中(microformas, eRDF, RDFa),雅虎抓取工具通過檢索被添加到網頁的元數(shù)據(jù)(而并非全文),以提供用戶最佳體驗為優(yōu)先準則進行篩選和生成結果。

  (2) 客戶的請求服務通過XSL(Exensible Syleshee Language ransformaions,擴展樣式表轉換語言)從網頁提取元數(shù)據(jù)。

  (3) 元數(shù)據(jù)可由出版商自定義,但需定期審查。

  圖2搜索開發(fā)平臺Search Monkey工作原理

  近年,標簽形式的社會性語義越來越占據(jù)主導地位,而元數(shù)據(jù)在這種新形式的信息內容表達、檢索和管理方面發(fā)揮了重要作用。與專業(yè)圖書館員描述的傳統(tǒng)主題詞索引不同的是,這些社會性語義標簽由用戶產生,并指定給他們感興趣的信息對象 14。以Flickr網站為例說明元數(shù)據(jù)如何實現(xiàn)社會性標簽。Flickr是 一個圖片服務網站,它提供圖片存放、組群等服務。如圖3所示,用戶上傳圖片后,將會被要求給每一張圖片加入標題(ile)、說明(Descripion)、標簽(ag,為索引、搜索時用)。而用戶所填寫的描述元素便是元數(shù)據(jù),其中“標簽(ags)”可理解為該照片的關鍵字,搜索時便可以據(jù)此找到相對應圖片。同時,當指定拍攝地點或照片的主題時,創(chuàng)作者也能很快了解相同標簽(ags)下有哪些其他創(chuàng)作者所分享的照片(見圖4)。

  圖3用戶為圖片添加手工元數(shù)據(jù)

  圖4用戶根據(jù)主題搜索圖片

  4結語

  目前網絡信息資源的組織呈現(xiàn)多種模式并存的態(tài)勢,但不容置疑的是使用元數(shù)據(jù)進行網絡信息資源的組織正逐漸成為主流。這也正與信息資源組織從形式組織轉至知識組織的整體發(fā)展相吻合。元數(shù)據(jù)研究的深化和發(fā)展必將為網絡信息資源的有序組織、適度控制和高效檢索提供更為便利的條件。我們希望能使用元數(shù)據(jù)組織方式更好地組織網絡信息資源,同時通過這種方式組織的信息資源模式可以滿足更多用戶的需求。

  參考文獻:

  [1][11][12]劉嘉.元數(shù)據(jù)導論[M].北京:華藝出版社,2001.

  [2]謝曉專. 網絡信息資源組織模式研究[J].圖書情報工作, 2006( l): 64-67.

  [3]張曉林.元數(shù)據(jù)研究與應用[M].北京:北京圖書館出版社,2002.

  [4]祈暉.在Inerne上使用Archie服務[J].上海微型計算機, 1999(5): 26.

  [5]黃靜. Archie,Gopher,WAIS

  [6]曾偉忠.搜索引擎及元搜索引擎工作原理及存在的不足[J].圖書館學刊, 2005( 5): 58-59.

  [7]Amanda Xu. Meadaa Conversion and he Library OPAC[J]. he Serials Librarian, 1997 (1):179-198.

  [8]IFLA. Digial libraries: meadaa resources[EB/OL] . hp://ifla.省略/II/meadaa.hm ,1999.

  [9]Arlene G. aylor. he Organizaion of Informaion[M]. Libraries Unlimied Inc,2003.

  [10]肖瓏,趙亮.中文元數(shù)據(jù)概論與實例[M].北京:北京圖書館出版社,2007.

  [13]Sheh,Ami,Klas,Wolfgang,ed.Mulimedia daa managemen:using medaada o inegrae and apply digial media[M].New York:McGraw-Hill Co.,Inc.,1998.

  [14]Miao Chen,Xiaozhong Liu,Jian Qin. 從社會性標簽中進行語義關系抽取――一種元數(shù)據(jù)生成方法[J].現(xiàn)代圖書情報技術, 2009( 3): 38-45.

  
看了“關于信息組織論文”的人還看:

1.淺談信息工程相關論文

2.畢業(yè)生信息管理論文題目

3.信息化管理論文

4.論信息時代的學校網絡教學論文

5.軍隊信息系統(tǒng)管理論文

2664572