時間:2023-11-06 09:58:18
序論:速發(fā)表網(wǎng)結(jié)合其深厚的文秘經(jīng)驗,特別為您篩選了11篇信息資源分類范文。如果您需要更多原創(chuàng)資料,歡迎隨時與我們的客服老師聯(lián)系,希望您能從中汲取靈感和知識!
高校圖書館信息資源整合是指將高校圖書館中各種類型、各種形式和各地分布的多樣化的信息資源進(jìn)行有效組織,通過一定的方式形成統(tǒng)一的資源布局和服務(wù)模式,發(fā)揮各種信息資源的優(yōu)勢,形成更加高效的信息服務(wù)體系。
(一)信息資源組成現(xiàn)狀
隨著高校圖書館規(guī)模的不斷擴(kuò)大,收藏的資源種類也在不斷豐富,信息資源的種類、載體和文獻(xiàn)介質(zhì)也變得更加復(fù)雜化、多樣化,紙質(zhì)文獻(xiàn)資源在不斷持續(xù)增長的同時,各種電子資源,如音像、光盤、電子期刊、網(wǎng)絡(luò)知識數(shù)據(jù)庫、電子圖書等也在不斷增長,這些資源構(gòu)成了高校圖書館信息資源的重要部分。
(二)信息資源整合必要性分析
結(jié)合本校圖書館的實際情況,由于館舍、管理模式、歷史傳統(tǒng)等方面因素,造成了信息資源的相對分散,館內(nèi)資源與資料室彼此獨立、紙質(zhì)文獻(xiàn)與電子文獻(xiàn)檢索資源相對獨立的現(xiàn)狀,這種情況對信息資源的有效利用產(chǎn)生了影響?,F(xiàn)如今,各館文獻(xiàn)資源的多樣化要求高校圖書館人對信息資源進(jìn)行合理布局、有效整合,也就是對其內(nèi)容和對象進(jìn)行擴(kuò)展,方便信息分類研究,提高資源利用效率,便于為讀者提供更優(yōu)質(zhì)的檢索服務(wù)。
鑒于在實際中上述問題的存在,高校圖書館有必要對信息資源進(jìn)行整合。
二、高校圖書館信息資源整合中存在的實際問題
(一)信息資源整合存在效率低的問題
針對存在問題,需要有一個行業(yè)類的統(tǒng)一標(biāo)準(zhǔn)和規(guī)范來規(guī)整信息資源整合方式;其次,就是對整合后的資源導(dǎo)航設(shè)置沒有明確的界定,使得人員使用時出現(xiàn)混淆,降低使用效率;另者,缺乏引導(dǎo)性的交互功效。
(二)缺乏專業(yè)技術(shù)人員
雖然現(xiàn)階段高校圖書館人員的整體素質(zhì)在不斷提高,但是與信息資源整合這一學(xué)科相交互的人員卻很少,對信息資源整合方面的研究產(chǎn)生了直接影響。
(三)信息資源整合服務(wù)對讀者的宣傳力度不夠
高校圖書館進(jìn)行信息資源整合需要花費大量的時間和精力,但是不是閉門造車式的整合,需要更多地聽取本校讀者的意見,擴(kuò)大讀者對信息資源使用的熟知度,了解他們的閱讀習(xí)慣,走訪各院系,結(jié)合本校的特色信息資源使開發(fā)出的系統(tǒng)適合本校實際,充分發(fā)揮高校圖書館在高校教書育人中所起的重要作用。
三、本校圖書館信息資源整合的框架
(一)信息資源整合原則
1.信息資源優(yōu)略互補原則。在本校圖書館現(xiàn)階段的信息資源可以大體分為紙質(zhì)資源、電子資源以及網(wǎng)絡(luò)資源,這些資源之間看似相互獨立,但是又都各自發(fā)揮著自身的優(yōu)勢。有的在資源檢索過程中可以被交互使用,有的則體現(xiàn)著相互之間補充的作用。在進(jìn)行資源整合時,需要充分發(fā)揮每類資源的優(yōu)勢,補充劣勢資源,達(dá)到互補的效果。
2.信息資源最大化利用原則。結(jié)合本館實際,本著“服務(wù)讀者,以書育人”的宗旨,了解讀者對資源使用的偏好,可以在各系發(fā)放問卷調(diào)查,對來訪學(xué)生進(jìn)行抽樣調(diào)查,按照讀者的借閱習(xí)慣、檢索方式整合適合本校讀者的資源檢索途徑,形成統(tǒng)一的檢索平臺,建立具有本校特色的檢索服務(wù)。
3.信息資源整合通用性原則。擬進(jìn)行的信息資源整合,應(yīng)該是建立在對當(dāng)前行業(yè)標(biāo)準(zhǔn)熟知,科學(xué)化、合理化研究的情況下,這樣才能保證本館各項工作有條不紊地進(jìn)行。
4.信息資源整合互通性原則。擬進(jìn)行的資源整合構(gòu)架是建立在之前各類資源的基礎(chǔ)上的,具有統(tǒng)一檢索入口的平臺,它是對之前各類信息資源的便捷性使用,不是對各類信息資源的替代。
(二)信息資源整合方式
1.以導(dǎo)航條對信息資源進(jìn)行整合。此種方式是將信息資源的檢索入口統(tǒng)一整合在一起,創(chuàng)建資源導(dǎo)航窗口,按照信息資源的名稱、摘要、關(guān)鍵字、內(nèi)容、獲取鏈接方式等依次排列,使其可以更加全面地了解館內(nèi)資源的情況。讀者可以根據(jù)自己的需求選擇資源類型,如紙質(zhì)資源、電子資源、數(shù)據(jù)庫資源、期刊資源、會議論文、碩博士論文等資源信息。
2.以目錄對信息資源進(jìn)行整合。根據(jù)本館現(xiàn)有圖書館信息資源逐年增加的趨勢,信息資源的種類和形式變得多元化,針對一本紙質(zhì)圖書而言,它不僅有光盤、音頻資料,有的還有電子版、網(wǎng)絡(luò)版等,可以將它們通過現(xiàn)有的編目提供透明,便于讀者找到需要書籍的相關(guān)資源。
3.以數(shù)據(jù)庫形式對資源進(jìn)行整合。由于各個電子資源提供商提供的信息資源都是依據(jù)自身的特點所設(shè)計的,它們所采用的數(shù)據(jù)庫類型也各有千秋,存在自建數(shù)據(jù)庫(內(nèi)容有時有重復(fù))、網(wǎng)絡(luò)數(shù)據(jù)庫、光盤數(shù)據(jù)庫等,它們的檢索界面不統(tǒng)一,檢索方式不相同,形成“信息孤島”現(xiàn)象。可以開發(fā)相應(yīng)的系統(tǒng),為讀者提供一個可以進(jìn)行統(tǒng)一檢索的界面,針對有重復(fù)的信息資源,系統(tǒng)可以設(shè)置操作,拼配出需要的資源,自動篩選掉,節(jié)省讀者閱讀時間,大大提高檢索效率,在很大程度上提高信息資源的利用率,使信息的增值服務(wù)達(dá)到最大化。
四、高校圖書館特色信息資源整合發(fā)展策略
針對高校圖書館在信息化建設(shè)中做出的信息資源整合策略,結(jié)合現(xiàn)階段所存在的問題,可以通過以下途徑對高校圖書館信息資源整合做出合理應(yīng)對。
(一)快速轉(zhuǎn)變觀念以適應(yīng)新的發(fā)展趨勢
對信息資源的整合是一個全新的概念,從客觀角度講,新事物在發(fā)展和實施初期會有一定程度的阻礙,因此,使之受到大家的接受和認(rèn)可就需要一個過程,需要加大對這方面的宣傳和推廣力度,只有大家接受了,在以后的整合建設(shè)過程中才會得到進(jìn)一步發(fā)展。
(二)加強對館員的培訓(xùn)力度,使其熟知新事物
信息資源整合是目前適應(yīng)新形勢下受大家關(guān)注的課題,這對館員的專業(yè)能力提出了更高的要求,需要高校圖書館在引入新技術(shù)的同時也要加強館員的在職培訓(xùn)工作,使得當(dāng)代圖書館人具備專業(yè)的學(xué)科水平和專業(yè)的技術(shù)水平,適應(yīng)新形勢下的要求。
(三)結(jié)合本館實際,研發(fā)信息資源整合平臺
伴隨著信息資源的不斷豐富,數(shù)據(jù)庫資源也不斷增加。要結(jié)合本館實際,有針對性地研發(fā)有本校特色的信息資源整合平臺。
(四)廣泛吸取經(jīng)驗,加快高校圖書館信息化建設(shè)步伐
我國高校圖書館的信息化整合起步較晚,因此,在對信息資源整合的過程中可以借鑒國外先進(jìn)的整合經(jīng)驗,并結(jié)合本校實際加以合理利用,做到與國際接軌,充分感受信息化建設(shè)帶給高校圖書館的便利,加快本館的信息化整合力度。
(五)對自身網(wǎng)絡(luò)進(jìn)行兼顧,對信息資源的安全進(jìn)行保障
影響信息資源安全的因素可以歸結(jié)為兩點:一是人為的對信息資源的惡意破壞;二是信息資源本身的脆弱性所致。對于外部對信息資源的侵害,可以采取在操作系統(tǒng)上打補丁、裝防火墻、對圖書館內(nèi)的內(nèi)外網(wǎng)進(jìn)行實時監(jiān)測等措施,對外來入侵進(jìn)行提前預(yù)防,保證信息資源的安全。而對于信息資源本身的問題則主要是會對計算機系統(tǒng)產(chǎn)生破壞,損壞數(shù)據(jù)庫,導(dǎo)致數(shù)據(jù)失竊,使得工作人員權(quán)限改變等問題,針對上述問題可以采取對數(shù)據(jù)庫進(jìn)行加密,對數(shù)據(jù)庫用戶進(jìn)行權(quán)限分配。
〔分類號〕G250.7
Classification Schema Design in Integrated System of Information Resources and Services in Science and Technology Field
Song Wen Sun Tan Zhou Jingyi Zhang Zhixiong Xu Tan
National Science Library, CAS, Beijing 100080
〔Abstract〕Based on the infrastructure of UDDI, the authors analyze the types and characteristics of resources and services which need to be integrated in the description system of science and technology resources and services, and of the description specifications in UDDI and main classification schema in present. The authors design a classification schema of integrated system of information resources and services in science and technology field.
〔Keywords〕integrated system web service UDDI classification schema
1系統(tǒng)總體結(jié)構(gòu)
科技信息資源和服務(wù)集成揭示系統(tǒng)是國家科技基礎(chǔ)條件保障平臺的建設(shè)項目,采用開放聯(lián)合的模式,集成揭示國家科技圖書文獻(xiàn)中心、國家圖書館、中國科學(xué)院國家科學(xué)圖書館、CALIS的數(shù)字資源和服務(wù)系統(tǒng),向用戶提供一站式的資源發(fā)現(xiàn)和檢索服務(wù)。
系統(tǒng)采用Web Service技術(shù)體系,整個系統(tǒng)分4個子系統(tǒng):
集成檢索門戶:提供用戶資源發(fā)現(xiàn)和檢索的入口。
開放登記系統(tǒng):對資源進(jìn)行統(tǒng)一規(guī)范的登記注冊,提供資源的發(fā)現(xiàn)服務(wù)。
Web服務(wù)封裝:對參建單位的資源按Web Service規(guī)范進(jìn)行封裝和元數(shù)據(jù)映射,以便集成檢索系統(tǒng)的調(diào)用。
分布式集成檢索:嵌入在集成檢索門戶中,當(dāng)用戶選擇資源提交檢索請求時,分布式檢索系統(tǒng)到資源登記系統(tǒng)獲取資源的入口地址和有關(guān)調(diào)用參數(shù),向各資源服務(wù)系統(tǒng)提交檢索請求,對檢索結(jié)果集進(jìn)行整合,返回用戶。
2UDDI登記系統(tǒng)中的分類思想
Web Service的關(guān)鍵技術(shù)包括SOAP、WSDL和UDDI。SOAP提供了一種應(yīng)用程序與Web服務(wù)進(jìn)行通訊的機制,WSDL提供了一種向其他應(yīng)用程序描述Web服務(wù)的方法,而UDDI用于創(chuàng)建Web服務(wù)注冊中心,提供對Web服務(wù)的集中發(fā)現(xiàn)機制。
2.1UDDI的數(shù)據(jù)結(jié)構(gòu)
UDDI對Web服務(wù)的描述由4個具有等級層次的核心數(shù)據(jù)組成[1]:businessEntity、businessService、bindingTemplate和tModel。
businessEntity是UDDI中的頂層數(shù)據(jù)結(jié)構(gòu),這一層次的元數(shù)據(jù)實現(xiàn)對服務(wù)的擁有者或管理者的描述,如機構(gòu)名稱、通訊地址、聯(lián)系人等信息。在businessEntity數(shù)據(jù)中還包括機構(gòu)提供的服務(wù),通過該元素實現(xiàn)機構(gòu)數(shù)據(jù)對服務(wù)描述數(shù)據(jù)的包含。
businessService結(jié)構(gòu)描述一個邏輯服務(wù)單元。每個busin-essService包括服務(wù)的描述性信息,如服務(wù)的名稱、服務(wù)的分類等。businessService結(jié)構(gòu)包含bindingTemplate,通過其所包含的bindingTemplate實現(xiàn)對服務(wù)的技術(shù)參數(shù)的描述。
bindingTemplate結(jié)構(gòu)描述應(yīng)用程序與web服務(wù)進(jìn)行交互時所需要的技術(shù)信息,至少必須包括服務(wù)的入口地址。bindingTemplate引用tModel說明服務(wù)的類型、遵從的規(guī)范和標(biāo)準(zhǔn)等。
tModels數(shù)據(jù)描述web服務(wù)遵從的規(guī)范、協(xié)議。對tModels的引用是在bindingTemplate中,這樣tModels能被多個bindingTemplates引用。引用到完全相同的一組tModels的bindingTemplate被認(rèn)為有相同的“技術(shù)指紋”。
如果一個機構(gòu)需要對其Web服務(wù)進(jìn)行注冊,首先需要注冊businessEntity元素,在對機構(gòu)數(shù)據(jù)進(jìn)行注冊后,可以注冊機構(gòu)的Web服務(wù)。在UDDI系統(tǒng)中,一個機構(gòu)只能注冊一次,對應(yīng)一個businessEntity。由于一個機構(gòu)可以提供多個邏輯服務(wù),所以一個businessEntity數(shù)據(jù)可對應(yīng)多個businessService。
一個Web服務(wù)可以在多個站點提供服務(wù),一個binding-Template描述一個特定地址的Web服務(wù)的技術(shù)信息,一個businessService數(shù)據(jù)可以對應(yīng)多個bindingTemplate數(shù)據(jù)。由于一個Web服務(wù)可以應(yīng)用多個技術(shù)標(biāo)準(zhǔn)或協(xié)議,所以一個bin-dingTemplate數(shù)據(jù)可以包涵對多個tModel數(shù)據(jù)的引用。
tModel數(shù)據(jù)不是某個機構(gòu)的特定服務(wù)專用的,在UDDI系統(tǒng)中,鼓勵tModel數(shù)據(jù)的共享,這樣可以促進(jìn)不同的Web服務(wù)之間的互操作。
2.2UDDI中的分類數(shù)據(jù)
基于分類的實體登記、發(fā)現(xiàn)技術(shù)是UDDI系統(tǒng)的核心技術(shù)。UDDI提供了一種結(jié)構(gòu)和框架,可以從多緯度對數(shù)據(jù)模型中的各個實體進(jìn)行分類。
UDDI通過categoryBag元素對實體進(jìn)行分類,categoryBag包含一個或多個keyedReference子元素, 一個keyedReference包含三個屬性:
tModelKey: 指向一個tModel。
keyName: 分類系統(tǒng)的名稱或簡短描述。
keyValue: 該實體在分類系統(tǒng)中的分類值。
tModel指向Web服務(wù)遵循的技術(shù)標(biāo)準(zhǔn),在UDDI系統(tǒng)中,分類體系同樣使用tModel進(jìn)行定義,一個tModel指向一個分類體系。tModel數(shù)據(jù)結(jié)構(gòu)中,包括分類體系的簡單信息,tModel中一個重要的數(shù)據(jù)元素是overviewDoc,該元素包含一個遠(yuǎn)程的.
【中圖分類號】G420 【文獻(xiàn)標(biāo)識碼】B【論文編號】1009―8097(2010)04―0108―04
一 引言
在有大規(guī)模用戶參與的教育資源建設(shè)和地區(qū)級有組織的教育資源共建共享項目中,教育資源存儲都采取了服務(wù)器集群、分布式存儲等方式,以應(yīng)對用戶上傳下載。但一般資源元數(shù)據(jù)信息都采取集中存儲的方式[2][3][4],在用戶規(guī)模不斷擴(kuò)大的情況下,元數(shù)據(jù)信息的訪問將成為系統(tǒng)瓶頸。因此我們研究了一種利用資源分類信息樹來輔助教育資源元數(shù)據(jù)分布式存儲的策略,且不失集中存儲所具有的資源查全、查準(zhǔn)特性。同時我們認(rèn)為,教育資源本身的分類特性以及教育資源用戶興趣偏好的明顯存在,也支持元數(shù)據(jù)的分布式存儲。
二 資源分類信息樹
全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會教育技術(shù)分技術(shù)委員會(celtsc.省略/)制定的《教育資源建設(shè)技術(shù)規(guī)范》中,利用學(xué)科、實用對象、素材類型三種基本分類方法產(chǎn)生了六種分類體系,根據(jù)在實踐中教師偏好,我們選擇了圖1的分類體系作為基礎(chǔ):
考慮教材版本對資源內(nèi)容和用戶的影響,我們將教材版本作為一種基本分類,同時為每一種分類增加一種名為“其他”的類別,以用于容納在該分類下無明確類別的資源,如一張圖片,它可能沒有教材版本的區(qū)別。這樣擴(kuò)展為如圖2的形式。
這里我們對分布式系統(tǒng)中典型的兩類節(jié)點的定義如下:
教育資源元數(shù)據(jù)節(jié)點:為教育資源某種(些)分類下的教育資源元數(shù)據(jù)提供存儲、查詢等服務(wù)。在一個分布式系統(tǒng)中,教育資源元數(shù)據(jù)節(jié)點可根據(jù)需要增加。
教師節(jié)點:最主要的資源用戶,他們可能是通過普通瀏覽器或通過專有客戶端訪問教育資源。
1 資源分類信息樹的定義
參照一般數(shù)據(jù)結(jié)構(gòu)教科書中對樹的定義,資源分類信息樹定義如下:資源分類信息樹是包含有n個結(jié)點的有限集合,在這個集合上定義了一個唯一的關(guān)系,它滿足下列條件:
(1) 集合中存在唯一的一個結(jié)點,它沒有前驅(qū),稱為樹的根,這里命名為“教育資源”;
(2) 除根以外,集合中的每個結(jié)點都有且僅有一個前驅(qū);
(3) 除根以外,集合中的任何一個結(jié)點a,都存在唯一的一個從根到a的結(jié)點序列a0,a1,a2,am,其中,a0即樹根,而am=a,在這個序列中,節(jié)點ai是ai-1(1≤i≤m)的后繼。這個結(jié)點序列稱為從根到a的路徑;
(4) 每個結(jié)點表示教育資源某種分類下的具體分類,如按學(xué)科分類下的“語文”;
(5) 沒有后繼的結(jié)點稱為葉結(jié)點,有且只有葉結(jié)點而且必須存儲至少一條元數(shù)據(jù)節(jié)點信息,表示該類元數(shù)據(jù)信息由這些元數(shù)據(jù)節(jié)點存儲。如果元數(shù)據(jù)節(jié)點信息超過一條,表示該類元數(shù)據(jù)信息有多個完全備份。
(6) 如果某種教育資源分類方法的某種類別在某結(jié)點直接后繼中,那么該分類所有類別都必須出現(xiàn)在該結(jié)點的直接后繼集合中。
通過擴(kuò)展樹的廣義表表示法,可按照以下方式存儲資源分類信息樹:用中括號表示結(jié)點的后繼,用小括號表示元數(shù)據(jù)節(jié)點信息。則上圖可表示為:
“教育資源[語文[人教版[一年級(元數(shù)據(jù)節(jié)點A),二年級(元數(shù)據(jù)節(jié)點B,元數(shù)據(jù)節(jié)點C),六年級(元數(shù)據(jù)節(jié)點C)],蘇教版(元數(shù)據(jù)節(jié)點D),師大版[小學(xué)(元數(shù)據(jù)節(jié)點F),初中(元數(shù)據(jù)節(jié)點G)]],政治(元數(shù)據(jù)節(jié)點E),地理(元數(shù)據(jù)節(jié)點E)]”
為了便于存儲和傳輸,我們參考《教育資源建設(shè)技術(shù)規(guī)范》,對資源類別進(jìn)行編碼,其中元數(shù)據(jù)節(jié)點信息是一個HTTP地址,因此經(jīng)過編碼,圖3中的資源分類信息樹可進(jìn)一步表示如下:
“EduRes [ GS001 [ T001 [ GO003 ( metaa.省略), GO004 ( metab.省略, metac.省略 ), GO008 ( metac.省略 ) ], T002 (metad.省略 ), T003 [ GOE001 (metaf.省略),GOE002 (metag.省略)]], GS005(metae.省略),GS007( metae.省略 ) ]”
同時,考慮資源分類信息樹的動態(tài)性,我們?yōu)槠湓O(shè)置了版本號和校驗碼,用“V”代表版本號,“RTree”代表編碼后的資源分類信息樹,那么校驗碼“CS”由如下公式生成:
CS=MD5(Byte(V)+Byte(RTree))
顯然在應(yīng)用的初期,資源分類信息樹的規(guī)模較小,元數(shù)據(jù)節(jié)點數(shù)量極少,在元數(shù)據(jù)節(jié)點上存儲了葉節(jié)點對應(yīng)分類下更詳細(xì)的分類,以及相關(guān)的元數(shù)據(jù)信息。元數(shù)據(jù)節(jié)點需要定期告知自己的存儲以及訪問情況,便于系統(tǒng)動態(tài)調(diào)整資源分類信息樹。
2 資源分類信息樹的操作
資源分類信息樹是一棵動態(tài)發(fā)展的樹,或者說是當(dāng)前系統(tǒng)中元數(shù)據(jù)節(jié)點的結(jié)構(gòu)化映像,它對用戶上傳下載資源起著初步導(dǎo)航定位的作用。一般來說,對資源分類信息樹存在著以下幾種操作:
(1)資源分類信息樹的構(gòu)建與獲取
根據(jù)應(yīng)用系統(tǒng)的規(guī)模,決定需要部署元數(shù)據(jù)節(jié)點的數(shù)量,以及各元數(shù)據(jù)節(jié)點服務(wù)的教育資源類別。在系統(tǒng)運行過程中,元數(shù)據(jù)節(jié)點將自己元數(shù)據(jù)存儲量、檢索次數(shù)等用戶活動數(shù)據(jù)反饋給系統(tǒng),然后系統(tǒng)給出建議決策。元數(shù)據(jù)節(jié)點首先獲得資源分類信息樹,然后將其轉(zhuǎn)發(fā)給連接上它的教師節(jié)點,過程如圖4所示。
(2)資源分類信息樹的更新
隨著系統(tǒng)的不斷成長,在收集到足夠元數(shù)據(jù)節(jié)點用戶行為信息后,資源分類信息樹就需要進(jìn)行更新,包括增加元數(shù)據(jù)節(jié)點、合并訪問壓力小的資源分類結(jié)點、分離訪問壓力大的資源分類結(jié)點。在資源分類信息樹的變化過程中,需要符合其定義,特別需要保證有且只有葉結(jié)點能關(guān)聯(lián)元數(shù)據(jù)節(jié)點信息。下面圖示列出了資源分類信息樹更新的各種情形:
如上所示,資源分類信息樹的更新主要涉及到結(jié)點分裂、替換、合并三個操作。總的來說,這個樹的更新是比較容易的。但樹的結(jié)構(gòu)更新后,對應(yīng)的元數(shù)據(jù)節(jié)點對其存儲的元數(shù)據(jù)信息必須做出相應(yīng)的調(diào)整,而這些元數(shù)據(jù)節(jié)點是分布在網(wǎng)絡(luò)中的,同時為教師節(jié)點提供著服務(wù),這需要精心設(shè)計調(diào)整策略,保證元數(shù)據(jù)節(jié)點與資源分類信息樹的一致性,并同時為教師節(jié)點提供正確服務(wù)。
通過分析“分裂、替換、合并”三個操作可以發(fā)現(xiàn),對于元數(shù)據(jù)節(jié)點元數(shù)據(jù)信息的調(diào)整的核心操作是“一個或多個的過程”。例如圖6所示的分裂過程,即是:元數(shù)據(jù)節(jié)點A將除“語文、數(shù)學(xué)、英語”以外的元數(shù)據(jù)信息剪切到新元數(shù)據(jù)節(jié)點B上,同時根節(jié)點“教育資源”不再存儲元數(shù)據(jù)節(jié)點信息,成為非葉結(jié)點;圖7所示的替換過程即是:元數(shù)據(jù)節(jié)點A將“英語”類元數(shù)據(jù)信息剪切到新元數(shù)據(jù)節(jié)點C上,其他無變化;圖8所示的合并過程即是:元數(shù)據(jù)節(jié)點B將“物理”類元數(shù)據(jù)信息剪切到網(wǎng)絡(luò)中元數(shù)據(jù)節(jié)點C上。除去核心操作,其它操作主要是資源分類信息樹結(jié)構(gòu)信息的調(diào)整以及最新信息在各節(jié)點的分發(fā)。其整體流程如圖5。
在元數(shù)據(jù)節(jié)點調(diào)整過程中,元數(shù)據(jù)節(jié)點需要暫停服務(wù),以防止數(shù)據(jù)的不一致性。由于元數(shù)據(jù)調(diào)整非常少,可以在教師節(jié)點比較少的時候進(jìn)行,如深夜調(diào)整,這樣能降低由此給教師帶來的不便。
(3)元數(shù)據(jù)節(jié)點定位
由于元數(shù)據(jù)信息分布在不同的元數(shù)據(jù)節(jié)點上,教師節(jié)點上載、檢索資源等都需要確切知道元數(shù)據(jù)所在的元數(shù)據(jù)節(jié)點。因此需要利用資源分類信息樹來定位目標(biāo)信息所在的元數(shù)據(jù)節(jié)點集。其算法如下:
第一步:變量初始化,將要上載或檢索資源的分類信息按“學(xué)科-教材版本-適用對象-素材類型”排序,設(shè)序列為如下形式:ConditionStr[]={“GS001”, “*”, “GO006”, ……},其中“*”表示不區(qū)分該類別,在這里表示不分教材版本。用MPeers存儲資源分類信息樹的目標(biāo)結(jié)點集合,結(jié)點信息包含路徑信息,如“EdurRes.GS001.T002”,表示“蘇教版”結(jié)點,初始將“EduRes”根結(jié)點加入集合中:MPeers = { “EduRes” };
第二步:對MPeers集合中結(jié)點進(jìn)行順序訪問,如果是非葉結(jié)點,獲取該結(jié)點的所有直接后繼結(jié)點,并結(jié)合ConditionStr中對該分類的限制,用符合要求的直接后繼結(jié)點集合替代該非葉結(jié)點。以圖3所示的資源分類信息樹為例,“EduRes”結(jié)點是非葉結(jié)點,其直接后繼結(jié)點集合為{“EduRes.GS001”, “EduRes.GS002”, ……},ConditionStr中對學(xué)科類別資源限制為“GS001”,因此MPeers集合變?yōu)?Mpeers = {“EduRes.GS001”};
第三步:重復(fù)第二步直到MPeers集合中都是葉結(jié)點為止。收集該集合中所有結(jié)點所包含的元數(shù)據(jù)節(jié)點信息,即為本次上載或檢索的目標(biāo)元數(shù)據(jù)節(jié)點集。
由于資源分類信息樹的規(guī)模一般非常小,因此時間復(fù)雜度可以忽略。在極端情況下,如果ConditionStr中對所有分類都不限制,形如ConditionStr = {“*”, “*”, ……},就類似廣度優(yōu)先遍歷資源分類信息樹,結(jié)果包含網(wǎng)絡(luò)中所有元數(shù)據(jù)節(jié)點信息。
三 基于資源分類信息樹的元數(shù)據(jù)操作
1 元數(shù)據(jù)上傳
在資源分類信息樹的輔助下,元數(shù)據(jù)上傳過程比較簡單,在確定目標(biāo)元數(shù)據(jù)節(jié)點后,即可將元數(shù)據(jù)信息推送到對應(yīng)元數(shù)據(jù)節(jié)點上。但當(dāng)教師節(jié)點無法直接訪問所確定的目標(biāo)元數(shù)據(jù)節(jié)點時,需要其他元數(shù)據(jù)節(jié)點。其基本過程如圖9所示。
2 元數(shù)據(jù)檢索過程
同理,元數(shù)據(jù)檢索過程在資源分類信息樹的輔助下,也可以直接確定其目標(biāo)元數(shù)據(jù)節(jié)點集,如果能直接訪問這些元數(shù)據(jù)節(jié)點,即可并行發(fā)出檢索請求,并最終合并檢索結(jié)果。但在無法直接訪問某目標(biāo)元數(shù)據(jù)節(jié)點時,需要其他元數(shù)據(jù)節(jié)點。其基本過程如圖10。
四 總結(jié)
應(yīng)對大規(guī)模訪問是元數(shù)據(jù)分布存儲的最重要目的,資源分類信息樹可以很好地組織元數(shù)據(jù)節(jié)點,并能比較容易地增加、備份、合并、分裂元數(shù)據(jù)節(jié)點,擴(kuò)展性較好。同時在對元數(shù)據(jù)節(jié)點發(fā)起查詢前,通過資源分類信息樹預(yù)先確定目標(biāo)元數(shù)據(jù)節(jié)點集,提高了系統(tǒng)效率。資源分類信息樹與目錄集中式(一般分布式資源網(wǎng)采用“目錄集中訪問,資源分布存儲”)以及一般P2P網(wǎng)絡(luò)(常采用Tracker或不完全DHT模式)中元數(shù)據(jù)存儲的比較情況如下表所示:
參考文獻(xiàn)
[1] 路秋麗,魏順平.網(wǎng)絡(luò)教育資源標(biāo)準(zhǔn)及標(biāo)準(zhǔn)應(yīng)用的調(diào)查分析[J].中國電化教育, 2005,(7).
[2] 孫波.開放式教學(xué)資源網(wǎng)絡(luò)管理平臺的研究與實現(xiàn)[D]. 北京:北京師范大學(xué),2002.
[3] 余勝泉,朱凌云,曹曉明.教育資源管理的新發(fā)展[J].中國電化教育,2003,(9).
1 引言
隨著國內(nèi)3G網(wǎng)絡(luò)的規(guī)模建設(shè)和智能手機的快速市場滲透,移動網(wǎng)絡(luò)的數(shù)據(jù)業(yè)務(wù)流量呈爆發(fā)式增長,增長幅度明顯高于語音業(yè)務(wù)。據(jù)不完全統(tǒng)計,2010年國內(nèi)三大運營商的移動數(shù)據(jù)業(yè)務(wù)同比增長都超過了100%。移動互聯(lián)網(wǎng)呈現(xiàn)蓬勃發(fā)展態(tài)勢,很多固網(wǎng)的互聯(lián)網(wǎng)業(yè)務(wù)也隨之遷移升級至手機,其中即時通訊類業(yè)務(wù)(如QQ、MSN、飛信)手機普及率最高。
即時通訊類業(yè)務(wù)具有小流量且長時在線的特性,傳統(tǒng)信道獨享的固定寬帶接入網(wǎng)對此沒有問題,但這種特性對多用戶共享信道資源的無線接入網(wǎng)的資源分配和占用帶來挑戰(zhàn)。實際情況是,該類業(yè)務(wù)實際占用的無線資源(業(yè)務(wù)信道和控制信道等資源)是其實際業(yè)務(wù)流量的數(shù)倍甚至數(shù)十倍,無線網(wǎng)絡(luò)資源利用效率明顯低下,是謂移動數(shù)據(jù)業(yè)務(wù)實際運營的“增量不增收”:同時,這也為網(wǎng)絡(luò)擴(kuò)容帶來巨大壓力。因此,我們有必要對這類業(yè)務(wù)進(jìn)行構(gòu)建模型,并對無線資源占用作具體分析。
2 業(yè)務(wù)特征及其對無線資源占用特點
即時通訊類業(yè)務(wù)的用戶信息發(fā)送具有很大的離散性以及小流量特點。由于手機并非一直占用信道資源,當(dāng)有數(shù)據(jù)傳輸時,系統(tǒng)才會發(fā)給手機并立即指配消息分配信道資源,沒有傳輸時則釋放資源,這會導(dǎo)致業(yè)務(wù)的頻繁建立和釋放。而在沒有信息傳送時,為了保持用戶客戶端和服務(wù)系統(tǒng)的信息同步更新,客戶端與服務(wù)器之間要定時發(fā)送心跳信號(keepaIive),以明確客戶端是否在線。心跳信號周期一般為幾十秒,心跳信號的頻繁發(fā)送,也會導(dǎo)致業(yè)務(wù)的頻繁建立和釋放,但其實用戶并沒有發(fā)出信息。
網(wǎng)絡(luò)的實際連接次數(shù)、連接時長、前反向流量,可以反映業(yè)務(wù)對業(yè)務(wù)信道和控制信道類無線資源的占用情況。表1為國內(nèi)某地的移動網(wǎng)絡(luò)各類業(yè)務(wù)對無線資源的實際占用情況。前向小速率突發(fā)類業(yè)務(wù)(即時通訊類業(yè)務(wù)為主)的下行流量僅占0.64%,但其連接次數(shù)占整個網(wǎng)絡(luò)的79.41%,占用連接時長也達(dá)到18%。這意味著:傳輸不到1%的數(shù)據(jù)流量,卻占用了79.41%的控制信道和18%的業(yè)務(wù)信道。
由表1可知,傳輸業(yè)務(wù)流量和資源占用呈現(xiàn)明顯的不匹配。這種不匹配源于小流量長時在線的業(yè)務(wù)特點和模型:一方面,信息量?。毫硪环矫妫L時在線,意味著網(wǎng)絡(luò)必然要為其分配較多的業(yè)務(wù)信道資源,尤其該類業(yè)務(wù)頻繁連接,使CDMA 1X系統(tǒng)必須頻繁為其建立信道和釋放信道,占用了大量控制信道資源。因此,即時通信類業(yè)務(wù)大規(guī)模發(fā)展,導(dǎo)致了網(wǎng)絡(luò)擁塞,尤其是控制信道的擁塞,造成網(wǎng)絡(luò)整體資源利用效率下降。
3 業(yè)務(wù)模型
作為普及率較高且為用戶熟知的數(shù)據(jù)業(yè)務(wù),即時通訊業(yè)務(wù)與其它傳統(tǒng)業(yè)務(wù)(如下載類、瀏覽類等業(yè)務(wù))不同,業(yè)務(wù)模型相對復(fù)雜,包含多種狀態(tài),不同狀態(tài)下的業(yè)務(wù)特征差異明顯。目前,可歸納為三類業(yè)務(wù)模型:接入登陸業(yè)務(wù)模型、信息發(fā)送模型、空閑心跳模型。
3.1 用戶發(fā)送信息業(yè)務(wù)模型
在用戶輸入信息并點擊發(fā)送時,即進(jìn)入信息發(fā)送狀態(tài),適用于用戶發(fā)送信息業(yè)務(wù)模型,該模型由用戶或系統(tǒng)觸發(fā)。在實際業(yè)務(wù)模型中,除了用戶可見信息外,為了上層通信和交互,還必須包含大量的控制或指示類信息。如表2所示,手機QQ每發(fā)送/接收一條信息的長度為30個漢字,有效傳輸數(shù)據(jù)量為132Bytes,加上TCP/IP包頭40字節(jié),實際傳輸172Bytes。即實際用戶信息負(fù)荷占比僅為36%,另外64%為用戶不可見的輔助添加信息,可見實際有效負(fù)荷比較低,明顯低于下載類、瀏覽類業(yè)務(wù)的用戶信息有效負(fù)荷占比(典型的為80%-90%)。
用戶有效信息負(fù)荷比低有兩個原因:一,用戶信息是明顯的短IP包,IP頭占比大:二,每個信息要附加發(fā)送QQ號、接收QQ號、版本號等輔助信息,冗余比例高。
3.2 用戶登陸業(yè)務(wù)模型
用戶在首次登陸時,要傳送登陸賬號和密碼,信息反饋各類好友的在線狀態(tài)、用戶本身配置信息、用戶簽名、用戶個性圖片等大量信息。如表3所示,經(jīng)現(xiàn)網(wǎng)測試,手機單次登陸的平均接入時長為119秒,和當(dāng)時的網(wǎng)絡(luò)狀態(tài)關(guān)系密切。如閑時登錄時間明顯少于忙時,還與網(wǎng)絡(luò)是1X網(wǎng)絡(luò)還是DO網(wǎng)絡(luò)關(guān)系密切。
用戶的單次登陸數(shù)據(jù)流量平均10.5K字節(jié)。其中圖片類信息和好友信息類信息占主導(dǎo),和該用戶的好友數(shù)量和一些個性化設(shè)置關(guān)系較大。
3.3 空閑心跳模型
在用戶空閑時間內(nèi),為了和系統(tǒng)保持信息同步,必須按照一定的周期發(fā)送系統(tǒng)自動刷新的信息,即所謂心跳。傳輸?shù)男畔ǎ汉糜训牡卿洜顟B(tài)、用戶定時向系統(tǒng)進(jìn)行狀態(tài)更新,一些通知消息等。根據(jù)QQ版本不同,心跳時長也有所不同,如表4:
手機QQ空閑態(tài)每小時傳輸?shù)臓顟B(tài)信息約為20kb,包括網(wǎng)絡(luò)向手機發(fā)的狀態(tài)改變信息,以及手機向網(wǎng)絡(luò)發(fā)的心跳信號。
3.4 業(yè)務(wù)模型小結(jié)
如圖1,即時通訊類業(yè)務(wù)顯著特點為平均每個數(shù)據(jù)包大部分為小數(shù)據(jù)包,從網(wǎng)絡(luò)測監(jiān)控統(tǒng)計,約98%的前向連接速率小于4.8kbps,80%數(shù)據(jù)包小于512個字節(jié),反向連接速率小于4.8kbps,80%數(shù)據(jù)包小于512個字節(jié)。
較之其它業(yè)務(wù),即時通訊類的包小但發(fā)送頻繁,手機QQ典型的突發(fā)數(shù)據(jù)包主要分布在100Byte-300Byte區(qū)間:其它典型業(yè)務(wù)測試的基本模型結(jié)果如下:
電腦通過上網(wǎng)卡打開一個互聯(lián)網(wǎng)主頁(如新浪),約500kb~1000kb。
電腦下載業(yè)務(wù):約1Mb~100Mb(典型的如下載歌曲,每首約3Mb~4Mb)。
手機終端打開一個互聯(lián)網(wǎng)主頁(如:新浪,分頁顯示),約100kb~300kb。
手機終端打開一個含少許圖片的網(wǎng)頁,約10kb~200kb。
手機終端下載小軟件,約200kb~1000kb。
手機終端打開一個WAP頁面,約5kb~80kb。
綜上可知,大部分業(yè)務(wù)的單次下載流量在數(shù)百kb為主,明顯高于即時通訊類的0.2kb水平。
4 對1X網(wǎng)絡(luò)資源的占用分析
1X無線資源主要包括CE、Walsh碼、功率三類。CE資源是接入信道處理單元,目前標(biāo)準(zhǔn)的信道板包括128個C已Walsh碼資源為正交碼分資源,在目前典型的無線配置3中,每個載扇最多有64個Walsh碼資源。從對1X資源的占用角度來看,業(yè)務(wù)包括四個過程或階段:
連接建立階段。占用公共信道Wlash碼與CE,此階段分配專用Walsh碼與CE,接入時間約3~4秒。
數(shù)據(jù)傳輸階段。占用1~17個專用Wlash碼,1~17個專用CE(持續(xù)時間依所傳輸數(shù)據(jù)量與數(shù)據(jù)速率而定)。
無數(shù)據(jù)傳輸休眠等待階段。數(shù)據(jù)傳輸完畢,前向無數(shù)據(jù)傳輸,只有控制信息傳輸(反向功率控制等信 息),傳輸速率較低,一般為1500bps或2700bps。持續(xù)時間依據(jù)休眠定時器設(shè)置,現(xiàn)網(wǎng)設(shè)置時間為20~60秒。
連接釋放階段。連接釋放,不再占用前向資源(C已WaIsh碼,功率)。
如表5所示,即時通訊類業(yè)務(wù)平均每次傳輸0.2kb信息,在1X網(wǎng)絡(luò)中的有效傳輸約為0.22秒,但休眠等待時間約20~60秒,這都要占用CE資源和walsh碼資源,加上接入建立實現(xiàn)的3.5秒,也要占用接入信道和無線資源。總體而言,相對于其他業(yè)務(wù)(如網(wǎng)頁瀏覽、FTP下載等),即時通訊類業(yè)務(wù)傳輸效率明顯底下,激活態(tài)應(yīng)用層平均有效傳輸速率為0.067kbps,有效傳輸速率僅為FTP下載類業(yè)務(wù)的1660分之一。
因此,即時通訊類業(yè)務(wù)大量不斷接入和休眠等待過程要占用大量無線CE和Walsh碼資源及少量功率資源,造成網(wǎng)絡(luò)效率明顯低于其他業(yè)務(wù)。再加上此類業(yè)務(wù)的客戶端系統(tǒng)信息更新(心跳)也要周期性消耗資源,進(jìn)一步降低了資源有效使用率。
5 對EV-DO網(wǎng)絡(luò)資源的占用分析
作為3G網(wǎng)絡(luò),EV-DO網(wǎng)絡(luò)設(shè)計思路主要針對突發(fā)類數(shù)據(jù)業(yè)務(wù),資源分配采用時分方式動態(tài)調(diào)度,與1X網(wǎng)絡(luò)的資源分配有明顯不同。EV-DO網(wǎng)絡(luò)前向資源分配的最小單元為時隙:1.67ms,實際應(yīng)用中,業(yè)務(wù)承載包括Session建立過程,連接激活與數(shù)據(jù)傳輸過程,會話釋放過程等4個步驟:
1次會話(Session)建立流程(含UATl分配)。1次重認(rèn)證流程。
多次連接激活/去激活流程(用戶數(shù)據(jù)傳輸,數(shù)十次至數(shù)百次)。
可能存在的切換流程。
1次會話釋放流程。
其中,數(shù)十次的連接激活/去激活流程占用了主要無線資源。圖2為一次連接激活/去激活流程。
對于不同的業(yè)務(wù)類型和IP包大小,EV-DO采用不同的傳輸編碼和格式。下面為幾種典型業(yè)務(wù)的編碼和格式:
(1)小流量數(shù)據(jù)
IP層數(shù)據(jù)量為200Byte
折算到MAC層在空口約需傳輸2000bit
采用(2048,1,64)編碼
(2)網(wǎng)頁瀏覽
lP層數(shù)據(jù)量為1 00kb
折算到MAC層在空口約需傳輸1 000kbit
采用(4096,1,64)編碼
(3)FTP下載
IP層數(shù)據(jù)量為3000kb
折算到MAC層在空口約需傳輸30000kbit
采用(4096,1,64)編碼
(4)傳輸開銷
層開銷:13%
重傳率:5%
空口傳輸效率:95%
如表6所示,即時通訊類業(yè)務(wù)包括網(wǎng)絡(luò)登錄過程和小流量數(shù)據(jù)傳輸過程,其中連接建立過程大約需要使用33時隙,和其他類業(yè)務(wù)一樣(如網(wǎng)頁瀏覽、FTP下載等)。而數(shù)據(jù)傳輸過程要根據(jù)用戶具體消費行為,典型的一個200Byte的lP包只需一個時隙即可完成。假設(shè)用戶每小時發(fā)送60次信息,在線用戶每小時總耗用前向時隙時長3.7s,在線用戶的每小時總流量22kb,可得到占用前向時隙時的等效前向速率48kbps。小流量數(shù)據(jù)業(yè)務(wù)對前向時隙資源占用效率不高,有效利用率僅是其他業(yè)務(wù)(網(wǎng)絡(luò)瀏覽、FTP業(yè)務(wù))的1/30~1/40,但于1X的上千倍的差距有了明顯提升(約提高了40~50倍)。
6 對即時通訊類業(yè)務(wù)的優(yōu)化建議
基于即時通訊類業(yè)務(wù)的特點,其在移動網(wǎng)絡(luò)上的承載效率明顯不如一些傳統(tǒng)業(yè)務(wù)。針對其業(yè)務(wù)特點和網(wǎng)絡(luò)特性,可從以下幾方面進(jìn)行優(yōu)化:
(1)優(yōu)化即時通訊類業(yè)務(wù)的客戶端。在不影響用戶體驗的情況下,盡量擴(kuò)大客戶端的心跳周期,如設(shè)置為180秒。
(2)盡量把即時通訊類業(yè)務(wù)從1X網(wǎng)絡(luò)遷移到EV-DO網(wǎng)絡(luò),其相對效率可以提升30~50倍,絕對速率(激活態(tài)應(yīng)用層平均有效傳輸速率)可以提高700~800倍。
(3)優(yōu)化客戶端版本。在心跳信息更新方面進(jìn)行判決,如果無重要信息需更新,可以合并多次心跳信息,或省略部分不重要的心跳信息。
7 結(jié)論
本文對移動網(wǎng)絡(luò)上越來越多的即時通訊類業(yè)務(wù)進(jìn)行資源使用分析,并結(jié)合實際構(gòu)建相關(guān)業(yè)務(wù)模型,對即時通訊類業(yè)務(wù)CDMA1X網(wǎng)絡(luò)的資源消耗進(jìn)行定量分析,對EV-DO上的承載特點和即時通訊類業(yè)務(wù)資源消耗進(jìn)行分析,并給出優(yōu)化建議。對于優(yōu)化即時通訊類業(yè)務(wù)在移動網(wǎng)絡(luò)上的體驗,尤其是減輕由其帶來的無線網(wǎng)絡(luò)壓力有較大的實用價值,同時對需要承載越來越多個性化業(yè)務(wù)的網(wǎng)絡(luò)分析有一定的借鑒意義。
近年來,我國電子政務(wù)信息化建設(shè)取得了巨大進(jìn)展,信息資源總量不斷增加,質(zhì)量逐步提高,在現(xiàn)代化建設(shè)中日益發(fā)揮重要作用。但隨著電子政務(wù)信息資源的膨脹,政務(wù)信息資源的管理和共享大都是建立在各自獨立的領(lǐng)域和范圍內(nèi),系統(tǒng)的應(yīng)用僅以滿足各自領(lǐng)域的信息獲取為目的,相互之間沒有聯(lián)系,造成了政府部門之間所謂“信息孤島”的問題。在信息化社會里,信息已成為一種重要戰(zhàn)略資源。信息資源是與物質(zhì)、能量同等重要的現(xiàn)代戰(zhàn)略資源。信息資源的開發(fā)利用是國家信息化的核心任務(wù),其開發(fā)利用水平直接關(guān)系國民經(jīng)濟(jì)社會信息化的全局,政府信息資源是國家資源,是全社會的公共資源和公共財富,政府信息共享是促進(jìn)當(dāng)前我國信息資源開發(fā)利用的重點。將元數(shù)據(jù)應(yīng)用在政務(wù)領(lǐng)域,從各政府部門的信息系統(tǒng)中采集信息資源可以形成用戶資源視圖,通過元數(shù)據(jù)描述和管理技術(shù)可以構(gòu)建政務(wù)信息資源元數(shù)據(jù)庫,元數(shù)據(jù)是描述某一資源的結(jié)構(gòu)化數(shù)據(jù)。它提供有關(guān)資源存儲、資源分類、資源交換、資源訪問等方面的信息,便于用戶查詢、檢索和訪問相關(guān)信息資源。
1元數(shù)據(jù)庫在政務(wù)信息資源注冊管理系統(tǒng)中的應(yīng)用
1)注冊流程和注冊規(guī)范
政務(wù)信息資源注冊的流程如下所述:提交機構(gòu)按照政務(wù)信息資源提取規(guī)范收集、發(fā)現(xiàn)、提取本部門的政務(wù)信息資源,形成資源視圖;提交機構(gòu)按照《政務(wù)信息資源統(tǒng)一描述規(guī)范》對注冊的政務(wù)信息資源進(jìn)行元數(shù)據(jù)描述;由主管部門對政務(wù)信息資源元數(shù)據(jù)進(jìn)行內(nèi)容審查;提交機構(gòu)將政務(wù)信息資源元數(shù)據(jù)提交到注冊機構(gòu)并申請注冊;注冊機構(gòu)驗證注冊申請,并決定是否受理此申請。如果受理了申請,注冊機構(gòu)就給資源分配臨時的資源標(biāo)識符,將注冊狀態(tài)注上“已受理”,并通知提交機構(gòu)受理的情況;受理后注冊中心對政務(wù)信息資源元數(shù)據(jù)進(jìn)行測試和審核,如果元數(shù)據(jù)的格式或者內(nèi)容沒有通過測試和審核,注冊機構(gòu)通知提交機構(gòu)相關(guān)的出錯信息和處理意見;審核通過后,注冊中心給注冊資源分配正式的資源標(biāo)識符,并將注冊狀態(tài)注上“合格”,注冊機構(gòu)將政務(wù)信息資源注冊標(biāo)識符及注冊元數(shù)據(jù)信息,錄入政務(wù)信息資源注冊數(shù)據(jù)庫,并通知提交機構(gòu)和主管機構(gòu)注冊成功;提交機構(gòu)與其主管機構(gòu)收到注冊成功通知后,要求對項目進(jìn)行檢查,確認(rèn)政務(wù)信息資源有效,如果查出有錯,應(yīng)立即通知注冊機構(gòu)。如果核實無誤,政務(wù)信息資源的注冊狀態(tài)注上“有效”,表示此申請注冊的政務(wù)信息資源處于可用狀態(tài)。對審核通過且確認(rèn)有效的政務(wù)信息資源,注冊機構(gòu)通過政務(wù)信息資源目錄服務(wù)系統(tǒng)對外。政務(wù)信息資源注冊管理中主要有資源提交者、注冊管理者和資源使用者分別完成信息資源提交、資源注冊管理和資源的檢索利用。資源提交者從本部門業(yè)務(wù)系統(tǒng)和數(shù)據(jù)系統(tǒng)中提取信息資源,編目形成資源描述元數(shù)據(jù):資源注冊者將受理的資源元數(shù)據(jù)信息注冊到政務(wù)信息資源元數(shù)據(jù)庫中,并通過目錄服務(wù)平臺生成資源目錄,提供查詢服務(wù)。資源使用者通過政務(wù)信息資源目錄交換平臺對政務(wù)信息資源進(jìn)行檢索、查詢和獲取。
2)元數(shù)據(jù)庫對注冊過程的要求
注冊過程的目的是為了將信息資源注冊保存到信息資源元數(shù)據(jù)庫中,注冊系統(tǒng)和元數(shù)據(jù)庫是相互支持的模塊,為了更好的管理元數(shù)據(jù),在注冊過程中就應(yīng)該做好下列工作。
(1)政務(wù)信息資源的分類分級
政務(wù)信息資源涉及面廣,覆蓋了幾乎一切國民經(jīng)濟(jì)部門,跨社會各行各業(yè),所以其數(shù)量巨大,種類繁多。為了對政務(wù)信息資源進(jìn)行有效地管理,對政務(wù)信息資源進(jìn)行合理的分類是至關(guān)重要的。對政務(wù)信息資源有很多種分類方法,例如根據(jù)政務(wù)信息資源所屬的政府部門劃分,根據(jù)政務(wù)信息資源服務(wù)的對象劃分,根據(jù)政務(wù)信息資源的安全等級劃分等。為了方便對政務(wù)信息資源進(jìn)行注冊和管理,在政務(wù)信息資源的注冊管理系統(tǒng)中,采用一定的分類方案對政務(wù)信息資源進(jìn)行分類,具體的分類方案可以參考國家標(biāo)準(zhǔn)《政務(wù)信息資源目錄體系第四部分》中提供的三種分類方案:按主題的分類方案,按行業(yè)的分類方案,按服務(wù)的分類方案和按資源形態(tài)的分類方案。
(2)電子政務(wù)信息資源的驗證與測試
注冊機構(gòu)要對已受理的政務(wù)信息資源的元數(shù)據(jù)進(jìn)行驗證和測試,驗證工作主要是進(jìn)行一些基本的檢查,以減輕審核階段的工作,測試主要是對元數(shù)據(jù)的語法、格式進(jìn)行檢查。其工作大致包括:檢查各個描述元素的名稱和屬性是否符合規(guī)范;檢查資源實例XML文檔元素的層次結(jié)構(gòu)是否符合標(biāo)準(zhǔn)規(guī)范;檢查元素的取值是否符合標(biāo)準(zhǔn)中規(guī)定的編碼體系方案;驗證網(wǎng)絡(luò)資源是否可以通過信息資源元數(shù)據(jù)提供的訪問方式獲取;驗證不合格或者測試不通過,通知提交機構(gòu)測試結(jié)果和修改意見,并要求提交機構(gòu)修改后重新提交。
(3)電子政務(wù)信息資源的審核
對“已受理”的政務(wù)信息資源,注冊機構(gòu)要進(jìn)行審核。審核要作如下工作:檢查資源存放地址是否正確,即檢查資源是否存在;資源描述信息中的題目等屬性與資源實體中的屬性是否相符;資源描述信息中的關(guān)鍵字是否符合規(guī)范;審核通過,分配正式的資源標(biāo)識符,并將注冊狀態(tài)注為“合格”;審核沒通過,將注冊狀態(tài)注為“不合格”,并通知提交機構(gòu)審核結(jié)果和修改意見,由提交機構(gòu)修改以后重新提交。
經(jīng)過上述過程,注冊機構(gòu)將通過驗證和測試的政務(wù)信息資源描述元數(shù)據(jù)存儲到政務(wù)信息資源元數(shù)據(jù)庫中,政務(wù)信息資源處于“有效”狀態(tài)。
2元數(shù)據(jù)庫在目錄交換系統(tǒng)中的應(yīng)用
在政務(wù)信息律源目錄交換體系中,元數(shù)據(jù)庫擔(dān)負(fù)著及其重要的作用,公共資源目錄和交換目錄都是建立在相應(yīng)的元數(shù)據(jù)庫上的。在元數(shù)據(jù)操作的基礎(chǔ)上將提供者所注冊的信息資源信息表示成目錄形式為使用者服務(wù)。借助信息資源目錄體系,就可以實現(xiàn)在政府部門分布式海量數(shù)據(jù)中的信息定位、發(fā)掘和提取,迅速地從其所涵蓋的各委辦局的信息中發(fā)現(xiàn)與其需求匹配的信息資源,進(jìn)而獲取并利用,實現(xiàn)決策支持、協(xié)同辦公和信息上傳下達(dá)等作用,實現(xiàn)信息資源的有效整合;通過目錄體系中對各類信息資源進(jìn)行描述、引用等,為分散異構(gòu)(各委、辦、局)的各類信息資源的共享交換提供基礎(chǔ)性支撐;按照統(tǒng)一的規(guī)格和方式實現(xiàn)對不同類型的各類信息資源的分類描述。
檔案目錄是按照一定的次序編排而成的條目匯集,是檔案管理、檢索和報道的工具。①經(jīng)過長期的實踐和積累,檔案機構(gòu)根據(jù)豐富的館藏和多樣的檔案利用需求,形成了管理型、檢索型、報道型等多種類型、不同結(jié)構(gòu)的檔案目錄。隨著相關(guān)技術(shù)的發(fā)展,檔案目錄逐漸從以卡片式、書本式為主的手檢目錄發(fā)展為機讀目錄;進(jìn)入電子文件時代,檔案目錄數(shù)據(jù)庫成為了主流形式,實現(xiàn)并擴(kuò)展了檔案目錄的各項功能。無論檔案目錄以何種形式存在和表現(xiàn),其編目都是按照一定的著錄項目、著錄格式、著錄符號、著錄用文字等著錄規(guī)則,對檔案的內(nèi)容和形式特征進(jìn)行分析、選擇和記錄的過程,以及按照科學(xué)的規(guī)則和方法,把檔案條目組成系統(tǒng)的檔案二次信息系統(tǒng)的過程。
政務(wù)信息資源目錄體系以國家統(tǒng)一的電子政務(wù)網(wǎng)絡(luò)為基礎(chǔ),通過構(gòu)建覆蓋中央、省、市、縣的多級政務(wù)信息資源目錄體系技術(shù)總體構(gòu)架,采用元數(shù)據(jù)對共享政務(wù)信息資源特征進(jìn)行描述,形成統(tǒng)一規(guī)范的目錄內(nèi)容,通過對目錄內(nèi)容的有效組織和管理,形成部門間政務(wù)信息資源物理分散、邏輯集中的信息共享模式,提供政務(wù)信息資源的發(fā)現(xiàn)定位服務(wù),支持全國范圍內(nèi)跨部門、跨地區(qū)的普遍信息共享,方便用戶發(fā)現(xiàn)、定位和共享多種形態(tài)的政務(wù)信息資源,支持政府的經(jīng)濟(jì)調(diào)節(jié)、市場監(jiān)管、社會管理和公共服務(wù)。②
首先,檔案目錄和政務(wù)信息資源目錄體系的目的和作用具有一致性。它們都是運用了目錄控制的思想,將目錄作為組織管理和檢索利用信息資源的一種基本機制。它們都是通過在微觀上著錄、標(biāo)引、規(guī)范控制和在宏觀上利用選擇、描述和檢索控制等手段,實現(xiàn)對信息資源的整合、管理、發(fā)現(xiàn)與定位,協(xié)調(diào)和引導(dǎo)信息資源的流動和有效利用,以此解決信息組織、分類、存儲、檢索、定位、獲取等問題。比較而言,政務(wù)信息資源目錄體系更偏重于檢索型目錄,是通過建立信息庫系統(tǒng)和目錄內(nèi)容服務(wù)系統(tǒng),方便用戶發(fā)現(xiàn)、定位所需的政務(wù)信息資源,促進(jìn)信息資源的共享和利用;而檔案目錄是以檔案管理為基礎(chǔ),根據(jù)檔案目錄類型的不同,相應(yīng)地側(cè)重于管理、檢索和報道,或是幾種用途的組合。
其次,檔案目錄和政務(wù)信息資源目錄體系的編目內(nèi)容具有內(nèi)在的聯(lián)系。據(jù)統(tǒng)計,目前各級政府部門的政務(wù)信息資源約為全社會信息資源總量的80%,其中約50%的政府信息在辦理和使用完畢后作為檔案存入檔案保管部門,有的地區(qū)政府形成的檔案甚至達(dá)到當(dāng)?shù)貦n案館藏的絕大多數(shù)。如圖1所示,在《政務(wù)信息資源目錄體系》中,檔案是政務(wù)信息資源的主要內(nèi)容之一;而從檔案資源的角度看,政務(wù)信息資源是館(室)藏檔案的重要組成部分。
如果說文件與檔案表示的是同一事物的不同運動階段,那么政務(wù)信息資源與檔案也相應(yīng)的存在這種同一事物先后相連的內(nèi)在聯(lián)系。如圖2所示,隨著時間的推移,政務(wù)信息資源由現(xiàn)行利用,經(jīng)歸檔過渡到檔案室保管階段,滿足一定條件后移交至檔案館保管利用。我們可以姑且將政務(wù)信息資源與文件等同理解,只不過政務(wù)信息資源在載體形態(tài)、服務(wù)對象、管理及利用方式等方面與傳統(tǒng)紙質(zhì)文件有所不同。
政務(wù)信息資源歸檔后,在檔案室保管階段,為便于管理利用,也需按照有關(guān)標(biāo)準(zhǔn)形成室編目錄;移交進(jìn)館的檔案,還須由檔案館賦予檔號等著錄內(nèi)容,作為管理、檢索利用等的標(biāo)識。我國檔案目錄早已有之,以檔案館編目錄為主且相當(dāng)成熟穩(wěn)定。室編目錄也屬檔案目錄范疇,其編目對象亦可列入政務(wù)信息資源目錄體系中。可以說這部分具有同源性的信息資源將檔案目錄和政務(wù)信息資源目錄體系緊密地聯(lián)系了起來。但我們目前通常所說的檔案目錄是指館藏檔案目錄,我國于2007年正式的政務(wù)信息資源目錄體系與之相對獨立,因而政務(wù)信息資源目錄體系與檔案目錄是對同一事物所處的不同時間階段進(jìn)行的獨立編目。
由于目前這兩個目錄之間并未建立起關(guān)聯(lián),那么,處于政務(wù)信息資源目錄體系之下的應(yīng)歸檔或已歸檔的信息資源,在進(jìn)入檔案館保管階段并經(jīng)館編目錄加以管理和控制之后,不易再通過原利用體系獨立對其進(jìn)行查找利用;檔案館也不易通過目錄控制的方式對應(yīng)歸檔及尚未進(jìn)館檔案進(jìn)行前端控制和全程管理。
二、檔案目錄與政務(wù)信息資源目錄體系編目的比較
正因為檔案目錄和政務(wù)信息資源目錄體系之間內(nèi)在的聯(lián)系,且無論是檔案目錄還是政務(wù)信息資源目錄體系,目錄編制均為核心,由此對二者進(jìn)行比較。
(一)檔案目錄的著錄項目與政務(wù)信息資源目錄體系中核心元數(shù)據(jù)的比較
著錄項目是檔案目錄的基本構(gòu)成單元,是編制檔案目錄的基礎(chǔ)和條件。元數(shù)據(jù)是描述政務(wù)信息資源特征的數(shù)據(jù)③,在政務(wù)信息資源目錄的編目、建庫、和查詢中發(fā)揮著重要的作用。因此我們將《檔案著錄規(guī)則》(DA/T18—1999)規(guī)定的著錄項目、《政務(wù)信息資源目錄體系》核心元數(shù)據(jù)及《北京市綜合檔案館目錄數(shù)據(jù)庫結(jié)構(gòu)與數(shù)據(jù)交換格式》中部分?jǐn)?shù)據(jù)庫的著錄項目進(jìn)行比較。
1、《北京市綜合檔案館目錄數(shù)據(jù)庫結(jié)構(gòu)與數(shù)據(jù)交換格式》中的文書文件、案卷目錄庫的著錄項目基本使用了《檔案著錄規(guī)則》中的著錄項目,但省去了稿本與文種項、載體形態(tài)項、附注與編號項等著錄項目中的內(nèi)容,增加了開放狀態(tài)、檔案復(fù)制類型及編號等著錄內(nèi)容。案卷目錄數(shù)據(jù)庫和文書檔案文件目錄數(shù)據(jù)庫同屬管理型目錄,但著錄項目也因級次的不同而有差異。所以在編制檔案目錄時,著錄項目的選定并非一成不變,而是要根據(jù)目錄類型、級次、專題、分類方法等的不同加以選擇。此外,無論是《檔案著錄規(guī)則》規(guī)定的著錄項目,還是《北京市綜合檔案館目錄數(shù)據(jù)庫結(jié)構(gòu)與數(shù)據(jù)交換格式》中列出的字段名稱,都是反映文件或案卷的內(nèi)容和形式特征,而不包括相應(yīng)的結(jié)構(gòu)和背景信息。
2、檔案著錄項目與《政務(wù)信息資源目錄體系》中核心元數(shù)據(jù)的關(guān)系:(1)交叉關(guān)系。如信息資源名稱、信息資源摘要、信息資源提供方、信息資源日期、關(guān)鍵字等核心元數(shù)據(jù)與檔案著錄信息中的題名、責(zé)任者、提要、時間項、關(guān)鍵詞等,可以通過技術(shù)等手段進(jìn)行轉(zhuǎn)化。(2)不是所有核心元數(shù)據(jù)都是檔案著錄信息源,如全宗號、目錄號、案卷號、頁(件)號、縮微號、載體類型、密級、保管期限、開放狀態(tài)等明顯體現(xiàn)檔案專業(yè)特性的著錄項目,無法從元數(shù)據(jù)中提取,需要人工進(jìn)行編制。(3)有些核心元數(shù)據(jù),如信息資源標(biāo)識符、元數(shù)據(jù)標(biāo)識符等可以在文件形成與管理過程中自動形成的元數(shù)據(jù)實體及元素,目前在檔案目錄中尚未體現(xiàn);對信息資源分類的有關(guān)信息、在線資源鏈接地址、服務(wù)信息、元數(shù)據(jù)維護(hù)方等核心元數(shù)據(jù)的著錄內(nèi)容,也尚未列入檔案目錄的著錄信息之中。
(二)檔案著錄條目和政務(wù)信息資源核心元數(shù)據(jù)編排組織的比較
檔案目錄和政務(wù)信息資源目錄體系共有的條目編排方法是按主題類別分類編目。我們就以此對二者進(jìn)行分析比較。
檔案分類標(biāo)引時,應(yīng)首先對檔案文件進(jìn)行周密地主題分析,確定文件、案卷所論述的事物中,哪些主題應(yīng)予以標(biāo)引,能為利用者提供檢索途徑,然后根據(jù)主題性質(zhì),到《中國檔案分類法》中查找其所屬的類目④,并準(zhǔn)確地給予分類標(biāo)識。政務(wù)信息資源的主題分類也是通過對主題分析的結(jié)果進(jìn)行分類,再確定類目名稱和類目編碼。不同的是:
1、分類依據(jù)。檔案主題分類主要依照《中國檔案分類法》,政務(wù)信息資源分類主要依據(jù)《主題分類類目表》。
2、類目設(shè)置。《中國檔案分類法》設(shè)置了19個基本大類,每一基本大類下再根據(jù)需要設(shè)置若干屬類。而《主題分類類目表》則規(guī)定了21個一級類及133個二級類。
3、標(biāo)識符號。檔案分類采用漢語拼音字母與阿拉伯?dāng)?shù)字相結(jié)合的混合號碼制,用一個字母表示一個大類,以字母的順序反映大類的序列。在字母之后,采用數(shù)字編號制,用數(shù)字表示大類下類目的劃分,數(shù)字的位數(shù)一般代表類目的級位,遵循層累制原則。⑤政務(wù)信息資源目錄體系中類目代碼編制規(guī)則是:分類類別用1位大寫羅馬字符表示,“Z”代表主題分類;一級類用1位大寫羅馬字符表示;二級類用1位大寫羅馬字符及2位阿拉伯?dāng)?shù)字表示。即在主題分類中,分別用“A”至“W”標(biāo)識21個一級類,用大寫羅馬字符“A”至“Z”加兩位阿拉伯?dāng)?shù)字“00”標(biāo)識二級類。
4、著錄要求。在《檔案著錄規(guī)則》和《北京市綜合檔案館目錄數(shù)據(jù)庫結(jié)構(gòu)與數(shù)據(jù)交換格式》中,分類號分別為必選項、可選項,且均無著錄類目名稱的規(guī)定;在《政務(wù)信息資源目錄體系》中,“信息資源分類”是必選核心元數(shù)據(jù),其中包括分類方式、類目名稱、類目編碼等元數(shù)據(jù)元素。這在一定程度上體現(xiàn)了檔案分類標(biāo)識和政務(wù)信息資源類目編碼在檢索利用頻次和各自目錄系統(tǒng)中地位的不同。
(三)檔案目錄與政務(wù)信息資源目錄體系編目技術(shù)的比較
隨著計算機技術(shù)的發(fā)展和普及應(yīng)用,紙質(zhì)檔案目錄逐漸淡出,檔案目錄數(shù)據(jù)庫形成規(guī)模。由于我國尚未出臺全國統(tǒng)一的檔案目錄數(shù)據(jù)庫結(jié)構(gòu)標(biāo)準(zhǔn),因此本文參照《北京市綜合檔案館目錄數(shù)據(jù)庫結(jié)構(gòu)與數(shù)據(jù)交換格式》及《政務(wù)信息資源目錄體系》編目系統(tǒng)技術(shù)要求,對二者主要的編目技術(shù)進(jìn)行比較。
1、檔案編目要根據(jù)目錄作用和編目對象特征、級次、序列等,有針對性地具體設(shè)定符合實際利用需要的各種檔案目錄數(shù)據(jù)庫結(jié)構(gòu)表、使用說明與數(shù)據(jù)交換格式。政務(wù)信息資源的編目要根據(jù)編目對象的具體粒度采用不同的單位編目。
2、檔案目錄數(shù)據(jù)庫普遍為Xbase關(guān)系型數(shù)據(jù)庫。在編制檔案目錄時,首先根據(jù)規(guī)定,在數(shù)據(jù)庫管理系統(tǒng)中設(shè)定目錄字段名稱、字段名、字段類型、字段長度等,再由人工將著錄信息插入到該數(shù)據(jù)庫相應(yīng)的表格中。而插入過程只能針對事先定義好的字段結(jié)構(gòu)。這一過程對未被事先定義字段結(jié)構(gòu)的著錄內(nèi)容無能為力,除非更改數(shù)據(jù)庫結(jié)構(gòu),如增加表的字段或者新的數(shù)據(jù)庫表??缙脚_、跨系統(tǒng)的數(shù)據(jù)交換是通過擴(kuò)展名為.DBF的Xbase關(guān)系型數(shù)據(jù)庫文件格式實現(xiàn)。⑥經(jīng)過壓縮、分割處理的數(shù)據(jù)交換文件,應(yīng)將其解壓縮、合并后再進(jìn)行交換。⑦
3、政務(wù)信息資源目錄體系基于XML技術(shù)。XML應(yīng)用面主要分為文檔型和數(shù)據(jù)型兩種類型。前一類型中,XML存放整個文檔的XML數(shù)據(jù),然后XSLT將XML轉(zhuǎn)換、解析,結(jié)合XSLT中的HTML標(biāo)簽,最終成為HTML顯示在瀏覽器上。而后者則是利用相關(guān)的XML API(MSXML DOM、JAVA DOM等)對XML進(jìn)行存取和查詢。XML還可以作為信息傳遞的載體,主要是為分布式應(yīng)用程序服務(wù)。XML文本本身不僅可包含信息內(nèi)容,還涵蓋了信息結(jié)構(gòu)。只要是格式正確的XML文本,都可以隨時添加到數(shù)據(jù)庫里,并可以與分布式的應(yīng)用進(jìn)行數(shù)據(jù)交互。比較而言,XML和數(shù)據(jù)庫的聯(lián)合兼有關(guān)系數(shù)據(jù)庫和面向?qū)ο髷?shù)據(jù)庫的優(yōu)勢,因此基于XML技術(shù)的政務(wù)信息資源目錄比目前的檔案目錄數(shù)據(jù)庫更具擴(kuò)展功能。此外,對編目對象、分類技術(shù)等的比較前文已有表述。
三、檔案目錄體系
與政務(wù)信息資源目錄體系的交互融和
基于檔案目錄與政務(wù)信息資源目錄體系的內(nèi)在聯(lián)系及上述異同點的比較,我們可以考慮在現(xiàn)有的檔案目錄與政務(wù)信息資源目錄體系之間建立交互渠道。具體做法是建立檔案著錄項目和政務(wù)信息資源目錄體系核心元數(shù)據(jù)的映射關(guān)系,利用已有技術(shù),采用現(xiàn)階段比較流行的WEB數(shù)據(jù)庫方式進(jìn)行處理,使系統(tǒng)可以根據(jù)用戶的檢索請求,檢索相應(yīng)的目錄數(shù)據(jù)庫,并將查詢記錄,以WEB的形式反饋給用戶,同時實現(xiàn)多種模式檢索服務(wù),滿足不同權(quán)限用戶異地查詢需求。在實際操作中應(yīng)考慮的問題主要有:
1、檢索質(zhì)量。檔案著錄項目和核心元數(shù)據(jù)在含義、編排組織、條目涵蓋范圍、特征等方面存在差異,如不能嚴(yán)格定義好映射關(guān)系,可能導(dǎo)致映射不清,擴(kuò)大或縮小檢索范圍,從而影響查全率和查準(zhǔn)率等檢索指標(biāo)。
2、檔案館內(nèi)各目錄數(shù)據(jù)庫之間的系統(tǒng)關(guān)聯(lián)。檔案館如不能將各層級、類別的目錄數(shù)據(jù)庫系統(tǒng)組織關(guān)聯(lián)起來,充分發(fā)揮、擴(kuò)展如檔號等共有著錄項目功能,將不利于實現(xiàn)兩個目錄體系的雙向映射,還可能增加檢索的復(fù)雜度,從而影響檢索質(zhì)量與效率。
3、使用權(quán)限。檔案目錄與政務(wù)信息資源目錄體系建立交互,在為利用者提供便利的同時,也可能帶來檔案內(nèi)容安全的高風(fēng)險,因而還應(yīng)考慮對不同檔案利用者加以權(quán)限設(shè)定,設(shè)置針對立檔單位、查閱已開放檔案、查閱未開放檔案、查閱公民個人檔案信息等的不同接口,以滿足利用者通過一體化利用服務(wù)平臺,在相應(yīng)權(quán)限內(nèi)同時查閱檔案和政務(wù)信息資源中有關(guān)信息的利用需求,并盡可能保護(hù)好檔案安全,避免未到期或不宜開放的檔案向社會開放。
總之,我們可以嘗試?yán)脵n案目錄和政務(wù)信息資源目錄體系之間的關(guān)系,建立交互渠道,以促進(jìn)檔案和政務(wù)信息資源的共享和利用。但是,我們也不能忽視實際操作中可能出現(xiàn)的上述或是更多有待進(jìn)一步研究探討的問題。
注釋:
①DA/T18-1999《檔案著錄規(guī)則》
②③GB/T21063.1-2007《政務(wù)信息資源目錄體系 第1部分:總體框架》
信息工程監(jiān)理是最近幾年興起的保障信息化建設(shè)質(zhì)量的一種約束機制。它采用“五控兩管一協(xié)調(diào)”的控制模式,對業(yè)主、承建單位的項目行為實施監(jiān)督,保障信息化建設(shè)的質(zhì)量,避免“豆腐渣”工程,起著不可或缺的重要作用。
一、信息化建設(shè)與知識管理
信息化建設(shè)是以知識管理為核心,信息資源為基礎(chǔ),提高組織核心競爭力為目的的全面整合或再造組織業(yè)務(wù)流程的過程。知識管理是獲取、儲存、學(xué)習(xí)、共享、創(chuàng)新知識的管理控制過程。在信息化建設(shè)中,企業(yè)、政府等組織通過知識管理,從現(xiàn)有的業(yè)務(wù)流程和數(shù)據(jù)中,挖掘、獲取并確定各類知識資源,定位擁有專業(yè)知識、經(jīng)驗的個體,將個體的知識、經(jīng)驗、信息提升為組織的知識資源,有序傳遞、整合、規(guī)劃和有效利用知識資源,有助于提高組織的整體業(yè)務(wù)、技術(shù)和管理水平。
在承建單位實施信息化建設(shè)中,知識管理是通過公司內(nèi)雇員、部門、可能的跨國公司合作、與業(yè)主的溝通協(xié)調(diào),傳遞、整合、有效利用本單位的知識資源,運用信息技術(shù),通過設(shè)計最優(yōu)技術(shù)方案、控制施工質(zhì)量,共享和創(chuàng)造知識價值。
在信息化建設(shè)中,對組織內(nèi)各種各類知識進(jìn)行評估,挖掘、獲取真正有用的知識。知識不僅僅是信息,是顯性知識和隱性知識的集合。通過評估,區(qū)分知識和信息、知識管理和信息管理,以實現(xiàn)資源的充分開發(fā)與應(yīng)用。
整合或再造業(yè)務(wù)流程,是與知識管理密切相關(guān)的。1990年美國管理專家Michael Hammer提出了“業(yè)務(wù)流程重組”(Business Process ReengineeringBPR)的概念,它是以用戶需求為導(dǎo)向,信息化、知識化為基礎(chǔ),對用戶的業(yè)務(wù)流程進(jìn)行再思考、關(guān)鍵性的重新設(shè)計和根本的變革,從而獲得在成本、質(zhì)量、服務(wù)和速度等方面業(yè)績的持續(xù)改善。在業(yè)務(wù)流程重組中,信息(知識)的獲取、分類、存儲、利用,只有與知識管理結(jié)合,才能夠發(fā)揮更有效的作用。
知識管理技術(shù)貫穿于信息化建設(shè)始終,它與信息技術(shù)相輔相成。在知識獲取、學(xué)習(xí)、共享、創(chuàng)新的過程中,整合各種信息技術(shù),構(gòu)建完整的知識管理體系,是知識經(jīng)濟(jì)時代信息技術(shù)的新發(fā)展。
二、信息資源規(guī)劃和整合
信息資源整合(Information Resource Integrating, IRI)的前提是進(jìn)行統(tǒng)一的信息資源規(guī)劃(Information Resource Planning, IRP),消除“信息孤島”,共享信息資源。信息資源的規(guī)劃是實施信息化工程的基礎(chǔ),IRP的基礎(chǔ)是建立信息資源管理基礎(chǔ)標(biāo)準(zhǔn),IRI的實質(zhì)是通過信息技術(shù)改造、重建或重構(gòu)數(shù)據(jù)環(huán)境。信息產(chǎn)業(yè)部的《信息系統(tǒng)工程監(jiān)理暫行規(guī)定》中定義信息資源系統(tǒng)為“以信息技術(shù)為主要手段建立的信息資源采集、儲存、處理的資源系統(tǒng)”。
在信息化建設(shè)中,信息資源規(guī)劃是很重要的一環(huán)。在組織的生產(chǎn)、經(jīng)營、服務(wù)活動中,會產(chǎn)生大量的數(shù)據(jù)、資料、指標(biāo)、圖紙、報表及其它顯性資源,也存在各種各類的知識、擁有專業(yè)知識和經(jīng)驗的個體等隱性資源。信息資源規(guī)劃是對實施信息化后產(chǎn)生、控制、使用這些資源進(jìn)行識別和分類;評估、挖掘、獲取、共享各類知識;對承載信息資源的信息基礎(chǔ)設(shè)施進(jìn)行分析、設(shè)計和指導(dǎo)。
(一)信息資源規(guī)劃的主要任務(wù)
信息資源規(guī)劃的任務(wù)是對支撐業(yè)務(wù)流程的邏輯相關(guān)的數(shù)據(jù)進(jìn)行分類,建立具有結(jié)構(gòu)化、標(biāo)準(zhǔn)化、一致性的共享數(shù)據(jù)庫。分析業(yè)務(wù)流程重組后產(chǎn)生、控制和使用的數(shù)據(jù),了解各種數(shù)據(jù)的內(nèi)容、范圍、可靠性等,理解數(shù)據(jù)的共享要求和應(yīng)用策略以及數(shù)據(jù)使用中的問題,使信息資源規(guī)劃能夠滿足數(shù)據(jù)資源的管理要求。
(二)信息資源管理標(biāo)準(zhǔn)
信息資源管理標(biāo)準(zhǔn)是指決定信息系統(tǒng)質(zhì)量的、進(jìn)行信息資源開發(fā)利用的基本標(biāo)準(zhǔn)。威廉·德雷爾1985年在其《數(shù)據(jù)管理》專著中總結(jié)了信息資源管理的基礎(chǔ)標(biāo)準(zhǔn)———數(shù)據(jù)管理五項標(biāo)準(zhǔn),內(nèi)容如下:
1.數(shù)據(jù)元素標(biāo)準(zhǔn)。數(shù)據(jù)元素(Data Elements)是信息資源中最小的信息單位,是抽象的數(shù)據(jù)對象。它的質(zhì)量是構(gòu)建穩(wěn)定的數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)的關(guān)鍵。數(shù)據(jù)元素標(biāo)準(zhǔn)包括數(shù)據(jù)元素命名標(biāo)準(zhǔn)、標(biāo)數(shù)據(jù)元素識標(biāo)準(zhǔn)和數(shù)據(jù)元素一致性標(biāo)準(zhǔn)。
2.信息分類編碼標(biāo)準(zhǔn)。是信息標(biāo)準(zhǔn)中的基礎(chǔ)標(biāo)準(zhǔn)。信息分類編碼(Information Classifying and Coding)的對象,是一些最重要的數(shù)據(jù)元素,自動處理、檢索、存儲和傳輸信息的質(zhì)量及效率與這些元素緊密相關(guān)。信息分類是根據(jù)信息內(nèi)容的屬性或特征,將信息按一定的原則和方法進(jìn)行區(qū)分和歸類,并建立一定的分類系統(tǒng)和排列順序,便于管理和使用信息。信息編碼就是在信息分類的基礎(chǔ)上,將編碼對象賦予有一定規(guī)律性的、易于計算機和人識別和處理的符號。信息分類編碼工作要確定每個編碼對象的編碼規(guī)則、碼表結(jié)構(gòu)和代碼表。
3.用戶視圖標(biāo)準(zhǔn)。用戶視圖(User View)是一些數(shù)據(jù)元素的集合,表示用戶對信息需求和數(shù)據(jù)實體的最終解釋。用戶視圖是數(shù)據(jù)的系統(tǒng)外在表現(xiàn)形式,是系統(tǒng)的輸入、輸出媒介和手段。用戶視圖與外部數(shù)據(jù)流是同一詞,來自某個數(shù)據(jù)源或流向某個數(shù)據(jù)接收端的數(shù)據(jù)流。常用的用戶視圖有紙面的,如圖紙、單證、表單、報表、賬冊等;有電子的,如屏幕格式等。
4.概念數(shù)據(jù)庫標(biāo)準(zhǔn)。概念數(shù)據(jù)庫(Conceptual Database)是用戶對數(shù)據(jù)存儲的最終解釋。用戶的信息需求,應(yīng)首先界定概念數(shù)據(jù)庫。概念數(shù)據(jù)庫是綜合信息資源用戶的數(shù)據(jù)要求構(gòu)成的全局?jǐn)?shù)據(jù)庫,表示數(shù)據(jù)庫的整體數(shù)據(jù)組織狀況和邏輯結(jié)構(gòu)。
5.邏輯數(shù)據(jù)庫標(biāo)準(zhǔn)。邏輯數(shù)據(jù)庫(Logical Database)是系統(tǒng)分析設(shè)計人員的解釋。在關(guān)系數(shù)據(jù)庫模型中,邏輯數(shù)據(jù)庫是一組規(guī)范化的基本表(Base Table),是從概念數(shù)據(jù)庫中映射出的所需信息。邏輯數(shù)據(jù)庫表示的是局部數(shù)據(jù)的數(shù)據(jù)庫邏輯結(jié)構(gòu)。
(三)信息資源規(guī)劃方案
在定義數(shù)據(jù)管理標(biāo)準(zhǔn)的基礎(chǔ)上,制定信息資源規(guī)劃方案,為業(yè)務(wù)流程重組提供依據(jù),為系統(tǒng)設(shè)計提供基礎(chǔ)。
在信息資源規(guī)劃中,將隱性資源轉(zhuǎn)變?yōu)轱@性資源,有序傳遞、整合、規(guī)劃和有效利用各類知識資源。因此,信息資源規(guī)劃是資源的知識管理規(guī)劃。信息技術(shù)的投資,可能不會給企業(yè)帶來明顯的效益,因為基于信息的競爭優(yōu)勢正在逐漸轉(zhuǎn)變?yōu)榛谥R管理的競爭優(yōu)勢,以信息資源規(guī)劃為核心的信息系統(tǒng)規(guī)劃,如果不實施知識管理,將不會產(chǎn)生顯著的信息化效益。
信息資源的分類是一種從主題內(nèi)容角度組織和揭示信息資源的方法,是分類方法在信息資源組織中的應(yīng)用。目前對信息資源的分類主要采取兩種方式:一是以人工標(biāo)引為基礎(chǔ)的傳統(tǒng)文獻(xiàn)分類法。二是更具網(wǎng)絡(luò)信息資源特點而產(chǎn)生的自編等級式主題分類法,又叫網(wǎng)絡(luò)分類法。傳統(tǒng)分類法主要是根據(jù)文獻(xiàn)信息的特點、檢索的需要和技術(shù)的支持程度,按照傳統(tǒng)環(huán)境的特點編制的。網(wǎng)絡(luò)環(huán)境的出現(xiàn)、計算機及其檢索技術(shù)的迅速發(fā)展與應(yīng)用以及網(wǎng)絡(luò)環(huán)境下信息資源的幾何級數(shù)式的增長,極大地改變了分類法處理的對象和技術(shù)環(huán)境。這就為網(wǎng)絡(luò)中的自編等級式主題分類法的產(chǎn)生與發(fā)展創(chuàng)造了條件。自編等級式主題分類法根據(jù)網(wǎng)絡(luò)信息資源的結(jié)構(gòu)內(nèi)容特點,結(jié)合用戶使用的需要,逐步成為區(qū)別于傳統(tǒng)文獻(xiàn)分類法的網(wǎng)絡(luò)中通用的信息資源分類法。
1網(wǎng)絡(luò)分類法與傳統(tǒng)文獻(xiàn)分類法的不同
1.1建立分類體系的原則不同
文獻(xiàn)分類法一般是以學(xué)科為中心,對各種文獻(xiàn)資源以主題的方式集中于相應(yīng)學(xué)科之下。在分類法發(fā)展的歷史上,曾經(jīng)出現(xiàn)過英國布朗編制的以主題為中心的主題分類法,但由于不適合使用以及文獻(xiàn)資源本身的特點,所以沒有得到廣泛的使用。網(wǎng)絡(luò)新環(huán)境的出現(xiàn),使得以主題為中心或者以主題為主結(jié)合學(xué)科特點的分類法有了應(yīng)用的空間。應(yīng)用這種分法的英文搜索引擎中,opendirectory、looksmart基本以主題為中心展開信息資源的分類,其分類專指性強。yahoo!則是采用以主題為中心、結(jié)合學(xué)科的方式。除按照主題設(shè)置類目外,還設(shè)置政府與政治、科學(xué)、教育和社會科學(xué)等專門學(xué)科類目與包含內(nèi)容較寬的類目。
1.2類目的展開形式不同
傳統(tǒng)分類法多基于學(xué)科的等級隸屬關(guān)系,按照嚴(yán)格的邏輯內(nèi)容從屬劃分,是一個嚴(yán)密的、深細(xì)的線形體系。網(wǎng)絡(luò)分類法層次較少,體系簡明。為了突出重點,不嚴(yán)格按照等級劃分,類目的設(shè)置也不嚴(yán)格完整。傳統(tǒng)分類法一次劃分采用一個標(biāo)準(zhǔn),網(wǎng)絡(luò)分類法為了方便用戶查找與符合網(wǎng)絡(luò)信息資源的特點,一次劃分采用多個標(biāo)準(zhǔn)且各主題之間使用超文本鏈接和多窗口顯示。使信息資源得到全面的揭示。
1.3基本大類的設(shè)置不同
傳統(tǒng)分類法的類目設(shè)置一般根據(jù)傳統(tǒng)文獻(xiàn)信息資源和一定的用戶特點進(jìn)行,重視學(xué)科性、邏輯性,設(shè)鬣較全面完整。網(wǎng)絡(luò)分類體系則根據(jù)用戶需求的不同與網(wǎng)絡(luò)信息資源的分布不同,以用戶關(guān)注程度高、信息資源集中的類目作為基本大類。
2網(wǎng)絡(luò)分類法存在的問題
2.1類目展開缺乏規(guī)律性
類目的展開缺乏統(tǒng)一的標(biāo)準(zhǔn)。其下位類展開過程中,不少類目同時采用多個分類標(biāo)準(zhǔn),同時忽略類目展開的完整性。由于下位類的展開往往內(nèi)容外延過寬,增加了用戶的查詢時間,降低了檢準(zhǔn)率。
2.2同位類設(shè)置缺乏邏輯性
同位類中往往有不同等級、不同層次的類目共存,且同位類內(nèi)容交叉從屬缺乏規(guī)律性。例如,yahoo!中科學(xué)與社會科學(xué)在概念關(guān)系上就不屬于同一個等級。
2-3類目排列缺乏規(guī)范性
英文搜索引擎大都是按照字順的方式排列同位類,其優(yōu)點是便于用戶按字順查找,缺點是類目排列混亂,不利于相關(guān)類目的蠢找。而中文搜索引擎多數(shù)不采用字順的方式,而采用以用戶關(guān)注類目的程度來排列。這種按關(guān)注程度或者說按點擊率排列的方式加大了類目增補的難度,而且不易保持同時也不利于揭示相關(guān)類目。
2.4橫向關(guān)系揭示缺乏科學(xué)性
傳統(tǒng)分類法對橫向關(guān)系,一般通過交替類目和類目參照揭示,作為類目縱向關(guān)系的一種補充。網(wǎng)絡(luò)分類體系則使用鏈接方式,通過在相應(yīng)類下重復(fù)反映,使其成為類目關(guān)系的有機組成部分。這也顯示出橫向關(guān)系揭示的單一性。在處理過程中缺乏相關(guān)關(guān)系的控制,憑借鏈接技術(shù)的發(fā)展使得對于類目的相關(guān)揭示更加寬泛。
3網(wǎng)絡(luò)分類法選擇的必然性
3.1網(wǎng)絡(luò)分類法選擇的競爭行為分析
目前,國外yahoo!open directory、looksmart已經(jīng)證明網(wǎng)絡(luò)分類法的實用性以及其已被廣大用戶接受,雖然這種分類法存在不少問題,但根據(jù)網(wǎng)絡(luò)效應(yīng)的概念:當(dāng)一種產(chǎn)品或服務(wù)給某個消費者帶來的價值或效用,與其他使用這一產(chǎn)品或服務(wù)的消費者人數(shù)具有正向關(guān)系時,即存在網(wǎng)絡(luò)效應(yīng)。國內(nèi)后來的網(wǎng)絡(luò)公司,如搜狐、新浪等,都采用類似的分類思想,制定出相似的分類法。另外,如果這些后續(xù)的公司有一家公司a決定采用與傳統(tǒng)分類法類似的分類方式,我們命名為科學(xué)化,令yahoo!open directoyr、looksmart等的為生活化,則該公司面對的競爭博弈如下圖所示:
圖中數(shù)字表示客戶的數(shù)量比例的數(shù)字抽象,由這個博弈模型可看出,其均衡為公司a選擇生活化,即無論其他公司選擇哪種分類法,公司a選擇現(xiàn)行的網(wǎng)絡(luò)分類法均能擁有最大化的市場占有率。
3.2網(wǎng)絡(luò)分類法實用的必然性
3.2.1用戶需求的特點
網(wǎng)絡(luò)信息資源的用戶非常廣泛,而且不穩(wěn)定,受教育程度差異較大,利用網(wǎng)絡(luò)信息的目的和類型也有很大不同。網(wǎng)絡(luò)資源用戶上網(wǎng)利用的絕大部分是現(xiàn)行網(wǎng)絡(luò)分類體系所反映出的突出教育、娛樂、旅行、生活等與日常生活密切有關(guān)、普通用戶感興趣的類目,弱化了科學(xué)技術(shù)、學(xué)術(shù)性類目的設(shè)置。
3.2.2網(wǎng)絡(luò)信息資源的特點
在學(xué)習(xí)完前面的信息獲取、加工、集成與交流之后,應(yīng)對這些信息資源進(jìn)行有效的管理,才能為我們所用,更好地發(fā)揮信息的使用價值。
2.主要內(nèi)容
本章主要通過三個層次來讓學(xué)生了解如何進(jìn)行信息資源管理,掌握適應(yīng)社會工作和生活的必要技能。
三個層次遵循了信息資源管理發(fā)展的歷史軌跡,通過這三種信息資源管理方式的比較,更加深刻地使學(xué)生理解信息資源管理的重要性以及科技發(fā)展對信息資源管理的影響。
二、教學(xué)目標(biāo)
1.知識與技能
(1)了解信息資源管理的一般過程;(2)了解信息資源管理的重要性和普遍性;(3)理解信息資源管理的分類組織和標(biāo)準(zhǔn)化思想;(4)合理選擇常用工具,管理個人學(xué)習(xí)、工作、生活中的信息資源;(5)了解利用數(shù)據(jù)庫管理信息資源的工作思想;(6)理解數(shù)據(jù)庫存儲、管理大量信息和高效檢索數(shù)據(jù)的優(yōu)勢;(7)能夠把數(shù)據(jù)庫的一些常見操作技能遷移到今后的學(xué)習(xí)工作中去;(8)能夠公正地評價三種信息資源管理方式及其對社會和個人的影響。
2.過程與方法
(1)了解信息資源管理的一般過程(從學(xué)生身邊的、已有的學(xué)習(xí)經(jīng)驗出發(fā),以圖書館藏圖書管理這一具有代表性的實例為依托,讓學(xué)生調(diào)查了解信息資源管理的一般過程);(2)以“ISBN”引入分類與標(biāo)準(zhǔn)化思想;(3)能夠利用恰當(dāng)?shù)墓ぞ?,將信息資源進(jìn)行數(shù)字化管理;(4)體驗、認(rèn)識數(shù)據(jù)庫管理大量信息資源的過程。
3.情感態(tài)度與價值觀
(1)主動將信息資源管理的思想、方法創(chuàng)造性地應(yīng)用到生活、學(xué)習(xí)之中;(2)養(yǎng)成信息資源管理的良好習(xí)慣;(3)養(yǎng)成奉獻(xiàn)精神及樂于助人、團(tuán)結(jié)協(xié)作精神;(4)正確評價標(biāo)準(zhǔn)化對實現(xiàn)社會生產(chǎn)、管理規(guī)范化的影響。
三、教學(xué)重點與難點
教學(xué)重點:信息資源管理的一般過程,分類組織及標(biāo)準(zhǔn);個人數(shù)字信息資源管理的實踐;數(shù)據(jù)庫管理大量信息、高效檢索的優(yōu)勢;信息資源管理對我們今后生活的影響。
教學(xué)難點:管理本地計算機信息資源;數(shù)據(jù)庫存儲、管理大量信息為什么有優(yōu)勢。
四、課時安排
節(jié) 次 參考課時數(shù)
第一節(jié) 信息資源管理的目的 0.5課時
第二節(jié) 信息資源管理的方式 0.5-1.5課時
第三節(jié) 使用數(shù)據(jù)庫管理信息 約2課時
五、教學(xué)建議
1.信息資源管理的目的
“信息資源管理”對學(xué)生來說是一個新名詞,教師應(yīng)該讓學(xué)生先具有一定的感性認(rèn)識。因此,建議先讓學(xué)生參與一些(或一項)信息資源管理的活動,或者進(jìn)行信息資源管理的調(diào)查(可與研究性學(xué)習(xí)結(jié)合起來),或讓學(xué)生留心身邊的有關(guān)信息資源管理活動,這樣便于學(xué)生對教師所講的內(nèi)容產(chǎn)生共鳴,教師才能“有的放矢”。
圖書館藏書管理是讓學(xué)生了解信息資源管理的一般過程很具代表性的實例,當(dāng)然也可以以學(xué)生整理自己的“小書屋”來說明,也可以以實踐“探究分類搜索的分類方法”來探究網(wǎng)上圖書、信息等資源是如何管理的,這樣可以讓學(xué)生更好地理解第三節(jié)《使用數(shù)據(jù)庫管理信息》。在介紹完一般的信息管理過程的基礎(chǔ)上,教師應(yīng)進(jìn)一步引導(dǎo)學(xué)生去探索,讓他們?nèi)ケ容^、發(fā)現(xiàn)信息技術(shù)對信息資源管理帶來的深遠(yuǎn)的影響。
分類組織與標(biāo)準(zhǔn)的教學(xué),可以從商品的條形碼、國際標(biāo)準(zhǔn)書號(ISBN)、國際刊號(ISSN)等入手,讓學(xué)生自主探究為什么要分類、如果不分類組織會有什么后果、如何分類,要有一定的標(biāo)準(zhǔn)和標(biāo)準(zhǔn)化思想的形成。
2.信息資源管理方式
一是手工管理方式,二是計算機管理方式(又分文件管理方式和數(shù)據(jù)庫管理方式)。它們是一般與特殊的關(guān)系,即從一般意義上的信息資源管理縮小到僅僅講計算機管理方式。 計算機管理方式實例比較多,教材給出了五例。如:“用電子表格管理個人財務(wù)”可創(chuàng)設(shè)一個情境,讓學(xué)生在緊接著的實踐中體驗如何管理財務(wù)和樹立對金錢的正確態(tài)度;“用資源管理器管理本地計算機資源”、“用 Blog管理網(wǎng)上學(xué)習(xí)資源”是對該實例相關(guān)知識或理念的說明;再如“用收藏夾分類管理喜愛的網(wǎng)站”或“文曲星的使用”等也是相關(guān)示例。通過本章學(xué)習(xí),教師要引導(dǎo)學(xué)生養(yǎng)成良好的計算機信息管理習(xí)慣,并處理好個人與集體的關(guān)系。如用Blog管理網(wǎng)上學(xué)習(xí)資源既能體現(xiàn)個人信息管理又能兼顧集體交流。
3.使用數(shù)據(jù)庫管理信息
本節(jié)是學(xué)生尚未接觸過的內(nèi)容,因此實踐對促進(jìn)學(xué)生理解將具有重要的作用。建議教師在學(xué)生實踐的基礎(chǔ)上,引導(dǎo)學(xué)生自己去發(fā)現(xiàn)問題和總結(jié)規(guī)律。教師在講解時要多考慮學(xué)生已有的知識,盡量引導(dǎo)學(xué)生進(jìn)行知識、技能和方法的遷移。
2高校圖書館開展網(wǎng)絡(luò)信息資源組織與管理的意義
網(wǎng)絡(luò)環(huán)境下,評估高校圖書館水平不再局限于館舍規(guī)模和館藏數(shù)量,而取決于信息服務(wù)手段的自動化、信息服務(wù)形式的多樣化、信息服務(wù)效率的高效化,以及信息服務(wù)資源的網(wǎng)絡(luò)化等。高校圖書館能否在這些方面做得更好,主要取決于網(wǎng)絡(luò)信息資源的組織與管理。
2.1可以提高網(wǎng)絡(luò)信息資源的利用價值當(dāng)今社會對信息需求13益復(fù)雜,互聯(lián)網(wǎng)的首要目標(biāo)是為社會公眾提供有價值的信息.但信息的價值是難以確定的。高校圖書館在參與網(wǎng)絡(luò)信息資源組織的過程中。將網(wǎng)上無序的、不均衡的數(shù)字化信息資源按照一定的標(biāo)準(zhǔn)進(jìn)行排列整理,使其有序化,并對其進(jìn)行選擇和判斷。使分散無序的信息轉(zhuǎn)化成有利用價值的資源。
2.2可以提高用戶使用網(wǎng)絡(luò)信息資源的效率網(wǎng)絡(luò)信息爆炸式增長使知識存貯無序化。進(jìn)而加劇了信息泛濫;知識的增長速度遠(yuǎn)遠(yuǎn)低于信息的增長速度,導(dǎo)致了人們獲取知識受阻。高校最主要的任務(wù)是教學(xué)和科研。高校圖書館通過開展網(wǎng)絡(luò)信息資源組織和管理,將雜亂零散的、不便于用戶檢索查詢的、在線利用率低的信息資源經(jīng)過科學(xué)的重組,實現(xiàn)信息資源結(jié)構(gòu)由“信息資源”向“知識體系”轉(zhuǎn)化.成為分類科學(xué)、層次明顯的知識體系。就能為教師、學(xué)生、科研人員的學(xué)習(xí)和研究活動提供參考信息。提高用戶使用信息資源的效率。
2.3可以減少信息污染與傳統(tǒng)文獻(xiàn)信息資源相比,網(wǎng)絡(luò)信息資源具有數(shù)量巨大、內(nèi)容龐雜、傳播面廣、非控制性等特點。高校圖書館按照統(tǒng)一的規(guī)范和質(zhì)量控制標(biāo)準(zhǔn).對網(wǎng)絡(luò)信息資源進(jìn)行過濾,從而達(dá)到減少信息污染、凈化網(wǎng)絡(luò)空間的作用,有利于大學(xué)生身心全面、健康地發(fā)展_2]。
3高校圖書館開展網(wǎng)絡(luò)信息資源組織與管理的優(yōu)勢
與其他社會機構(gòu)、團(tuán)體相比,高校圖書館開展網(wǎng)絡(luò)信息資源組織和管理具有以下優(yōu)勢:(1)服務(wù)優(yōu)勢。高校圖書館在提供知識服務(wù)、信息處理等方面的能力強于其他信息機構(gòu)。(2)人才優(yōu)勢。高校圖書館具有一大批懂圖書館學(xué)、計算機技術(shù)等方面的專業(yè)人才。(3)經(jīng)費保障優(yōu)勢。各高校幾乎都把圖書館列為其重點建設(shè)對象,高校圖書館成為衡量一所高校建設(shè)發(fā)展?fàn)顩r乃至教學(xué)科研能力和水平的重要標(biāo)志,在經(jīng)費上給予保障。
4高校圖書館開展網(wǎng)絡(luò)信息資源組織與管理存在的問題
當(dāng)前,高校圖書館在對網(wǎng)絡(luò)信息資源進(jìn)行組織和管理方面存在以下問題:(1)大多數(shù)高校圖書館未能建立適合本校教學(xué)特點的網(wǎng)上檢索工具和組建學(xué)科導(dǎo)航庫,甚至還有不少圖書館未購電子圖書庫、電子期刊網(wǎng),沒有建立與CALIS等的鏈接,網(wǎng)絡(luò)信息資源的存儲位置受到控制,使多數(shù)讀者感到檢索、利用網(wǎng)絡(luò)資源困難。(2)高校圖書館大多使用商用網(wǎng)絡(luò)資源目錄和搜索引擎組織信息,這使得用戶在利用這些工具獵取信息時.由于缺乏統(tǒng)一、規(guī)范的分類體系和標(biāo)引方式,獲得的信息缺乏嚴(yán)密的科學(xué)性和邏輯性,信息質(zhì)量參差不齊。(3)許多高校圖書館電子閱覽室規(guī)模龐大,但使用者卻始終不多,電腦閑置現(xiàn)象普遍。即使有學(xué)生使用,但大多也是為了上網(wǎng)漫游,很少與獲取學(xué)術(shù)信息有關(guān)[。其影響因素是多方面的,但圖書館缺乏對網(wǎng)絡(luò)信息進(jìn)行有效的組織和管理是一個重要原因。(4)網(wǎng)絡(luò)環(huán)境下館員應(yīng)具備“專家型”素質(zhì),應(yīng)能夠充分利用先進(jìn)的信息技術(shù).對館藏資源進(jìn)行深層次開發(fā),以健康有序的信息資源全方位滿足用戶需求。但目前我國高校能達(dá)到這樣素質(zhì)要求的館員數(shù)量仍是少數(shù)。
5高校圖書館開展網(wǎng)絡(luò)信息資源組織與管理的原則及方式
5.1組織與管理原則
由于網(wǎng)絡(luò)信息資源的海量增長且良莠不齊.高校圖書館必須按照一定的原則組織信息資源,以滿足讀者需求(1)針對性原則。高校圖書館應(yīng)根據(jù)學(xué)校的學(xué)科建設(shè)和科研工作以及本館的特點、軟硬件條件、發(fā)展目標(biāo)等開展網(wǎng)絡(luò)信息資源的組織和管理。在充分做好用戶信息需求咨詢和調(diào)查工作的基礎(chǔ)上,有重點、有目的收集利用價值較大的信息,建立起有自身特色的數(shù)據(jù)庫館藏與合理的館藏資源體系.實現(xiàn)網(wǎng)絡(luò)信息資源開發(fā)的最大效益。這就要求高校圖書館要提高工作人員的相關(guān)業(yè)務(wù)素質(zhì)和技能,創(chuàng)建友好的界面,提供安全有效的主頁鏈接,為師生用戶服務(wù)。(2)選擇性原則。圖書館應(yīng)采取多種渠道和方法選擇信譽好、可信度高、專業(yè)的權(quán)威網(wǎng)站,按制定的標(biāo)準(zhǔn)系統(tǒng)地進(jìn)行選擇和鑒別,下載對本校學(xué)科建設(shè)有用的高水平、連續(xù)性信息。在不違背版權(quán)的前提下,將最準(zhǔn)確、最有價值的信息提供給師生用戶。(3)時效性原則。高校圖書館開展網(wǎng)絡(luò)信息資源組織活動時要注重時效,跟蹤網(wǎng)絡(luò)信息的動態(tài)變化。第一時間為師生用戶提供最新的有學(xué)術(shù)價值、能反映本學(xué)科前沿發(fā)展水平的網(wǎng)上學(xué)術(shù)信息。(4)系統(tǒng)性原則。高校信息用戶多從事系統(tǒng)的研究和學(xué)習(xí),出現(xiàn)對循序漸進(jìn)閱讀的需求和對參考咨詢不斷深入的需求。在經(jīng)費有限的情況下,要滿足各類用戶的需求,就要求高校圖書館必須從自身實際發(fā)展?fàn)顩r出發(fā),協(xié)調(diào)處理現(xiàn)有館藏資源和網(wǎng)絡(luò)信息資源之間的關(guān)系。在網(wǎng)絡(luò)信息資源收集組織過程中做好總體規(guī)劃,有所比較、有所分析,逐步確立各類信息資源的合理比例關(guān)系,避免重復(fù)建設(shè)。做到資源互補.強化館藏的系統(tǒng)性[4],使信息資源結(jié)構(gòu)的合理性、科學(xué)性同用戶需求的系統(tǒng)性相一致。
5.2組織與管理方式
目前高校圖書館組織和管理網(wǎng)絡(luò)信息資源的方式主要有以下幾種:
(1)文件方式。以文件系統(tǒng)來組織和管理網(wǎng)絡(luò)信息資源,主要用于存貯圖形、圖像、圖表、音頻、視頻等非結(jié)構(gòu)化信息,補充其他信息組織方式。但它難以平衡網(wǎng)絡(luò)負(fù)載與文件數(shù)量的關(guān)系。對結(jié)構(gòu)化信息的組織顯得軟弱無力。
(2)超媒體方式。這是超文本技術(shù)與多媒體技術(shù)的結(jié)合.用超媒體方式來組織網(wǎng)絡(luò)信息資源,將網(wǎng)上所獲得的各種媒體(文字、音頻、圖像、視頻等)的信息資源利用超文本技術(shù)有機地編織在一起。使人們可以通過高度鏈接的網(wǎng)絡(luò)結(jié)構(gòu)在各種信息庫中找到所需要的信息。它符合人們跳躍性思維習(xí)慣和非線性的信息組織方式,具有良好的包容性和可擴(kuò)充性。但是當(dāng)超媒體網(wǎng)絡(luò)過于龐大時,很難準(zhǔn)確迅速地定位到需要的信息。
(3)數(shù)據(jù)庫組織方式。利用數(shù)據(jù)庫組織技術(shù)將要處理的網(wǎng)絡(luò)信息資源經(jīng)合理分類和規(guī)范化處理之后,按照固定的記錄格式存儲于計算機中。用戶通過關(guān)鍵詞和組配查詢就可以找到所需的信息線索.再通過信息線索找到相應(yīng)的網(wǎng)絡(luò)信息資源。數(shù)據(jù)庫技術(shù)組織信息資源可極大地提高信息的有序性、完整性、可理解性和安全性。但其處理的對象通常是結(jié)構(gòu)型、數(shù)值型的,對于事實型數(shù)據(jù)、離散型數(shù)據(jù)。尚無法達(dá)到令人滿意的效果。
(4)主題目錄組織技術(shù)。就是將信息資源按照某種事先確定的概念體系結(jié)構(gòu)建立等級式主題目錄.然后以超文本鏈接的方式將同學(xué)科、同專業(yè)、同行業(yè)或同區(qū)域的信息按照主題目錄的分類要求逐級組織起來。這種方式提供了一種較為友好的界面.用戶在主題目錄的指引下。通過逐層瀏覽,可找到與自己需求有關(guān)的網(wǎng)絡(luò)信息資源。具有簡單易用、目的性強、查準(zhǔn)率高、可擴(kuò)充性良好和系統(tǒng)嚴(yán)密的特點。但這種主題目錄究竟分多少層.每層分多少類,并無統(tǒng)一規(guī)定。因此,如何科學(xué)合理地構(gòu)建網(wǎng)絡(luò)信息分類體系成為該技術(shù)的難點。
(5)搜索引擎方式。這種方式是Internet上揭示和查找各網(wǎng)站主題信息資源的一種索引工具.是目前網(wǎng)上二次信息組織的主要方式之一。它根據(jù)網(wǎng)絡(luò)數(shù)據(jù)協(xié)議在網(wǎng)上漫游,發(fā)現(xiàn)新的網(wǎng)址、網(wǎng)頁信息.經(jīng)過抽取、排序、歸并建立網(wǎng)絡(luò)索引數(shù)據(jù)庫:數(shù)據(jù)庫按一定方式、結(jié)構(gòu)存儲,提供特定處理系統(tǒng)需要的相關(guān)信息(包括網(wǎng)址及相關(guān)描述性信息、計算機可識別的字段標(biāo)識符等)。這種方式自動化程度高.更新速度快,并可提供位置檢索、概念檢索、截詞檢索、嵌套檢索等[530
(6)指引庫方式。指引庫常用于組織網(wǎng)絡(luò)上專題性強的二次信息。它是一個由語義信息、文獻(xiàn)信息、鏈接信息組成的語義一文獻(xiàn)雙層數(shù)據(jù)結(jié)構(gòu)。其中語義信息與語義鏈接集合構(gòu)成雙層結(jié)構(gòu)的第一層:文獻(xiàn)信息與結(jié)構(gòu)鏈構(gòu)成第二層。鏈接信息由不同語義節(jié)點的語義鏈、不同文獻(xiàn)節(jié)點的結(jié)構(gòu)鏈和鏈接于語義節(jié)點和文獻(xiàn)節(jié)點之間的鏈構(gòu)成,穿行于第一、第二層之間。
6提高高校圖書館網(wǎng)絡(luò)信息資源組織與管理的策略
6.1改造傳統(tǒng)分類法以適應(yīng)網(wǎng)絡(luò)信息資源組織的需要
傳統(tǒng)分類法在網(wǎng)絡(luò)信息資源組織中的應(yīng)用是很有限的。現(xiàn)有利用《中圖法》的網(wǎng)站只有Cernet的“網(wǎng)絡(luò)指南針”和超星數(shù)字圖書館等少數(shù)幾家。而幾乎所有書目數(shù)據(jù)庫檢索系統(tǒng)都采用主題語言。因此了解現(xiàn)有網(wǎng)絡(luò)分類檢索工具存在的問題.對網(wǎng)絡(luò)環(huán)境下傳統(tǒng)分類法從分類主題一體化和分面組配化兩個方面著手進(jìn)行改造。結(jié)合傳統(tǒng)分類法的優(yōu)勢,建立網(wǎng)上信息的知識分類系統(tǒng),以適用網(wǎng)絡(luò)信息資源的揭示和組織。
6.2采用元數(shù)據(jù)對網(wǎng)絡(luò)信息進(jìn)行規(guī)范處理
網(wǎng)絡(luò)信息資源利用率高低,信息的描述和標(biāo)引是關(guān)鍵。元數(shù)據(jù)是專門用來描述數(shù)據(jù)特征和屬性的數(shù)據(jù),類似于圖書館的編目記錄。它可以促進(jìn)信息的組織和發(fā)展.可以幫助識別、描述和定位網(wǎng)絡(luò)信息資源【6_。目前,世界上功能較全面的元數(shù)據(jù)標(biāo)準(zhǔn)有DublinCore(都柏林核心)、RDF(信息資源描述結(jié)構(gòu))等。都柏林核心可以從3個方面對資源進(jìn)行描述,即資源內(nèi)容描述類包含題名、主題、關(guān)鍵詞等元素;知識產(chǎn)權(quán)描述類包含作者、出版者、其他責(zé)任者和權(quán)限管理等元素:外部屬性描述類包含日期、格式、語言等元素。由于其簡單實用、易于理解、可擴(kuò)展、能與其他元數(shù)據(jù)形式進(jìn)行連接等優(yōu)點,在揭示網(wǎng)絡(luò)資源方面非常有效。
6.3建立后控詞表.提高網(wǎng)絡(luò)信息資源的利用率
雖然在網(wǎng)絡(luò)信息組織中主題法的自然語言得到了廣泛的應(yīng)用.但是由于其自然語言檢索詞是不規(guī)范的.故即使數(shù)據(jù)庫中相關(guān)字段的詞受到控制。其對同義詞(組)、近義詞(組)的查找仍相當(dāng)困難,不能滿足對查準(zhǔn)率和查全率的要求。后控詞表的建立類似于入口詞表,是一種羅列自然語言的轉(zhuǎn)換工具。后控詞表的控制詞并非直接用于標(biāo)引.而是作為文獻(xiàn)檢索標(biāo)識的自然語言詞進(jìn)行控制。建立等同、等級、相關(guān)關(guān)系。用戶可通過輸人某一概念的任意同義詞作為檢索詞,經(jīng)過后控制詞表找出其標(biāo)識詞,然后再通過對所有同義詞的匹配查找,檢出符合條件的記錄。后控制詞表的建立.將使自由標(biāo)引顯得更加現(xiàn)實,使自由標(biāo)引所建數(shù)據(jù)庫更具實用價值。后控制詞表是提高查全率和查準(zhǔn)率的高效控制工具,也是實現(xiàn)自由標(biāo)引的基礎(chǔ)。
6.4網(wǎng)絡(luò)信息資源組織應(yīng)逐漸向信息挖掘轉(zhuǎn)變
高校作為重要的教學(xué)與科研基地,為社會發(fā)展與科技進(jìn)步提供強大動力,其對信息資源的建設(shè)、管理與應(yīng)用的要求也越來越高。高校進(jìn)行信息資源建設(shè),必須適應(yīng)學(xué)校發(fā)展與建設(shè)的根本要求,明確其建設(shè)目標(biāo)。
(一)以促進(jìn)學(xué)科建設(shè)與發(fā)展為目標(biāo),加強高校信息資源建設(shè)與服務(wù)保障水平學(xué)科建設(shè)是衡量高校辦學(xué)水平和整體綜合實力的重要標(biāo)志,是決定高校在激烈的競爭中興衰成敗的重要因素。無論是國家教育主管部門還是高校本身在評價學(xué)科建設(shè)的優(yōu)劣成敗時,對學(xué)科信息資源的評估始終是評價的重要方面。因此,要使信息資源的建設(shè)得到廣大師生的認(rèn)可,必須根據(jù)學(xué)科的內(nèi)在規(guī)律來進(jìn)行組織與建設(shè),并適應(yīng)學(xué)科的總體發(fā)展目標(biāo),全面提升信息資源的服務(wù)保障水平。
(二)以教師為中心,強化信息資源對課程教學(xué)的支撐作用教師是高校的基石,教師的教學(xué)活動必須要有豐富的信息資源作為保障。隨著現(xiàn)代教育技術(shù)的應(yīng)用,傳統(tǒng)的授課方式已經(jīng)無法滿足學(xué)生的需要,教師必須及時更新知識、更新教學(xué)方法與手段,才能適應(yīng)日益發(fā)展的課堂教學(xué)的需要,而信息資源的建設(shè)為這一發(fā)展與變化提供了直接的幫助與支撐。教師的教學(xué)科研任務(wù)日益加重,如何通過現(xiàn)代教育技術(shù),尤其是網(wǎng)絡(luò)技術(shù)、多媒體技術(shù)為教師提供更加豐富的信息資源,為教學(xué)科研提供更好的保障是信息資源建設(shè)與管理部門義不容辭的責(zé)任。
(三)以學(xué)生為主體,推進(jìn)信息資源的終端應(yīng)用培養(yǎng)好學(xué)生是任何一所學(xué)校的辦學(xué)目的所在,如果沒有學(xué)生的發(fā)展,也就失去了辦學(xué)的意義,高校信息資源的建設(shè)也不例外,應(yīng)以學(xué)生所需作為信息資源建設(shè)的目標(biāo)與要求。高校學(xué)生在學(xué)習(xí)過程中,除了通過教師的講授獲取知識外,絕大部分知識需要通過自學(xué)來獲取,信息資源的建設(shè)與管理除了滿足課堂教學(xué)的需要外,還必須滿足學(xué)生的課后自學(xué)的需要。在現(xiàn)代信息社會,如何將無序的資源進(jìn)行組織,使之有序化是信息資源建設(shè)的重要內(nèi)容,也是更好地為學(xué)生服務(wù)的根本方法。
(四)以促進(jìn)應(yīng)用為基礎(chǔ),完善信息資源保障體系建設(shè)任何信息資源建設(shè)的生命力在于應(yīng)用。高校的信息資源建設(shè)必須以教師教學(xué)科研與學(xué)生課堂學(xué)習(xí)和課后自習(xí)需要為目的,同時兼顧學(xué)校的思想政治工作、后勤保障與行政管理等需要,形成符合高校自身發(fā)展規(guī)律與實際應(yīng)用環(huán)境的信息資源保障體系,這樣才能發(fā)揮更大的效益。
二、高校信息資源建設(shè)與管理體系
要使信息資源從無序走向有序,在浩瀚的資源中快速地為特定用戶提供有針對性的資源,是高校信息資源建設(shè)與管理的重要內(nèi)容。
(一)根據(jù)學(xué)科特點及其相關(guān)性,建立完善的信息資源標(biāo)引體系高校圖書館進(jìn)行信息資源建設(shè)時,往往會按照圖書分類法進(jìn)行分類標(biāo)引,這種方法能較快地被高校師生所接受,但在其專屬性上存在分類過粗的問題,不能全面反映學(xué)科內(nèi)容。高校在進(jìn)行信息資源建設(shè)時,必須充分考慮到資源與學(xué)科之間的關(guān)系,充分利用自身優(yōu)勢,根據(jù)學(xué)科資源內(nèi)在的聯(lián)系,編制適合學(xué)科特點與規(guī)律的分類體系對信息資源進(jìn)行組織與標(biāo)引,使之成為各具特點的信息資源分類體系。在對信息資源進(jìn)行有效分類的同時,還必須依照標(biāo)題的主題詞抽取方法進(jìn)行標(biāo)引,通過計算機輔助標(biāo)引系統(tǒng),建立關(guān)鍵詞表,有效地提高信息資源檢索的檢準(zhǔn)率。
(二)根據(jù)教師授課與科研課題分布情況,設(shè)置樹狀的信息資源組織體系為了更好地為廣大教師服務(wù),為其備課和課堂教學(xué)提供資源保障,高校在進(jìn)行信息資源建設(shè)時,可以考慮按照學(xué)科—課程的形式設(shè)置樹狀架構(gòu)的信息資源組織體系,并根據(jù)教師的教學(xué)和科研需要,進(jìn)行定題的跟蹤服務(wù),即在學(xué)科—課程的基礎(chǔ)上,以專題(專欄)的方式,進(jìn)行定題跟蹤服務(wù)。
(三)根據(jù)學(xué)生的學(xué)習(xí)習(xí)慣,建立科學(xué)的信息資源與檢索體系學(xué)生在學(xué)習(xí)過程中,除了需要了解、掌握教師課堂教學(xué)活動中的各種信息外,還需要大量的課外信息作為補充。在信息資源建設(shè)過程中,必須要了解學(xué)生的學(xué)習(xí)習(xí)慣,以最便捷、最吸引人的方式,培養(yǎng)其學(xué)習(xí)興趣,提高其學(xué)習(xí)效率。
三、高校信息資源建設(shè)的分工與協(xié)作
高校信息資源建設(shè)不是一個部門一個單位所能完成,涉及高校各個部門、每個人員。在信息資源建設(shè)與管理部門所要承擔(dān)的職責(zé)中,有很大一部分是組織協(xié)調(diào)好各部門、各單位以及每個人員的工作,使各類信息資源都有所屬、有所用。(一)信息中心承擔(dān)信息資源的組織與協(xié)調(diào)工作信息中心作為高校的信息化建設(shè)的重要組織者與協(xié)調(diào)者,要承擔(dān)起信息資源建設(shè)與管理的首要責(zé)任,通過建立信息資源管理系統(tǒng),及時組織、各類信息。