網(wǎng)絡(luò)知識(shí)數(shù)字參考咨詢分析論文
時(shí)間:2022-06-23 07:56:00
導(dǎo)語(yǔ):網(wǎng)絡(luò)知識(shí)數(shù)字參考咨詢分析論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
【內(nèi)容提要】文章著重闡述了網(wǎng)絡(luò)知識(shí)挖掘產(chǎn)生的背景及其概念、技術(shù),探討了網(wǎng)絡(luò)知識(shí)挖掘在數(shù)字參考咨詢服務(wù)中的應(yīng)用。
【摘要題】信息需求與服務(wù)
【關(guān)鍵詞】數(shù)字參考咨詢/數(shù)據(jù)挖掘/網(wǎng)絡(luò)知識(shí)挖掘
【正文】
1網(wǎng)絡(luò)知識(shí)挖掘產(chǎn)生的背景及其概念、技術(shù)
對(duì)知識(shí)挖掘的設(shè)想始于20世紀(jì)80年代末。當(dāng)時(shí)出現(xiàn)了從源數(shù)據(jù)中發(fā)掘新信息模式及算法,被稱(chēng)為數(shù)據(jù)中的知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase,KDD)。這種想法的出現(xiàn)是由于此前的信息或知識(shí)數(shù)據(jù)庫(kù)存在著種種局限,限制了對(duì)數(shù)據(jù)庫(kù)中蘊(yùn)涵知識(shí)的有效利用[1]。知識(shí)發(fā)現(xiàn)被認(rèn)為是今后具有重要影響和應(yīng)用前景的關(guān)鍵技術(shù)。知識(shí)發(fā)現(xiàn)(knowledgediscovery)也稱(chēng)數(shù)據(jù)挖掘(datamining),源自人工智能的機(jī)器學(xué)習(xí)領(lǐng)域,是在一個(gè)已知狀態(tài)的數(shù)據(jù)集上,通過(guò)設(shè)定一定的學(xué)習(xí)算法,從數(shù)據(jù)中獲取所需的知識(shí)[2]。數(shù)據(jù)挖掘廣泛應(yīng)用于數(shù)據(jù)倉(cāng)庫(kù)和分布式數(shù)據(jù)庫(kù)中,根據(jù)數(shù)據(jù)間的相互關(guān)系進(jìn)行數(shù)據(jù)分析,提取潛在有用的信息和知識(shí),經(jīng)挖掘后被發(fā)現(xiàn)的知識(shí)可用于信息管理、查詢優(yōu)化、科學(xué)研究、決策支持、過(guò)程控制等?,F(xiàn)有的數(shù)據(jù)挖掘工具有:ModelQuestMiner、KnowledgeSeeker、BusinessMiner、AnserTree等幾十種。數(shù)據(jù)挖掘是網(wǎng)絡(luò)知識(shí)挖掘的基礎(chǔ)。網(wǎng)絡(luò)知識(shí)挖掘是指利用數(shù)據(jù)挖掘技術(shù),自動(dòng)地從由異構(gòu)數(shù)據(jù)組成的網(wǎng)絡(luò)文檔中發(fā)現(xiàn)和抽取知識(shí),從概念及相關(guān)因素的延伸比較上找出用戶需要的深層次知識(shí)的過(guò)程[3]。網(wǎng)絡(luò)知識(shí)挖掘可分為網(wǎng)絡(luò)內(nèi)容挖掘(WebContentMining)、網(wǎng)絡(luò)結(jié)構(gòu)挖掘(WebConstructMining)、網(wǎng)絡(luò)使用挖掘(WebUsageMining)。一般而言,網(wǎng)絡(luò)知識(shí)挖掘的發(fā)現(xiàn)技術(shù)主要包括以下幾個(gè)方面。
1.1路徑分析
可以用許多曲線圖解法來(lái)進(jìn)行路徑分析,一個(gè)曲線代表了Web頁(yè)面間或者其他事物之間的一些聯(lián)系。
1.2關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則用于發(fā)現(xiàn)數(shù)據(jù)項(xiàng)之間的聯(lián)系,在網(wǎng)絡(luò)挖掘中就是發(fā)現(xiàn)某一顧客的引用頁(yè)面和服務(wù)器上多種頁(yè)面之間的聯(lián)系。
1.3序列模式
應(yīng)用序列模式是為了發(fā)現(xiàn)一些交互模式,如在一時(shí)間段內(nèi)某一數(shù)據(jù)項(xiàng)后面跟著另一個(gè)數(shù)據(jù)項(xiàng)。在服務(wù)器日志文件中,記錄了一段時(shí)間內(nèi)客戶的訪問(wèn)信息,對(duì)Web服務(wù)器中訪問(wèn)日志的序列模型分析可以使用企業(yè)預(yù)測(cè)用戶訪問(wèn)模式,幫助廣告進(jìn)行目標(biāo)定位,發(fā)現(xiàn)在一個(gè)時(shí)間段內(nèi)訪問(wèn)某一文件的所有客戶的相同特征等。
1.4聚類(lèi)和分類(lèi)
根據(jù)一些數(shù)據(jù)項(xiàng)的共同特征來(lái)對(duì)數(shù)據(jù)庫(kù)進(jìn)行分類(lèi)。在網(wǎng)絡(luò)挖掘中,分類(lèi)技術(shù)可以基于用戶的一些人口統(tǒng)計(jì)信息和訪問(wèn)模式對(duì)訪問(wèn)某文檔的用戶進(jìn)行偏好描述。聚類(lèi)分析可以將有相似特征的用戶或者數(shù)據(jù)聚集在一起,聚類(lèi)Web日志的用戶信息和數(shù)據(jù)可用來(lái)制定未來(lái)市場(chǎng)營(yíng)銷(xiāo)策略[4]。
2網(wǎng)絡(luò)知識(shí)挖掘與數(shù)字參考咨詢知識(shí)庫(kù)的建立
數(shù)字參考咨詢的概念起源于20世紀(jì)80年代的美國(guó),早期的電子郵件咨詢服務(wù)起源于1984年的華盛頓大學(xué)健康科學(xué)圖書(shū)館和馬里蘭—巴爾迪摩大學(xué)健康圖書(shū)館[5]。在美國(guó),圖書(shū)館界對(duì)數(shù)字圖書(shū)館的發(fā)展存在兩種看法,其中一種把圖書(shū)館看作是一個(gè)在圖書(shū)館員的協(xié)助下為廣大用戶提供智能服務(wù)的透明的知識(shí)網(wǎng)絡(luò)。數(shù)字參考臺(tái)就是根據(jù)這種意見(jiàn)建立起來(lái)的對(duì)話式的智能服務(wù)系統(tǒng)[6]。數(shù)字參考咨詢是伴隨著數(shù)字圖書(shū)館的研究和實(shí)踐熱潮出現(xiàn)的又一大熱點(diǎn),也是網(wǎng)絡(luò)環(huán)境下圖書(shū)館參考咨詢服務(wù)的主流發(fā)展方向。利用網(wǎng)絡(luò)知識(shí)挖掘技術(shù),可以了解用戶訪問(wèn)圖書(shū)館的目的和趨勢(shì),了解用戶的興趣和需求,改進(jìn)服務(wù)質(zhì)量,變被動(dòng)服務(wù)為主動(dòng)服務(wù),提高數(shù)字參考咨詢服務(wù)的效率。
數(shù)字化信息資源是數(shù)字參考咨詢的物質(zhì)基礎(chǔ),它由各類(lèi)知識(shí)庫(kù)構(gòu)成。數(shù)字參考咨詢是從積累知識(shí)庫(kù)到進(jìn)行知識(shí)服務(wù),可以在面對(duì)面與用戶溝通中判斷用戶的實(shí)際需求,由此來(lái)加深知識(shí)服務(wù)層面的深度和廣度。知識(shí)庫(kù)的建設(shè)直接影響到數(shù)字參考咨詢服務(wù)??上攵?如果沒(méi)有知識(shí)庫(kù)或知識(shí)庫(kù)內(nèi)容非常少,僅憑咨詢員個(gè)人的知識(shí)經(jīng)驗(yàn)很難滿足不同用戶的各類(lèi)需求。網(wǎng)絡(luò)在提供豐富資源的同時(shí),也給查找和獲取有效信息帶來(lái)了難度。傳統(tǒng)的數(shù)據(jù)挖掘涉及的主要是結(jié)構(gòu)化及半結(jié)構(gòu)化的數(shù)據(jù)庫(kù),而網(wǎng)上的信息變化頻繁且具動(dòng)態(tài)性,是一個(gè)巨大而又復(fù)雜的異構(gòu)型數(shù)據(jù)庫(kù),對(duì)網(wǎng)上的信息進(jìn)行挖掘要比面向單個(gè)數(shù)據(jù)庫(kù)復(fù)雜得多。數(shù)字資源的多元性和分散性,使數(shù)字化信息的知識(shí)化挖掘和鏈接成為信息服務(wù)所面臨的前沿挑戰(zhàn)。因此,對(duì)數(shù)據(jù)的進(jìn)一步加工和內(nèi)容分析顯得越來(lái)越重要。在這樣的背景下,網(wǎng)絡(luò)知識(shí)挖掘的新技術(shù)應(yīng)運(yùn)而生。
網(wǎng)絡(luò)知識(shí)挖掘的類(lèi)型可分為對(duì)網(wǎng)絡(luò)知識(shí)的挖掘和對(duì)用戶知識(shí)的挖掘。對(duì)網(wǎng)絡(luò)知識(shí)的挖掘主要是指通過(guò)對(duì)網(wǎng)絡(luò)信息的定性定量的增值處理,找出信息分布的規(guī)律,發(fā)現(xiàn)信息內(nèi)在的關(guān)聯(lián)性,挖掘隱藏在網(wǎng)絡(luò)信息中的知識(shí)并形成模型。對(duì)用戶知識(shí)的挖掘是指對(duì)用戶訪問(wèn)網(wǎng)絡(luò)時(shí)的信息和用戶個(gè)人信息的挖掘。網(wǎng)站服務(wù)器會(huì)保留用戶的訪問(wèn)記錄,記錄關(guān)于用戶訪問(wèn)和交互的信息,對(duì)此進(jìn)行分析和挖掘,有助于理解用戶的信息活動(dòng),了解用戶的信息需求,從中得出用戶的訪問(wèn)模式和訪問(wèn)興趣,從而改進(jìn)網(wǎng)站的結(jié)構(gòu),也可以用于為用戶提供個(gè)性化的服務(wù)[7]。此類(lèi)知識(shí)庫(kù)建立方法在實(shí)際中的應(yīng)用如復(fù)旦大學(xué),復(fù)旦大學(xué)的實(shí)時(shí)咨詢提醒用戶如果在線咨詢員沒(méi)有空閑,可以參考圖書(shū)館FAQ中的一些常見(jiàn)問(wèn)題的解答;如果用戶的問(wèn)題仍未解決,不妨使用電子郵件咨詢服務(wù),或稍候使用實(shí)時(shí)在線咨詢服務(wù)。用戶所提的問(wèn)題及其相應(yīng)答復(fù)可能被收入復(fù)旦大學(xué)圖書(shū)館參考咨詢臺(tái)后臺(tái)知識(shí)庫(kù)中,在知識(shí)庫(kù)中用戶的所有個(gè)人信息都會(huì)被刪除,收入數(shù)據(jù)版權(quán)歸復(fù)旦大學(xué)圖書(shū)館所有[8]。
基于Internet建設(shè)起來(lái)的知識(shí)庫(kù),其質(zhì)量好壞直接影響數(shù)字參考咨詢。作為信息資源的知識(shí)庫(kù),要形成一定的規(guī)模且檢索便捷、內(nèi)容新穎,能夠不斷地更新,以保持?jǐn)?shù)據(jù)的準(zhǔn)確、全面和及時(shí)。如當(dāng)今世界上最大的圖書(shū)館網(wǎng)絡(luò)OCLC把互聯(lián)網(wǎng)上的信息經(jīng)過(guò)系統(tǒng)化的整理,通過(guò)主題詞即可檢索;且OCLC的WorldCat數(shù)據(jù)庫(kù)隨時(shí)更新,每年以200多萬(wàn)條記錄的速度增長(zhǎng)[9]。OCLC之所以始終保持在高新技術(shù)前列,是由于在研究開(kāi)發(fā)上的大量投資。OCLC平均每年投資研究與開(kāi)發(fā)項(xiàng)目達(dá)1000萬(wàn)美元以上,僅在2002-2003財(cái)政年度就投資1400萬(wàn)美元[10]。所以研究開(kāi)發(fā)先進(jìn)的知識(shí)挖掘、分析和提煉技術(shù),形成一個(gè)豐富的知識(shí)庫(kù)來(lái)滿足用戶的需求,提高用戶的滿意度,給用戶更好的服務(wù),是做好數(shù)字參考咨詢服務(wù)所必需的。
3網(wǎng)絡(luò)知識(shí)挖掘?yàn)閿?shù)字參考咨詢提供技術(shù)支撐
圖書(shū)館對(duì)新技術(shù)尤其是信息技術(shù)保持高度敏感。隨著電子技術(shù)、計(jì)算機(jī)技術(shù)和通信技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)在全球范圍得到迅速普及,同時(shí)多媒體技術(shù)、實(shí)時(shí)交互技術(shù)等與之配套的技術(shù)如雨后春筍般出現(xiàn),這為圖書(shū)館開(kāi)展數(shù)字參考咨詢服務(wù)提供了技術(shù)保障。經(jīng)過(guò)幾年的努力,圖書(shū)館的數(shù)字化建設(shè)與服務(wù)已具備了較好的技術(shù)和硬件基礎(chǔ),這也為開(kāi)展數(shù)字參考咨詢服務(wù)提供了強(qiáng)有力的技術(shù)支撐。
知識(shí)挖掘的技術(shù)基礎(chǔ)是統(tǒng)計(jì)學(xué)與人工智能。知識(shí)挖掘的主要特點(diǎn)是能對(duì)原有的數(shù)據(jù)進(jìn)行高度自動(dòng)分析、歸納推理,從中挖掘出潛在的模式,預(yù)測(cè)用戶的行為,幫助決策者調(diào)整策略,作出正確的決策。人工智能是以自動(dòng)機(jī)為手段,通過(guò)模擬人類(lèi)宏觀外顯的思維行為,從而高效率地解決現(xiàn)實(shí)世界問(wèn)題的科學(xué)和技術(shù)??梢钥闯?人工智能的目標(biāo)非常高,除需要復(fù)雜的算法外還需要特定的機(jī)器。但知識(shí)挖掘僅僅利用了人工智能中一些已經(jīng)成熟的算法和技術(shù),如人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeutralNetworks)、遺傳算法(GeneticAlgorithms)、決策樹(shù)(DecisionTrees)、規(guī)則推理(RuleInduction)(即通過(guò)統(tǒng)計(jì)學(xué)方法歸納提取有價(jià)值的if-then規(guī)則,如關(guān)聯(lián)規(guī)則挖掘)、模糊邏輯(FuzzyLogic)、CVSM等[11]。
數(shù)字參考咨詢服務(wù)無(wú)非是在保證提供符合用戶要求的同時(shí)縮短提供時(shí)間和提供個(gè)性化服務(wù)。數(shù)字參考咨詢服務(wù)的交流方式主要由解答式和交互式兩種。前者是比較初步而簡(jiǎn)單的服務(wù)方式,如FAQ、非實(shí)時(shí)的電子郵件、Web表單、BBS和MessageBoard(留言版)等;后者主要是指實(shí)時(shí)性的交互模式,如2002年7月,OCLC與美國(guó)國(guó)會(huì)圖書(shū)館協(xié)同研制開(kāi)發(fā)推出網(wǎng)上聯(lián)合數(shù)字參考咨詢服務(wù)QuestinPoint。但不管是哪一種,現(xiàn)在的提供方式雖然也在借鑒和應(yīng)用計(jì)算機(jī)的自動(dòng)處理,但智能化的程度有待提高。其中最主要的一點(diǎn)是要提高對(duì)提問(wèn)信息的分析正確度,如何從提問(wèn)信息中提取最相關(guān)的單詞、詞組,并對(duì)提取的單詞、詞組在已有知識(shí)庫(kù)中進(jìn)行準(zhǔn)確無(wú)誤匹配,這就用到詞表技術(shù)。目前,詞表技術(shù)研究的一個(gè)重要發(fā)展趨勢(shì)就是與網(wǎng)絡(luò)檢索這類(lèi)應(yīng)用系統(tǒng)的結(jié)合。通過(guò)概念空間詞表界面,用戶可以隨意輸入任何一個(gè)單詞或詞組,這時(shí)搜索界面會(huì)在一個(gè)顯示框中顯示按與用戶檢索詞相關(guān)程度排序的空間詞匯,用戶可以從中選擇合意的詞添加到搜索框中,從而檢索出用戶所需的信息,更提高檢索的精確度。其次是對(duì)檢索結(jié)果集的篩選和提煉問(wèn)題。網(wǎng)絡(luò)知識(shí)挖掘的目的是將用戶從浩如煙海、錯(cuò)綜復(fù)雜的網(wǎng)絡(luò)信息源中解放出來(lái),擺脫原始數(shù)據(jù)細(xì)節(jié),直接與數(shù)據(jù)所反映的知識(shí)打交道,使處理結(jié)果以可讀、精練、概括的形式呈現(xiàn)給用戶,使用戶能把主要精力真正用到分析本質(zhì)問(wèn)題、提高工作效率和資源利用率方面。網(wǎng)絡(luò)知識(shí)挖掘能夠真正支撐起數(shù)字參考咨詢服務(wù)系統(tǒng)的顯性知識(shí)與隱性知識(shí)全方位開(kāi)發(fā)策略。目前對(duì)檢索結(jié)果的篩選和提煉這個(gè)工作環(huán)節(jié)大部分是由人工完成的,雖然保證了質(zhì)量,但隨著以后工作量的日益增加,采取智能處理是必然趨勢(shì)。知識(shí)挖掘雖然仍處在發(fā)展的前期,還有很多研究難題,但我們?cè)诮ㄔO(shè)數(shù)字參考咨詢服務(wù)系統(tǒng)的時(shí)候,必須考慮對(duì)知識(shí)管理功能的開(kāi)發(fā),預(yù)先設(shè)計(jì)好底層數(shù)據(jù)標(biāo)準(zhǔn)和二次開(kāi)發(fā)接口等。
4網(wǎng)絡(luò)知識(shí)挖掘在數(shù)字參考咨詢個(gè)性化服務(wù)中的應(yīng)用
數(shù)字圖書(shū)館的內(nèi)涵不僅僅應(yīng)體現(xiàn)在其數(shù)字化資源的建設(shè)上,更應(yīng)體現(xiàn)在服務(wù)上。數(shù)字參考咨詢服務(wù)是數(shù)字圖書(shū)館建設(shè)的必然結(jié)果。數(shù)字參考咨詢的用戶需求不僅是簡(jiǎn)單的查詢,而且是需要深入內(nèi)容的信息處理技術(shù),希望擺脫表層信息的干擾,對(duì)網(wǎng)絡(luò)數(shù)據(jù)作更深層次的分析與挖掘。這就要求圖書(shū)館從紛繁復(fù)雜的信息資源中,以面向“個(gè)人”的方式來(lái)挖掘知識(shí),提取真正有用的信息。這是數(shù)字圖書(shū)館建設(shè)中要考慮的問(wèn)題之一,是做好數(shù)字參考咨詢的前期基礎(chǔ)。
個(gè)性化服務(wù)是指使用多種數(shù)據(jù)分析技術(shù),根據(jù)用戶興趣的信息向用戶及時(shí)、主動(dòng)地推薦用戶需要的且以往沒(méi)有獲得的知識(shí)資源信息,并能根據(jù)用戶對(duì)推薦內(nèi)容的反饋進(jìn)一步改進(jìn)推薦結(jié)果。個(gè)性化服務(wù)是一種高層次的智力技術(shù)活動(dòng),其重要的特點(diǎn)是知識(shí)增值與智能重組。網(wǎng)絡(luò)知識(shí)挖掘工作運(yùn)用最新的智能工具來(lái)挖掘蘊(yùn)藏于海量顯性信息中的隱性知識(shí),并形成專(zhuān)業(yè)知識(shí)庫(kù)和知識(shí)倉(cāng)庫(kù),將隱性知識(shí)顯性化并給予管理、利用,非常符合網(wǎng)絡(luò)用戶對(duì)個(gè)性化、隱性知識(shí)的需求。網(wǎng)絡(luò)知識(shí)挖掘在數(shù)字參考咨詢個(gè)性化服務(wù)中的應(yīng)用主要體現(xiàn)在以下兩個(gè)方面。
4.1收集與用戶有關(guān)的信息,建立用戶信息庫(kù)
通過(guò)各種方式收集用戶興趣,比如表單、跟蹤日志、系統(tǒng)導(dǎo)入等,從而建立用戶個(gè)性化的信息庫(kù)。
(1)填寫(xiě)表單。數(shù)字參考咨詢服務(wù)可以在主頁(yè)上提供個(gè)性化服務(wù)的注冊(cè)入口。在進(jìn)入頁(yè)面,設(shè)計(jì)一個(gè)表單,內(nèi)容包括用戶的背景信息,如用戶的學(xué)歷、年齡、職業(yè)、地域、要求等和用戶的特殊信息,如感興趣的專(zhuān)業(yè)、方向,想獲取的信息以及獲取方式和聯(lián)絡(luò)方式等。
(2)跟蹤日志。數(shù)字參考咨詢服務(wù)可以在用戶進(jìn)入圖書(shū)館網(wǎng)站開(kāi)始,對(duì)用戶的行為進(jìn)行跟蹤,產(chǎn)生日志文件,并將該日志文件并入用戶信息庫(kù)。對(duì)用戶的Web日志記錄進(jìn)行挖掘可以比較真實(shí)地反映其信息需求。從Web日志記錄中可以挖掘出關(guān)聯(lián)模式、序列模式和Web訪問(wèn)趨勢(shì)等,從而理解用戶的反映和動(dòng)機(jī)。
(3)系統(tǒng)導(dǎo)入。通過(guò)聯(lián)合圖書(shū)館方式將其它圖書(shū)館的用戶信息庫(kù)導(dǎo)入,也可以與其它網(wǎng)站合作,導(dǎo)入其用戶數(shù)據(jù)。
4.2利用知識(shí)挖掘技術(shù),分析用戶信息庫(kù)
為了開(kāi)展個(gè)性化服務(wù),必須了解用戶,了解用戶的信息需求,包括顯性需求和隱性需求,進(jìn)行以下分析。
(1)用戶分類(lèi)。通過(guò)對(duì)用戶的興趣、愛(ài)好、研究領(lǐng)域、知識(shí)結(jié)構(gòu)、利用圖書(shū)館的程度和對(duì)圖書(shū)館提供服務(wù)手段掌握的熟練程度等方面,將用戶進(jìn)行分類(lèi)。
(2)用戶行為分析。要將信息主動(dòng)推送給用戶,必須了解用戶的信息需求,它包括顯性需求和隱性需求。顯性需求是通過(guò)填問(wèn)答表的方式了解,做到這一點(diǎn)比較容易,關(guān)鍵是如何了解用戶的隱性需求。隱性需求主要是系統(tǒng)通過(guò)觀察用戶信息使用行為,比如用戶訪問(wèn)的頁(yè)面、訪問(wèn)次數(shù)、逗留時(shí)間、保存行為等,以此來(lái)準(zhǔn)確地獲取用戶的信息需要。要做到這一點(diǎn),必須完善相應(yīng)的人工智能方法和機(jī)器學(xué)習(xí)等技術(shù)。
(3)用戶反饋挖掘。用戶反饋挖掘是通過(guò)自動(dòng)聚類(lèi)技術(shù)將用戶相關(guān)反饋的結(jié)果聚類(lèi),形成某些層次以描述用戶信息需求,具體包括關(guān)聯(lián)聚類(lèi)、矩陣聚類(lèi)、標(biāo)量聚類(lèi),其目的是找出用戶感興趣的區(qū)域。為了提高服務(wù)質(zhì)量,要求用戶對(duì)所提供的信息作出反饋,并將用戶的反饋信息再次分析、調(diào)整。如廈門(mén)大學(xué)圖書(shū)館在主頁(yè)上列有問(wèn)題反饋類(lèi)目,包括留言討論、館長(zhǎng)信箱、致信webMaster、鼓浪聽(tīng)濤XMU-Library版。
(4)協(xié)同過(guò)濾。不考慮資源具有什么形式的具體內(nèi)容,僅通過(guò)收集到用戶對(duì)一些資源的評(píng)價(jià)(一般通過(guò)評(píng)級(jí)打分),比較用戶之間的興趣相似程度(距離),根據(jù)他與其它用戶之間興趣的相似程度(距離)和其它用戶對(duì)資源集合的評(píng)價(jià)進(jìn)行資源的推薦和共享[12]。
【參考文獻(xiàn)】
1李宏.知識(shí)管理與知識(shí)挖掘在情報(bào)研究工作中的實(shí)現(xiàn).情報(bào)理論與實(shí)踐,2003(3):199-201
2晏創(chuàng)業(yè),張玉峰.智能檢索中的網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)探索.中國(guó)圖書(shū)館學(xué)報(bào),2002(3):49-51
3侯雅木冉.網(wǎng)絡(luò)環(huán)境下的知識(shí)挖掘.情報(bào)科學(xué),2003(8):887-890
4史田華.論Internet知識(shí)挖掘.圖書(shū)情報(bào)知識(shí),2002(3):44-46
5RuthA.Hodges.AssessingDigitalReference,Libri,2002(52):157-168
6
7林豪慧.搜索引擎的智能檢索機(jī)制.圖書(shū)情報(bào)工作,2003(11):86-89
8復(fù)旦大學(xué)圖書(shū)館咨詢臺(tái)
9林曉霞.試論OCLC服務(wù)的系統(tǒng)性和資源的共享性.圖書(shū)館雜志,2000(6):39-42
10OCLCOnlineLibraryCenter,Inc.OCLCAnnualReport2002/2003
11李寧,李秉嚴(yán).知識(shí)挖掘技術(shù)及應(yīng)用.情報(bào)技術(shù),2003(6):34-36
12袁媛,杜小勇,馬文峰.數(shù)字圖書(shū)館信息服務(wù)平臺(tái)的建設(shè).現(xiàn)代圖書(shū)情報(bào)技術(shù),2003(5):8-10