網(wǎng)絡分類法構建研究論文
時間:2022-03-12 08:59:00
導語:網(wǎng)絡分類法構建研究論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
【內容提要】文章從建構方法、原則、語言、大綱、現(xiàn)代技術應用、具體問題等方面,概括了近年來網(wǎng)絡信息分類法構建的研究進展。
【摘要題】信息資源建設與管理
【關鍵詞】網(wǎng)絡信息分類法/網(wǎng)絡信息組織/分類法構建
【正文】
根據(jù)網(wǎng)絡信息和用戶檢索需求的特點,依據(jù)網(wǎng)絡環(huán)境構建科學、實用的網(wǎng)絡信息分類法,是信息資源組織管理研究的重點之一。本文主要以1999年—2005年的中國學術期刊網(wǎng)數(shù)據(jù)為信息源,從構建方法、原則、語言、大綱、信息技術應用等6個方面回顧了近年來網(wǎng)絡信息分類法構建的研究進展。
1構建網(wǎng)絡信息分類法的依據(jù)或方法
目前,網(wǎng)絡信息分類法主要是指網(wǎng)絡搜索引擎分類體系?;凇胺诸惞ぞ咄ǔJ歉鶕?jù)分類對象的特點和用戶需求,結合一定的技術環(huán)境建立的”認識,馬張華在《分類搜索引擎類目體系研究》一文中論述了分類搜索引擎類目結構的編制依據(jù):(1)從分類對象來看,網(wǎng)絡資源的特點是數(shù)量、種類多,動態(tài)性強,新興科學、商業(yè)、娛樂的資源數(shù)量較多,傳統(tǒng)知識門類的資源相對較少,要求有新的、適合處理對象的分類架構。(2)從用戶需求來看,網(wǎng)絡的使用對象涉及所有的終端用戶。(3)從技術環(huán)境來看,網(wǎng)絡信息分類體系應充分利用計算機操作環(huán)境與超文本技術,在體系構建、類目設置等方面發(fā)展不同于傳統(tǒng)分類法的技術特色。[1]
陳樹年提出建構網(wǎng)上知識分類體系的(基本結構)編制方法,即:①有一個涵蓋各知識領域、結構清晰、層次簡明、能滿足網(wǎng)上信息組織需要的分類體系;②采用等級結構展示知識的系統(tǒng)聯(lián)系,構成枝干分明的主題樹或脈絡清晰的知識地圖;③類目的排列和檢索結果的排列方法應采用對用戶最有用的排列次序;④分類體系的標記應適當保留。[2]石曉華等在分析了網(wǎng)絡信息分類法與傳統(tǒng)分類法的優(yōu)劣之后,首次提出了建構《中國網(wǎng)絡信息分類法》的建議,并列舉了具體的編制方法,即:①以傳統(tǒng)分類主題體系為基礎,建構多維的分類體系;②欄目因需而設,突出重點;③控制分級,減少欄目層次;④根據(jù)用戶確定欄目名稱的規(guī)范程度。[3]張琪玉則提出了一整套設計方針,即:①為不同類型的需求提供不同特性的分類體系;②在統(tǒng)一框架下設置分散獨立、各自完整的分類體系;③分類體系的類目設置不以網(wǎng)羅全部網(wǎng)絡信息資源為目標;④分類體系應具有開放性和可變性,并應有反映新穎信息的措施。他也設計了一個供普通用戶使用的分類體系框架。[4]王知津贊同石曉華的第①、②、③建議,認為可以借鑒傳統(tǒng)分類體系,構建《網(wǎng)絡信息分類法》,實現(xiàn)網(wǎng)絡信息分類法與主題詞表的結合,即分類主題一體化。實現(xiàn)分類主題一體化,需要做好三個方面的工作:①建立一個結構簡明的知識分類體系,通過對信息資源的系統(tǒng)分類,實現(xiàn)對網(wǎng)絡信息的宏觀控制;②建立一個智能化的控制詞表,實現(xiàn)作者語言與用戶檢索語言的控制和轉換;③建立分類體系與控制詞表的系統(tǒng)聯(lián)系,即將標引語言納入分類體系,這樣既可以用自然語言直接檢索,也可以在任何類下進行語詞檢索,從而較好實現(xiàn)分類與主題的兼容。[5]董琳提出的思路是設計一個融知識分類、行業(yè)分類、網(wǎng)站信息分類于一體的綜合性中文網(wǎng)站分類體系。[6]該體系把一級大類分為5大模塊:較豐富信息的模塊、高查詢率模塊、學科專業(yè)模塊、查詢入口模塊、綜合網(wǎng)站模塊。常設20個一級類目,把主題作為主要聚類標準,學科和專業(yè)作為輔助聚類標準。
另外,陸寶益提出編制的具體步驟,即建立專門機構,配備專業(yè)人員;開展深入調研,制定可行計劃;廣泛征求意見,不斷修改完善。[7]其他學者,如陳代春、趙培云、劉穎、許磊等也從不同角度論述了如何構建統(tǒng)一的網(wǎng)絡信息分類法的問題。
2網(wǎng)絡信息分類法構建的原則
構建新的網(wǎng)絡信息分類體系,需要吸收現(xiàn)有搜索引擎分類體系優(yōu)勢,借鑒傳統(tǒng)分類法的部分長處,并遵循基本的設計指導原則。有的學者[8]認為,強調類表的科學性和專業(yè)性,而忽略了最終用戶——信息需求者的利益,是傳統(tǒng)文獻分類法無法適應網(wǎng)絡信息分類的基本原因之一,所以建立中文網(wǎng)絡信息分類體系應以實用性為主。持相同觀點的學者,如,史學斌提出“實用性、自然性、系統(tǒng)性和技術性、針對性”原則[9]。鄭慶勝指出“實用性、全面性、規(guī)律性、統(tǒng)一性和特殊性”原則[10]等。
持相反觀點的學者認為,首要的原則是科學性原則。吳丹認為,與傳統(tǒng)分類法一樣,網(wǎng)絡信息分類也必須具備科學性原則,分類體系仍必須以科學的知識分類為基礎,即科學性原則、易用性原則、針對性原則、動態(tài)性原則[11]。其他學者,如陸寶益提出“科學性、自然性、實用性、同一性、通用性、兼容性、發(fā)展性”原則[12]、朱蓓玲提出“科學性、實用性、易用性、自然性、針對性、快捷性、系統(tǒng)技術性”原則[13]。敬卿、吳靜提出的“科學性、實用性、易用性、自然性、通用性”原則[14]。鄧香蓮提出的“科學性、簡潔性、直接性、實用性、動態(tài)性、自然性”原則[15]也應歸屬此類。
關于網(wǎng)絡信息分類體系的原則,研究者智者見智,較多學者都提到了應遵循“科學性、實用性、自然性”原則。主要分歧是強調科學性優(yōu)先還是實用性優(yōu)先。筆者認為,網(wǎng)絡信息分類法要適應組織網(wǎng)絡信息動態(tài)變化的需要,滿足用戶復雜的信息查詢需求,對于綜合性、大眾性的中文網(wǎng)絡信息分類體系,必須以實用性原則為主,兼顧科學性的原則。
3網(wǎng)絡信息分類法構建的語言
從實踐來看,傳統(tǒng)的文獻分類法使用的是典型的人工語言,而網(wǎng)絡信息分類法使用的主要是自然語言。因為人工語言嚴格的規(guī)范性使用戶喪失了檢索中的自主性和能動性,背離了以人為本的原則,自然語言是檢索語言發(fā)展的必然。[16]張琪玉教授則指出由于自然語言有其固有的缺陷,網(wǎng)絡信息檢索不可能僅僅使用自然語言,也必須使用人工語言。情報檢索用語發(fā)展的大趨勢,是情報檢索語言的自然語言化和自然語言的情報檢索語言化,是兩者的初級結合到完全融合的過程。[17]所以有的學者認為需要對網(wǎng)絡受控語言進行適合于網(wǎng)民大眾習慣用語的改造,提出了“受控語言網(wǎng)民化”的思想。[18]陳晶也指出:“改進受控語言的易用化是網(wǎng)絡環(huán)境下的大勢所趨,而對自然語言進行必要的控制也是網(wǎng)絡環(huán)境下勢在必行的,兩者的相互滲透、有機結合是情報檢索語言發(fā)展的大趨勢?!盵19]
有的學者認為分類主題一體化語言,實質是受控語言內部的一體化,它不能適應網(wǎng)絡檢索的發(fā)展,應當建立更適合于網(wǎng)絡信息檢索的自然語言與受控語言結合的一體化語言。[20]有的學者通過分析受控語言和自然語言各自在網(wǎng)絡中的應用,分析其優(yōu)缺點,指出無論受控語言還是自然語言都有各自獨特的優(yōu)點和缺陷,不能彼此取代,可以相互補充。而“它們在網(wǎng)絡中的應用研究也表明兩者之間呈現(xiàn)出明顯的相互交織兼容的趨勢”。[21]
筆者認為,任何一種語言都有長處和短處,都不能完全滿足網(wǎng)絡用戶多樣化需求,分類語言和主題語言相結合、自然語言和人工語言相結合才是建構網(wǎng)絡信息分類法的發(fā)展趨勢。
4網(wǎng)絡信息分類法的大綱設計
對網(wǎng)絡信息分類法進行深入研究并提出大綱或框架的代表作有文獻[22]、[23]、[24]。陳樹年闡述了構建網(wǎng)上分類體系的原則與技術后,提出了一個適用于一般用戶的綜合性中文搜索引擎的信息分類大綱,該大綱包括22個大類,即哲學與宗教、人文與社會科學、社會文化、文學與藝術、教育與人才、體育與健身、休閑與生活娛樂、旅游與服務業(yè)、醫(yī)學與健康、經(jīng)濟與金融、政治、法律、軍事、歷史與地理、自然科學、農(nóng)業(yè)科學、工程技術、計算機與網(wǎng)絡、新聞與媒體、圖書館與參考資料、國家與地區(qū)、綜合網(wǎng)站。并指出以學術和技術為主的搜索引擎、專業(yè)搜索引擎最好以權威分類法(或其中的某些類)為基礎,經(jīng)過一定的改造后用于網(wǎng)上信息的組織和檢索,因為其科學的體系和嚴密的結構是非專業(yè)人員所不能獨立完成的。[22]吳丹采取學科分類與事物分類兼顧的方式,也設計了一個包含有18個大類和若干二級類目的網(wǎng)絡信息分類體系設計方案。18個大類,即政治法律與軍事、新聞與媒體、商業(yè)與經(jīng)濟、自然科學、農(nóng)業(yè)與工程技術、計算機與網(wǎng)絡、教育、哲學與宗教、人文社會科學、文化藝術、歷史與地理、國家與地區(qū)、旅游與交通、醫(yī)學與健康、生活服務、體育與健身、娛樂休閑、圖書館與參考資料。[23]許培揚提出了中文網(wǎng)絡信息分類法應由簡表、主表、索引和使用指南四部分組成。簡表一般由1-4級類目構成,主表由全部類目構成。索引包括:①本表與其他分類體系的對應,用于不同分類體系的轉換;②英譯名稱索引,從英查漢或從漢查英。使用指南是分類體系的詳細說明。[24]
5現(xiàn)代技術在網(wǎng)絡信息分類法構建中的應用
由于網(wǎng)絡信息分類法必須能適應網(wǎng)絡技術環(huán)境,這就要求在編制過程中適當采用許多現(xiàn)代信息技術,如自動分類技術、人工智能技術、網(wǎng)格技術等等,以適應網(wǎng)絡技術環(huán)境的發(fā)展特點。馬張華專文闡述了超文本技術在網(wǎng)絡信息分類法編制中的應用。[25]他指出:超文本技術可以改進主題之間多維關系的揭示;可以從多個角度組織信息資源;可以進行輪排,亦即多表列類;可以設置鏡像類目,根據(jù)需要對某些重點類目或熱點類目突出反映;可以動態(tài)設置類目和動態(tài)揭示類目之間的關系,根據(jù)需要及時增添類目或刪改類目;可用于聯(lián)結不同的檢索系統(tǒng),增加檢索入口;可以聯(lián)結分類體系與相應的說明文字與規(guī)則系統(tǒng)。
陳旭論述了分面分類在網(wǎng)絡信息分類法編制中的應用。[26]文章首先論述了在編制網(wǎng)絡信息分類法時,可根據(jù)需要利用仿分技術編制各種類型的通用復分表、專用復分表及規(guī)定必要的仿分。其次論述了分面敘詞表的應用。最后論述了分面分類在可視化檢索中的應用。即在檢索界面上設置主題分面、書目形式分面、時間分面和地域分面,然后再按等級列舉的方式分別展開,既便于類表的修訂與維護,又便于用戶檢索更為專指的信息。
周淑云在《分類主題一體化構建網(wǎng)絡信息分類體系》[27]一文中指出,理想的網(wǎng)絡分類法應是分類法和主題法的結合使用,理想的模式是以“分類一主題”的方式對知識進行組織,形成一種兼具分類、主題兩種標引和查找功能的新型檢索語言,從而為不同層次和不同需求的用戶分別提供不同的信息查詢功能。分類主題一體化的網(wǎng)絡分類體系既突破了傳統(tǒng)分類法層層劃分、層層隸屬的等級結構又克服了主題法系統(tǒng)性差,將同類信息分類的特點。對此問題進行論述的還有郭麗芳、梅伯平、蘇瑞竹等。
6構建中微觀層面的具體問題
對網(wǎng)絡信息分類法編制的一些具體問題,許多學者都予以了詳細的探討。
陳樹年在《網(wǎng)絡信息分類法研究》中研究了聚類標準、大類設置、展開層次、類目種類、類目名稱、多分類體系、分類標準與使用次序、類目設置的均衡性和規(guī)律性、重點類目、交叉關系的處理、類目的排列、類目的注釋和說明、用戶界面的設計等,并給出了相應的改進意見。[28]他認為,關于聚類標準,綜合性網(wǎng)絡信息分類法聚類的主要標準應當是“主題和專題”,專業(yè)搜索引擎可以學科或專業(yè)為主要聚類標準,或結合主題聚類運用;關于大類的設置數(shù)量通常以10-20個為宜;關于類目的名稱要做到準確、通用和精練;關于類目種類包括“子類”與“網(wǎng)站”兩種,“在每一類下,把內容寬泛,各個下位類不能容納的信息歸納為‘綜合網(wǎng)站’集中收錄是網(wǎng)絡分婁法實用的作法”。
其它方面,人們觀點大致雷同。如,關于分類體系展開層次,陳樹年提出基本應控制在3-6級之間;趙培云認為根據(jù)目前網(wǎng)絡信息的實際情況和用戶瀏覽查詢心理,綜合性網(wǎng)絡信息分類標準,類目應控制在三、四層為宜,專業(yè)搜索引擎和網(wǎng)站可適當延伸。[29]張琪玉提出類目細分應控制在五級左右。[30]
總之,由于網(wǎng)絡信息、網(wǎng)絡信息用戶、網(wǎng)絡信息技術環(huán)境等特點,這就決定了網(wǎng)絡信息分類法的編制原則和技術方法,有別于傳統(tǒng)分類法的編制原則和技術方法,但是傳統(tǒng)文獻分類法和現(xiàn)有網(wǎng)絡信息分類體系的成功經(jīng)驗可以給網(wǎng)絡信息分類法提供有益的借鑒。我們建議,應當由國家信息產(chǎn)業(yè)部牽頭,組織圖書情報界專家、計算機專家、網(wǎng)絡公司等相關專家,廣泛征求意見,盡早編制出一部用戶滿意、質量較高的網(wǎng)絡信息分類法。
【參考文獻】
[1]馬張華.分類搜索引擎類目體系研究.圖書情報工作,2001(2):36-40
[2][22]陳樹年.搜索引擎及網(wǎng)絡信息資源的分類組織.圖書情報工作,2000(4):31-37
[3]石曉華,王春芳。網(wǎng)絡信息分類與傳統(tǒng)分類法的優(yōu)劣分析——兼談構建《中國網(wǎng)絡信息分類法》.圖書館理論與實踐,2001(1):43-45
[4][30]張琪玉.網(wǎng)絡信息檢索工具的分類體系.江蘇圖書館學報,2002(4):7-11
[5]王知津,肖洪.網(wǎng)絡信息組織對傳統(tǒng)信息組織的借鑒.圖書館工作與研究,2003(4):2-7
[6]董琳.網(wǎng)絡信息分類組織的發(fā)展趨勢與標準化.圖書情報知識,2004(2):65-67
[7][12]陸寶益.論創(chuàng)建我國統(tǒng)一的網(wǎng)絡信息分類法.中國圖書館學報,2004(6):44-47
[8]千忠紅.網(wǎng)絡信息環(huán)境下的傳統(tǒng)分類法.圖書情報工作,1999(2):37-39
[9]史學斌.網(wǎng)絡信息分類體系.圖書館,2002(1):33-35,20
[10]鄭慶勝,易曉陽.從新浪等網(wǎng)站看網(wǎng)絡信息分類體系的建立.圖書館建設,2003(1):69-71
[11][23]吳丹.網(wǎng)絡信息分類體系設計.圖書情報知識,2002(5):37-39
[13]朱蓓玲.淺析構建網(wǎng)絡信息分類體系.情報雜志,2004(8):110-111,114
[14]敬卿,吳靜.網(wǎng)絡分類目錄規(guī)范化初探.圖書館,2002(1):49-50
[15]鄧香蓮.文獻信息分類與網(wǎng)絡信息分類之比較研究.情報資料工作,2002(6):43-45
[16]粟慧.以人為本的必然:人工檢索語言向自然語言的轉變.圖書館,2000(2):9-10
[17]張琪玉.網(wǎng)絡信息檢索用語言的發(fā)展趨勢.圖書館雜志,2001(3):5-7
[18]梁樹柏,高夕果.受控語言網(wǎng)民化的思考.情報雜志,2002(8):69-71
[19]陳晶.論網(wǎng)絡環(huán)境下情報檢索語言的發(fā)展.情報雜志,2002(6):54-55
[20]呂娟,袁相琴.論第四種情報檢索語言系統(tǒng).中國圖書館學報,2002(1):87-92
[21]焦玉英,李法運.網(wǎng)絡環(huán)境下信息檢索語言的優(yōu)化研究.情報學報,2003(3):291-296
[24]許培揚,張玢.網(wǎng)絡信息分類標準研究進展.醫(yī)學情報工作,2002(6):324-326
[25]馬張華,李玲.超文本技術在分類法編制中的應用.大學圖書館學報,2001(1):60-62,66
[26]陳旭.分面分類在網(wǎng)絡資源組織中的應用.圖書情報工作,2002(1):59-61
[27]周淑云.分類主題一體化構建網(wǎng)絡信息分類體系.現(xiàn)代情報,2003(4):113-114
[28]陳樹年.網(wǎng)絡信息分類法研究.現(xiàn)代圖書情報技術,2002(3):54-57
[29]趙培云.如何構建統(tǒng)一的網(wǎng)絡信息分類標準.河南圖書館學刊,2004,24(2):64-65