本文作者: 史卫国, 饶艳
织史卫国(武汉业大学图书馆武汉430070)饶艳(武汉大学大众传播与知识信息管理学院武汉430072)提要数字图书馆是当前图书情报学界的一个热门话题。
怎样管理大量的信息资源是建设数字图书馆时需要解决的基础性技术热血传奇问题,就此,文章讨论了包括分类、缟目、引文分析和社套网络分析等解决信息管理问题的几种方法。关键词数字图书馆信息管理数字图书馆理论和技术自90年代初以来已成为国际图书馆学情报学界的一个研究课题,也是美国、日本、英国等发达国家先进图书馆高新技术应用的一个新领域。在我国,由国家计划与发展委员会立项、北京图书馆承担的“中国试验性数字图书馆”项目已于1997年启动,并已取得阶段性进展。但是,由于数字图书馆馆藏中数字化文献类型与格式的复杂多样性,以及用户所期待的交互式电子化网络服务,目前尚有许多关键技术需要进行进一步的研究与探讨。其中,数字图书馆中知识信息的组织技术是最为基础、也最为关键的一个方面。本文从这个方面人手,结合国内外最新研究成果与进展,谈一些自己的看法与观点。l数字图书馆的概念1.1数字图书馆的起源与发展数字图书馆的思想最早起源于70年代。人们设想着能够将所有的信息都存储在计算机里,可以在任何时候、任何地方检索所需的信息。到目前为止,数字图书馆的发展经历了三个阶段:(1)图书馆自动化阶段。利用计算机来实现图书馆的自动化管理,如计算机采访、编目、流通等。
70年代末到90年代初这一段时间,是图书馆自动化从产生、发展到完善的时期。(2)电子图书馆阶段。是一种基于现有局域网络,实现电子信四川图书馆学报息资源共享的图书馆模型。
(3)数字图书馆阶段。随着国际互联网的普及和信息高速公路建设的兴起,不少国家开始纷纷着手研究数字图书馆。
但由于数字图书馆无论在理论和技术还是在实际应用上都处于发展阶段,其定义还很不明确,而且常常与电子图书馆、虚拟图书馆等混在一起作为同义词使用。1.2数字图书馆的定义目前,由于人们对数字图书馆的构成和功能认识的不同,对数字图书馆的界定也存在很大差异,主要可以分为以下几种观点:1.2.1认为数字图书馆就是计算机化的、网络化的图书馆系统或信息系统。如弗兰克唐(mnku%)认为数字图书馆“是一种基于计算机网络,特别是基于信息高速公路的多媒体信息管理系统”新开传奇。1.2.2认为数字图书馆是一种馆藏有别于传统图书馆的新型图书馆。w-uimsa如dv认为:“数字图书馆相当于一所收藏了相当于所有或大部分印刷或缩微馆藏而可用计算机处理的图书馆。该等资料用以辅助或补充为主流的印刷或缩微形式资料。1.2.3认为数字图书馆不是一个机构,而是一种抽象的概念或信息服务思想。如美国密执安大学的研究人员给出的定义:一个“数字图书馆是若干个联合机构的总称,它使人们能够智能地、实实在在这网络游戏这一点确实不错地存取全球网43络上以多媒体数字格式存在的、为数巨大且仍在不断增多的信息”。1.3数字图书馆的基本要素针对以上定义,我们可以得出一个结论。虽然在目前的情况下给数字图书馆下一个确切的定义嘶十分困难,但可以整理出数字图书馆的一些基本要素,包括有:(1)数字化的馆藏。数字化的馆藏构成了数字图书馆的基本内容,包括存储在任何介质上的数字化数据以及信息资源,易于计算机处理。(2)先进的信息存储与检索系统。包括对各种信息资源进行选择、收集、保存和提供。从这个意义上来说,数字图书馆是现有各种信息机构的一种延伸、增强和集成。(3)便捷的电子服务。数字图书馆需要把用户、群体或社会与馆藏以一种高效且令人满意的方式连接起来,这就涉及到了数字图书馆的信息资源的组织技术以及其检索、传输、操纵和管理等一系列问题。2数字图书馆中信息资源的特点2.1数字化文献类型的多样性数字化馆藏不仅仅是书目信息或指向其他资源的线索,它还包括各种形式的联机资料,如期刊论文、图书在网游中、公式、数字集合、财经记录或医疗记录、新闻组档案、电子函件信息、音频夹片和图象等。此外,复杂的交互式数字化文献也源源不断地涌现出来。.aepcke还提出了“信息混合物”(h血mmioncom—pounds)的概念,即“从以前检索的信息和新近获得的信息中构建的新人工信息制品”。2.2格式的复杂性数字图书馆的内容包括数据、描述数据各个方面的元数据(如著者宦4造者、主题、所有权、复制权或图象的颗粒等)以及由与其他数据或元数据(数字图书馆内外的)之链接或关系组成的元数据。其不同的新开传奇表达方式和编码结构将会导致描述和组织标准与机制等的差异。2.3信息量的庞大性数字图书馆不仅包括传统图书馆的大量印刷型和缩微文献信息44资源,还包括极其丰富的互联网联机信息资源。相对互联网而言,数字图书馆是一个经结构化了的,加以标引和组织过的巨大信患库。2.4信息组织的易检索性便捷的服务足数字图书馆构成的基本要素之一。其基本功能就是支持特定用户们的信息需求和信息使用。
这就必然要求数字图书馆的构建者们在组织与标引知识信息时做到有序化,方便用户的检索与利用,能够符合人们的真实信息需求以及人们创建、查询和使用信息资源的习惯。3数字图书馆中信息组织的方法3.1分类方法英国的“网络应用中的信息编目与检索”项目小组在其报告书的开篇指出,“任何无墙图书馆如果歙变成现实,首先必须解决的问题就是弄清楚用户怎样找到适合自己需求的资源与服务。目前的答案看来似乎是,将新的软件技术与业已建立的图书馆方法和实践紧密结合起来”。传统图书馆中最有效的信息组织方法就是对文献信息的分类与编且。
90年代中期以后,一些试验性的网络资源分类编月计划陆续启动,并己取得阶段性成果,对数字图书馆中信息的组织方法起到了很好的借鉴作用。
3.1.1自动分类自动分类也称为机器分类,使用机读分类表,通过语义分析和概念分析等手段,自动发现和标引各种文献及网络信息。由于数字图书馆信息规模如此之大,完全依赖手工分类与标引是不可能的,所以尤其需要在自动化标引与组织方面进行更多的研究。目前,国际上对自动分类的研究主要着重于对因特网资源的自动分类和标引。
北欧的ws万维网项目就是这样一个自动分类的实验项目,由瑞典伦德大学图书馆和丹麦国立技术图书馆台作进行。ws是提供存取网络数据库的一个通用界面。北欧项目试图通过使用uc词汇和符号系统来提供对ws数据库的统一检索主题。叙词字段、2001年第2期(总第120期)。
本文《数字图书馆的信息组织》 --- 作者: 史卫国, 饶艳