信息检索相关在职毕业论文范文 跟基于信息检索的藏文文献计算机编目有关自考毕业论文范文

本论文主要论述了信息检索论文范文相关的参考文献,对您的论文写作有参考作用。

基于信息检索的藏文文献计算机编目

王丽英 次仁普赤

(西藏大学图书馆,西藏拉萨850000)

[摘 要]运用信息检索相关专业知识及《中国文献编目规则》,结合实际编目工作经验,分析藏文文献计算机编目中存在的问题.在探讨CNMARC格式下民族文献具体编目方式、字段特殊处理等问题的同时,指出藏文文献编目工作的未来发展趋势.

[关键词]信息检索藏文文献文献编目CNMARC格式

[分类号]G254

信息检索是指将信息按照一定的方式组织和存储起来,并根据信息用户的需求查找出相关信息的过程.[1]它包含信息存储和信息查找两个过程,这两个过程是互为表里、相互依存的辩证关系.利用图书馆集成管理系统存储和查询馆藏文献资源已是图书馆实现馆藏资源流通的重要途径,图书编目员利用图书馆集成管理系统将知识门类繁多、浩如烟海的馆藏文献用科学的组织方法,将每种文献分门别类地加以著录、分类、主题标引,形成信息全面、内容准确、编排有序、界面清晰的机读目录,以供读者在书目查询系统中根据不同检索点查找所需馆藏图书,实现对馆藏纸质图书的借阅.图书编目是否标准规范,直接影响着读者对馆藏文献的检索效率和检索结果.

1 藏文文献数字化进程及编目存在的主要问题

随着计算机和网络技术在图书馆各项工作中广泛应用,图书馆的文献信息资源建设已由过去的纸质资源建设发展成为纸质资源和数字资源同时并存的状态.藏文文献是中华民族文化宝库中的一朵奇葩,它内容丰富,涉及面广,具有较高的历史文化研究价值和阅读欣赏价值,吸引着大批藏学爱好者的广泛关注.近年来,藏学研究者热衷于藏文文献数字化研究,以期将藏学研究事业推向现代化发展之路.对藏文文献资料进行数字化加工已成为西藏地区信息资源数字化、信息化发展研究的热点,虽卓有成效,但多集中于对藏文期刊、藏文报纸进行加工,且数据库建设不统一,内容重复,资料不全,数量有限,关于信息资源共建共享理念还处在倡导阶段,并没有实现真正意义上的共建共享.

西藏高校图书馆是为西藏地区高等学校教学和科研服务的机构,在馆藏资源建设方面既要注重适应学校的学科发展,合理配置与专业学科相对应的资源,同时,又担负着收集、整理、开发、宣传地方文献的重要任务.西藏大学图书馆把每年全国正式出版发行和西藏地区自行刊印的藏文文献作为具有地域特色的馆藏,已收集藏文图书几万余册,藏文期刊几百种,藏文古籍数千函,但是图书馆所使用的图书馆金盘集成管理系统(简称GDLIS)在支持藏文字输入的技术还不成熟,GDLIS在用藏文进行编目时,由于系统不兼容,易出现乱码现象,因此不能直接用藏文对藏文文献进行计算机编目.此外,现阶段,我国除制定和颁布了蒙古文字文献的编目规则,其他少数民族文字文献都没有相应的编目规则.[2]也就是说,到目前为止,国家还没有对藏文文献编目的科学指导规则,导致各馆藏文文献计算机编目的标准不统一,标引不规范.书目集成管理系统不支持藏文著录,制约了藏文文献计算机编目进程;各馆藏文文献的编目工作各自为阵,不利于文献的广泛利用.

2 藏文文献计算机编目应遵循的原则

实现藏文文献在图书馆集成管理系统中进行科学编目,一直是西藏地区图书馆纸质文献资源数字化建设工作中被高度关注的问题.目前,各馆都把藏文文献列入中文图书的范畴,按中文图书的管理流程对藏文图书进行采访、登记、典藏.标引、著录的标准依照普通中文图书的编目规则执行,机读目录采用CNMARC格式,整个编目体系都是遵照中文文献著录国家标准体系.这种方法简化了对藏文图书进行计算机管理出现的冗杂现象,一定程度上能够实现藏文文献资源在图书馆集成管理系统下的信息存储,基本满足了读者对文献的检索和借阅需求.

对藏文文献在CNMARC格式下做有序化的编目是为方便读者进行文献检索,首先,应该遵循客观著录的原则.客观著录是文献编目工作共同遵循的原则,无论编目何种类型何种文字的文献都要保持客观准确地揭示文献的各项信息,真实体现文献的外部特征和内容特征,才能确保读者利用目录查找到所需图书.其次,遵循实用性著录原则.图书馆服务职能就是为读者找书,为书找读者,图书馆的编目工作也不例外,编目需充分考虑为读者提供尽量多的具有检索意义的检索点.第三,遵循灵活性著录原则.根据读者的检索习惯、图书自身的特殊性以及编目环境等条件变化,编目人员的编目理念和编目方法也要随之与时俱进.藏文文献编目遵循国家标准文献著录体系下的编目规则,同时,个别字段需要根据实际情况做适当调整.

3 藏文文献计算机编目CNMARC 格式字段设置处理

计算机编目工作就是遵照《中国文献编目规则》(简称规则)对文献信息的形式特征逐个字段进行著录,并通过文献所反映的内容依据主题词表、《中国图书馆分类法》等进行文献分类、标引,最后形成款目,供读者按特定需求检索文献.

图书编目是读者进入馆藏进行信息检索的重要纽带.编目工作的最终目的就是将无序的文献信息有序化,帮助读者在浩如烟海的文献信息资源库中能够快速检索到所需文献.藏文文献计算机编目为规避图书馆集成管理系统的某些技术限制,简化编目、统计、检索、借阅等各项操作程序,著录体系归属于中文文献著录国家标准体系,依据《规则》,只在CNMARC格式编码信息块相关字段做语种标识.如分配给本记录号的控制号001资料类型代码第一位不再是普通图书代码0,应该改为民族代码5;地址目次区的101字段子字段$a正文语种,藏文文献正文语种应为藏语,即代码为TIB,根据编目所使用的文字添加$c子字段,如编目所用语为汉语,即代码为CN;关于102字段子字段$b著录出版社所在地代码,与210字段的$a对应,如我国地区代码表中北京代码11,西藏自治区代码为54.这些可在CNMARC格式字段编辑设置中固定下来.

4 藏文文献编目创新及CNMARC 格式下数据字段区字段特殊处理

藏文文献出版时都依照国家的要求提供了图书在版编目(CIP)数据,CIP数据比较简单,只能作为编目人员在对藏文文献做原始编目时的参考,完全照着著录则不仅影响编目质量,更影响读者借阅图书时的检索效率和结果.编目人员着重描述文献及内容特征主要目的就是为了帮助读者发现、了解、获取所需文献.基于满足读者馆藏信息检索的多层次需求、查全率和查准率考虑,笔者提出3种藏文文献编目方式,一种是用汉文著录;另一种是用藏文著录;第三种是用藏汉两种文字混合著录.

4.1 用汉文对藏文文献进行著录

目前,西藏地区大部分图书馆使用的集成管理系统对藏文信息处理技术都不成熟,导致藏文文献编目无法实现藏文编目.如,西藏大学、西藏民族大学等图书馆在藏文文献编目时仍然采用汉文著录.西藏大学图书馆用GDLIS中对藏文文献编目时在字段的选用、著录项目的设置、各著录项目的著录规则、著录格式等基本与中文普通图书的保持一致,只在一些主要字段强化了图书的正文语种是藏文的信息,如题名项200字段的子字段$a后加【藏文】;在字段300中再做附注说明:本书是藏文图书;字段304的子字段$a著录:题名页有藏语题名;字段330著录需要编目人员了解所著图书的内容,概括提炼成汉文摘 要;字段600分类号前加M与数据库的中文图书区别.用汉文对藏文文献编目的方法比较简单,容易掌握,避开了图书馆集成管理系统不支持藏文的技术问题,也比较适应大部分读者的读写习惯.缺点是由于两种语言互译可能会造成著录的书写内容与读者检索时所提供的信息有出入,读者在进行信息检索时一般都会把文化信息较集中的题名、责任者名、主题词等作为检索词,藏文是拼音文字,有些词的翻译是直接音译而成,同音不同字的情况频现,这会给读者在检索时造成一定的麻烦.

数据字段区主要字段特殊处理的著录形式如下:

2001#$a藏族历代书信作品选注【藏文】$b专著$f东主才编著

300##$a本书是藏文图书

304##$a题名页有藏语题名

6901#MI26$v5

4.2 用藏文对藏文文献进行著录

随着图书馆集成管理系统的不断升级和完善,部分图书馆的集成系统已解决了不兼容藏文的技术问题.据了解,西藏图书馆使用的ILAS系统已实现了用藏文编目.用藏文文字做原始编目对编目人员的要求较高,编目人员不仅要有较高的藏文水平,还得具有一定的图书编目专业知识.用藏文对藏文图书进行CNMARC格式原始编目,按照原著文字对文献进行客观标引,提高了文献的查准率.

数据字段区基本字段藏文著录形式如下例:

4.3 用藏、汉双语混合对藏文文献进行著录

为了便于其他民族藏文爱好者的检索和利用,藏文文献编目可用藏文作主要编目文字,汉文作为辅助文字出现,即在一些主要字段用藏、汉两种文字混合著录,互为补充.这种方法使读者在检索过程中,借助两种文字对照加深对图书信息的理解,提高图书查准率和查全率,同时,在一定程度上能够解决回溯建库存在的一些问题,提高回溯建库效率.目前,西藏地区图书馆在藏文文献编目中没有两种文字混合编目的方法,这种方法也对编目人员提出了更高的编目要求,编目人员不仅要有根据编目规则科学著录各字段的信息加工能力,更要有较高的汉、藏文文化水平以及深厚的两种语言互译能力.考虑到读者的检索习惯,一般的读者是通过题名、责任者名或主题词等途径查找文献,通过摘 要了解文献的内容信息,用藏、汉两种文字对信息含量大的字段进行标引.如具有检索意义的子段200、517、606等字段用两种文字交替著录.《规则》规定信息源有两种或两种以上文种(或语种)题名时,应选择中文题名作为正题名.若这一规定不适用,可根据规定信息源的版式或顺序选择正题名.[3]字段200的子字段$a是可重复的,第一个正题名可根据各馆编目文字实际情况而定,著录时把第二种文字的题名作为交替题名,并把交替题名也作为一个有意义的检索点,并在517字段里再做反映;在7字段对责任者也做有检索意义的重复著录,采用规范化的译名.

数据字段区主要字段的特殊处理著录形式如下:

5 藏文文献编目工作未来发展趋势

用户需要目录在互联网上呈现,就需要把各个图书馆的馆藏联系起来,以集中编目为手段的联合编目已是中文图书编目工作的发展趋势.[4]藏文文献在全区乃至全国更大范围的资源共建共享是必然趋势.当前西藏地区各馆对藏文文献编目所采用的方式不尽相同,虽在本馆范围内基本实现资源利用,但没有统一的编目规则和编目标准,在联机联合编目实现资源共建共享道路上受到挑战.西藏地区图书馆工作情报委员会应组织各馆的相关人员和资深编目人员共同研究制定一种统一的、既具有地方文献特点又符合全国联合编目需要的藏文文献著录标准,制定共同遵守的编目原则和编目规则,从著录内容、格式到文字等做出详细的具有约束力的规定,建立健全藏文文献编目数据标准化、规范化体系,以提高编目质量,尽快与全国联合编目事业接轨.

参考文献:

[1] 隋莉萍.网络信息资源检索[M].北京:高等教育出版社,2010(7).

[2] 高小红.少数民族文献及其编目员应具备的素质与培养[J].中华医学图书情报杂志,2014(4).

[3] 国家图书馆.中国文献编目规则(第二版)[M].北京:北京图书馆出版,2005(4).

[4] 翟晓娟.编目的过去、现在、未来[J].大学图书馆学报,2012(2).

王丽英女,副研究馆员.研究方向:文献信息资源建设与服务.

(收稿日期:2017-03-30;责编:姚雪梅.)

信息检索论文范文结:

关于本文可作为信息检索方面的大学硕士与本科毕业论文信息检索论文开题报告范文和职称论文论文写作参考文献下载。

1、文献信息检索

2、信息检索论文

3、电子信息工程专业论文

4、论文检索报告

5、文献检索网站

6、移动信息期刊