医学论文 护理论文 中医论文 教育论文 水利论文 高教论文 会计论文 统计论文 建筑论文 艺术论文 经济论文 法学论文 新闻论文 文学论文 计算机论文 英语论文图书馆论文 档案论文 政治论文 农学论文
返回首页

关于制定中文元数据标准的思考

关于制定中文元数据标准的思考


作者:未知     文章出处:论文网     发布时间:2008-1-4


 -


关于制定中文元数据标准的思考


【内容提要】作者认为,中文元数据标准应以DC为基本框架,并完全遵循和保留DC的结构、特点及扩展方式等,坚决防止CNMARC化倾向;中文元数据标准应形成一个完整的体系,对所涉及的相关的中文标准、规则、方案等,按照通用性、易用性等原则进行修改和制定;这一标准体系应成为全球各类中文信息资源著录和检索的标准。


【摘  要  题】信息资源建设与管理


  元数据是“关于数据的数据”或“关于数据的结构化数据”,现在常说的元数据,是特指在标记语言(SGML、HTML、XML)环境下,对网络信息资源进行描述的解决方案,主要是用于网络信息资源的发现、存储、管理和检索利用。在当前网络信息呈异常迅猛发展之势,大量的多样性的数字化资源,使得信息的利用和查找十分困难。为了解决这一问题,在国外已有了很多的元数据研究项目和成果,建立和运行了一些描述网络信息资源的元数据模式。元数据的应用,为网络信息资源的有序组织、适度控制和高效检索利用,提供了便利的条件。近年来,中文网络信息资源也在迅速增长,尽快研究和制定中文核心元数据标准,已是非常迫切的了。在制定中文元数据标准时,既要考虑到中文元数据处理的特殊性和中文资源的应用特点,更要从全球的信息大环境出发,分析、研究和借鉴国际上先进的、通用的元数据标准,在尽量保持与国际标准接轨的基础上,制定符合中文资源应用需要的扩展与应用规范。


    1 中文元数据标准应以DC为基本框架


  在国际上众多的元数据方案中,Dublin  Core  Element  Set(都柏林核心元素集,简称DC),以其结构简单、语意互通和可扩展等特性,事实上已成为国际范围内通用的网络信息资源描述的元数据标准。DC经过几次国际会议的研讨和修订,已逐步完善和成熟。所以,制定中文元数据标准应以DC元数据为基本框架。国内在四五年前就已开始了对DC的探讨和研究,但至今尚未完全形成依托中文环境的DC元数据标准。当前应进一步加紧深入地对其进行研究和规范,形成中文元数据的一个标准核心集,以适应中文网络信息资源的发展。中文元数据标准应完全按照DC元数据集来建立,在具体作法上要注意以下一些问题。


  (1)完全按照DC元数据的框架结构来制定中文元数据标准。由于网络信息资源在时空上的广泛性和开放性,与传统的文献著录的相对封闭性有着很大的不同,因此,中文元数据标准的制定,应强调与国际接轨,保持完整的一致性。也就是说要完全遵循DC元数据的框架结构来构建中文元数据标准,而不应该提出“以DC为主,参考其它元数据标准”来搞中文元数据标准。我们应汲取CNMARC的教训,避免把中文元数据标准搞成“CNDC”。中文元数据标准应该只是对DC元数据进行本地化和中文化的处理,对它的内涵、外延等用中文予以标准地诠释,方便使用中文的著录者和检索者理解与利用,仅对于著录和检索中文信息资源的一些特殊性和应用特点等有限的方面进行规范的规定和定义。


  (2)中文元数据标准的制定,应完全保留DC元数据的基本特点。一般地讲,内在性、可扩展性、独立句法结构、可选择性、可重复性和可修饰性是DC的6大特点,在实践中集中地表现为DC元数据的简易性、通用性、兼容性以及灵活的可扩展性,这些特性是DC能够成为一个国际上通行的元数据标准的原因,也是建议中文元数据标准应完全按DC来制定的理由。因此,在制定中文元数据标准时,要完全保留DC的基本特点,不应有任何的更改。在国内有些使用DC元数据时,将某些元素规定为“不可重复”或“必备”等等,这种做法是不可取的。


  (3)应以国际通行的DC修饰限定词作为中文元数据的规范和扩展的依据,而不应采用其它形式。DC修饰词提供了对元数据的扩展描述,可以缩小元素的含义范围,使其更具有专指性,或是对元素进行规范性说明。目前,DC已正式确定了三类修饰:模式体系、语言种类和类型。如为了表达不同的日期,在使用“Data(日期)”这一元素时,可以增添“Created(创建)”、“Valid(有效)”、“Issued(发行)”、“Modified(修改)”等修饰词。在中文元数据标准中,不应把这些元素的修饰词解释为子元素。元素与加了修饰词的元素没有主次之分,修饰词并不改变元素本身的定义。元数据标准中,不应出现子元素的提法。元素的修饰限定和规范,是元数据元素的内在特性,是元素的不同表现形式,绝不能把元素和加了修饰词的元素看作是元素与子元素的关系,应坚决防止中文元数据标准的MARC化倾向(在MARC中就有的字段、子字段之分)。元素与加了修饰词的元素或多个附加了修饰词的元素同时出现,是元数据的元素可重复性的体现。


分享到:

本文选自温州一枝笔写作事务所:专业代写毕业论文-致力于医学论文职称论文代写代发论文(责任编辑:yzbcc)
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
验证码:点击我更换图片
推荐内容