OCLC世界图书馆地图服务

这几天在GR上看到有人分享的OCLC世界地图(World Map)的服务。在它的首页上看到这个服务是今年1月发布的。这个服务用可视化的方式呈现各国图书馆的基本数据,包括:

 

  • 各国出版物的语种;
  • 各国图书馆(包括国家图书馆、大学图书馆、公共图书馆和专业图书馆)的馆藏数量;
  • 各国各类型图书馆的数量;
  • 各国各类型图书馆中图书馆员的数量;
  • 各国各类型图书馆的用户的数量;
  • 各国各类型图书馆的经费;
  • 各国出版社、博物馆和档案馆的数量。

 

这个服务采用了Google Map作为框架。基本的信息到国家一层,美国的数据具体到州。就是很直观而且有趣的一个服务。(不过不知道为什么,我很想看中国的数据来着,不过我打不开“亚太地区”这一部分的数据)

————

我喜欢Google的一个巨大的原因就是因为它有太多太多的可能甚至是微不足道的创意(比如著名的Doodle,最近申请了专利)。我喜欢OCLC的原因也大体如是,虽然在一些领域我对它很不满,但是它根据各种数据开发的工具真的让人不得不赞叹。

————

参见:

Nalsi的西文编目笔记II:OCLC Worldcat Genre

DDC消息三则

1、DDC 23即将发布

via Dewey Blog: DDC 23: A sneak preview

2、DDC的学习文档

Dewey Training Courses@OCLC

由培训文档和联系组成。根据这个页面的说明,Webdewey可以免费申请30天的试用,然后就可以根据上面最新的Dewey分类法的内容进行学习了。

3、谁在杀死DDC?

via: Chicago Tribune: Who is killing the Dewey decimal system?

对于图书馆放弃杜威分类法的一篇新的报道,不过报道中也提到放弃杜威分类法的很多困难。

参见:Nalsi的西文编目笔记II:杜威困境

北大图书馆RDA测试报告笔记

 

2011.3.3本人参加在北京大学图书馆的一个报告,哥伦比亚大学图书馆的编目员周小玲女士(Charlene Chou)介绍RDA的一些基本情况,以及根据哥伦比亚大学图书馆已经进行的RDA测试工作,介绍了和RDA测试有关的一些问题。我前一段一直无暇关注RDA的最新动态,这次算是补了一次很大的课——当然报告本身也很有趣。

关于RDA是什么、RDA测试的一般情况、RDA培训者的培训以及RDAAACR2的区别,网上都有很多内容,此处不再赘述。一些资源如下:

JSC网站:http://www.rda-jsc.org/rda.html

RDA Toolkithttp://www.rdatoolkit.org/

RDA测试@LChttp://www.loc.gov/bibliographic-future/rda/

RDA培训者测试的课件:http://www.loc.gov/catdir/cpso/RDAtest/rdatraining.html
【即将翻译完成,敬请期待】

编目精灵IIIRDAAACR2差别列表 2011.2.19

这次报告最重要的可能是主讲人所介绍的RDA测试的过程,以及根据测试结果以及她在美国、香港和台湾进行的一系列交流活动的经验,所提出的一系列的问题和观察。当然这一部分确实很精彩。

RDA测试的一般程序,哥大图书馆的测试工作也分为测试前的准备期(7-9月)以及测试期(10-12月)。

在第一个阶段,哥大图书馆的主要工作就是编目员学习RDA规则。学习的途径有很多,比如在RDA Toolkit学习RDA的文本并且制作编目流程(workflow)、收听网络会议(webinars)、看相关内容的课件和培训文档,尤其让人印象深刻的是哥大图书馆每周要开一次会讨论RDA的问题,以及他们还制作了一个wiki页面用于讨论和收集最新的内容。

在第二个阶段,编目员不再开会,而是开始用最多的时间实地使用RDA规则。RDA测试规定,进行测试的机构测试25个资源的基本集(common set),并且自选另外25个资源的附加集(extra set),每一个资源都分别用RDA和该机构当前使用的规则进行编目。(只包括著录的元素,不包括检索点)

以下是周小玲女士的一些观察和结论:

RDA的主要优点包括:(这些都并非毫无疑问的,见下面的讨论)

 

  • 规范记录得到加强,可以记录更多的信息
  • 用户友好:“呈现原则”、不再使用拉丁文和英文缩写
  • 交给编目员和机构更多的选择,至少对小型图书馆来说更加方便
  • 超越MARC格式的社区
  • 国际化

RDA目前的主要问题包括:

 

  • RDA Toolkit没有提供index,很难使用(但是可以期待未来一定会有所改进)
  • RDA正文采用了基于FRBR的结构,所以和AACR2相比,特定类型的资源难以编目(这是非常有趣的一件事,RDA有意改变了AACR2基于格式的结构,结果还是有人批评——只能说众口难调)
  • 尤其对于视听资料,RDA的记录中包含大量重复信息(报告人特别提及了3XX00X字段的重复,不过对我来说,这个问题更多的来自于MARC格式,而不是RDA本身)
  • RDA在很多地方增加了很多信息(尤其是规范记录),而且拼写的内容更多的(不再使用缩写),所以编目更慢了
  • 在某种程度上,RDA仍然是以MARC为中心设计的,对于其他元数据方案的支持并不好,比如DC元数据社区对RDA有很多不满
  • RDA交给编目员过多自由,可能会对数据库质量或者数据交换都造成很多问题
  • 遗产数据的问题

以上只是报告中所有内容的一个有删节的列表。但是已经足够有趣到说明一些RDA自身存在的几个悖论:

 

  • 个性化和规范化(编目员或者各个机构的选择会造成的管理上的问题)
  • 简单化和复杂化(RDA制定的一个背景就是编目的简化,但是实际上它在某些地方规定了更多元素,比如规范记录,编目反而更复杂了)
  • FRBR化和基于格式的结构(在报告中提到,很多人都担心FRBR模型可能不足以支撑一个实际的编目规则,因为它太理论了,因而在很多地方,RDA都过于试图构建一个“完美的世界”,但是任何一个理论都没办法完整的表现一个世界,现实世界总是有太多的例外)
  • 国际化和更加严重的“英美中心”的倾向(RDA的目的之一是让世界范围的编目机构都能使用它;但是就像在提问时间顾犇主任提出的【参加他的博文】,RDA中用很多英文的完整的表达代替了之前的拉丁文缩写,这样反而会让RDA变得更加依赖于英文)

另外我们也可以看到RDA宣称的更贴近数字环境(qingyi同学在提问中也提到了这个问题,但是报告人在此处没有回答这个问题,只是赞同了她的疑问),或者超越MARC社区的任务,恐怕在实际中都不是毫无疑问的实现了。

对我来说这其中当然有很多复杂的原因。【其实很想就顾犇主任提出的问题做个回应的:我想就像巴别塔的故事告诉我们的一样,任何试图实现让全世界都能无障碍交流的方式恐怕都是不存在的。我觉得吴小玲女士在报告上对他的回答其实可能代表了可能的方向:更重要的可能不是追求一个统一的标准,而是,至少在这个问题上,允许不同的机构使用不同的编目语言,然后把不同语言的同一个资源的数据连接起来——据说德国和美国已经开始这样做了,虽然不太确定了。这很像语义网的实现方式,虽然似乎略有不同,不过语义网确实是一种有效的消除语言障碍的方式,因为每一个实体都不再以它的名称形式作为识别的标志,而是以一个为了计算机的识别符作为身份独一无二的识别符,名称的不同形式只是实体的属性之一,这样就可以实现面向不同的人呈现不同的语种的名称——当然实际中恐怕要复杂的多。】

不过既然说到了语义网,就不得不提到MARC格式的生死的问题。这个报告中,主讲人也提到了相关的话题。在美国RDA的会议上,MARC的未来这个话题再次被摆在台面上。几乎所有人都对MARC很不满。但是我想其中的一种观点是很有说服力的,除非我们能找到MARC的替代者【虽然我的疑问在于,我们还没找到么?为什么不是DC或者可能,MODS?】,否则任何对MARC的抱怨都是徒劳的。但是另外一个现实是,恐怕没有机构能够开发并且维护一个新的编码体系来取代MARC

不过此处我想重述本人在《数字图书馆论坛》201012期的一篇论文中的观点【在数图论坛网站上注册可直接下载】:MARC严重阻碍了RDA带给图书馆的一种可能性,这种可能性让图书馆能够真正的走向未来。昨天晚上和Keven大师谈到了这个问题,作为一个技术管理者,K师的主要担心是,RDA的使用者(或者不妨干脆说,编目员)没办法对RDA更大的意义有一个通盘的了解,所以就很有可能陷入一种只关注规则上的细微差别的状态(而且这种状态在编目领域已经过于常见)。这种可能性就是语义网、关联数据和其它相关的技术,它们可能是图书馆在21世纪想要继续生存下来一个必不可少的技术领域。但是MARC阻碍了图书馆数据向语义化的转换。虽然,从比较无害的角度,MARC格式也阻碍了RDA所许诺的图书馆编目工作简化的未来。因为RDA的数据需要FRBR实体层次的记录,而不是MARC格式的书目记录。这样当前的数据就没办法得到有效的重新使用,因而降低了效率。

哥大基本不是对RDA最有信心的美国图书馆(报告中提到美国的三所大学图书馆已经开始使用RDA,不管最终测试的结果,其中的两所是芝加哥大学图书馆和斯坦福大学图书馆,还有一所大学的名字没记下来),因为当前的RDA问题真的还很多——更不要提它还是不完整的,而且未来似乎也还不明朗——虽然它通过采用FR模型许诺给了我们未来的方向,但是恐怕图书馆界对这个方向尚且存在许多的争论。另一件在这次报告中听到的很让人惊讶的事情是,美国的三所国家级图书馆将不会就是否使用RDA达成一个一致的决定,而是要分别决定是否使用,这件事真的很糟糕,因为三座图书馆有可能会得出不同的结论。

————

在电脑面前坐了10分钟,想给这篇博文想个结论,结论就是:我没有结论。我个人的态度(如同昨天在新浪微博上所说),是:乐观的谨慎。所有的事情都太难了,但是希望我们这个环境里的强有力的机构(比如国图的西文采编部或者Calis)能够真的做些什么。