改进RDA的语言:ALA Publishing的计划

在RDA测试报告中,RDA的文本难以理解是一个重要的问题,也是报告提出的要想实践RDA需要提前解决的问题之一。(参见前文:RDA测试报告及其实施声明

昨天,RDA工具包的博客发布了ALA出版社对于这一部分工作的计划表(pdf文件,2页)。这个计划识别了RDA测试中,测试者对于文本易读性提出的几个问题:

  • 堆砌辞藻
  • 不必要的复杂的风格和语言
  • 重复
  • 导致歧义的句子结构

另外,这个计划提及了为了解决上述的问题,接下来需要特别关注的方面:

  • 读者:图书馆和其他机构的专业和准专业的编目员
  • 尽可能使用主动语态
  • 缩短句子的长度
  • 使用某些方式(比如更好的措辞,以及句中对于专业术语的解释)减少歧义的可能性

目前选定了ALA出版社的James Hennelly作为这个项目的负责人。出版社计划在2012年6月之前向测试委员会提交5章的内容。而根据测试委员会在测试报告中的建议,这一部分的工作需要在2013年1月前完成。

Amazon Library Lending上线以及Afictionado:图书馆要完蛋了么?

TechCrunchLibraryJournal在今天报道, Amazon Library Lending项目正式上线,虽然目前似乎只支持Seattle Public Library和King County Library System两座图书馆。

Amazon的帮助页面上提供了一些技术细节。比如用户需要先登录图书馆的网站(或者OverDrive的界面?),找到Kindle电子书,然后用户会被引导到Amazon网站上,使用你的Amazon账户完成借阅。(我个人觉得这个过程很麻烦)如同之前所知道的,Amazon图书支持全部的Amazon设备,包括最近推出的云阅读界面。另外,这个项目也支持用户的注释和标记功能,并且在电子书到期之后依然可以查看。

从公共图书馆借到的电子书支持wifi和USB的传送方式,但是不支持Kindle自带的3G连接。借阅时间因各个图书馆而不同,但是在电子书到期3天前,用户会收到通知。

目前,关于这个项目,我个人最大的困惑应该是这个面向公共图书馆的借阅项目和Amazon面向个人的订阅服务的关系到底是怎样的?

——————Nalsi的分割线——————

在面向个人服务的层次,除了前段沸沸扬扬的Amazon的电子书订阅服务,最近MacMillan也计划推出一个面向个人的电子书借阅服务:Afictionado,这个服务预计在12年初在英国开展。

虽然Andy Woodworth认为图书馆大可对Amazon(以及MacMillan同类型的服务)微微一笑,但我还是认同更主流的观点:图书馆要完蛋了

——————更新的分割线——————

[2011.9.23更新]根据Library Journal的报道:在9.22日,Amazon和OverDrive宣布这项服务正式面向全美的11000家图书馆开放。

Worldcat数据库的质量:读OCLC报告笔记一则

报告链接:http://www.oclc.org/us/en/reports/worldcatquality/214660usb_WorldCat_Quality.pdf

OCLC的Worldcat质量项目(Worldcat quality project)尤其关注重复记录管理的问题。2008年OCLC的报告(联机目录:读者和图书馆员想要什么,做个迟来的广告)对于Worldcat数据满意度的统计,在人们反映的问题中,重复数据和最少内容的记录(minimal record)是普遍存在的问题。

Worldcat数据库的快速增长加剧了数据质量的问题。问题首先是各国国家图书馆的导入数据,新的元数据超过了之前自动处理重复数据的工具的能力。但是这也让OCLC通过新进入数据库的多语种的数据,获得了进行多语种服务的机会(1998年,Worldcat数据库里的英文内容占64%;2010年,这个数字变成了43%)。其次是OCLC自2008年以来大量导入厂商数据(目前占书目数据库的1.59%),这一部分的数据内容比较少,而且会造成匹配、合并的问题。

OCLC从1991年就开始使用重复检测和分解(Duplicate Detection and Resolution, DDR)软件来处理重复记录。2010年9月,DDR对Worldcat数据库完成了一次完整的检测,删除了510万条重复记录。(从我个人的感觉来说,现在Worldcat的冗余数据确实比大概一年前要少了。)

2003年开始,OCLC开始允许“并列记录”(parallel records,即相同资源使用不同编目语种进行编目的记录。之前作为重复记录处理)。而重印的资源的记录,根据AACR2,要作为单独的记录来处理。但是对于终端用户来说,这种单独的展示是让人困惑的甚至于是失败的。

这还造成了另外的问题。OCLC号连接了元数据和资源的地点,也是Worldcat数据库和外部数据库的连接机制。(当我们从Worldcat数据库的资源页面导向外部的OPAC的时候,搜索项目就是OCLC号,这确实是很有用的一种标识符。突然想到本人很早之前翻译的一篇文章:OCLC控制号作为载体表现标识符)但是随着并列记录和重印(尤其是数字化的重印)的增加,元数据和馆藏信息越来越分散的分布在不同的记录下,这造成了多方面的问题,无论对于终端用户的选择困难还是图书馆之间的资源共享。

继而OCLC提出了一种新的通用标识符的概念:“全球图书馆载体表现标识符”(Global Library Manifestation Identifier, GLIMIR),这是OCLC自2009年开始的项目,用以解决上述问题。新的标识符希望能够克服编目语种、资源格式或者其他方面的问题,实现记录更好的聚合。这个项目目前即将实施,OCLC计划将在12财年度的上半年对Worldcat进行“GLIMIR化”的处理。正文第14页以下也展示了Worlcat在这方面正在进行的其他工作。对我而言比较重要的一个是去除无效的OPAC链接,以我的经验,目前这部分的体验已经足够的不好。

————————

对于没用过Connexion(以及新的Worldcat Local)的人来说,我一直很好奇Worldcat这么庞大的数据库在技术上的一些细节。在这个意义上我觉得这篇报告很有趣。这次看到GLIMIR感觉完全没有印象,Google了一下发现蛮多人都讨论了这个东西。

尼尔森的社会媒体报告,2011年第三季度

Nielson: Social Media Report: Q3 2011

本报告是尼尔森公司对美国和其他主要市场2011年度社会媒体使用情况的扫描。提供了一些最新的数据和发展趋势。根据这份报告的言外之意,社会化媒体=社交网络+博客+另外一些服务。

主要发现:

  • 社交网络和博客继续占用美国人最多的上网时间:23%,遥遥领先排在第二的网游。p. 3
  • 将近80%的活跃的互联网用户使用社交网络和博客。
  • 美国人使用Facebook的时间远远超过他们使用其他任何网站的时间:p. 6 (我个人很惊讶这件事,因为直到去年,FB才在这个数字上超过Google,而且当时Google的访问量比这个报告里的访问量要大很多,不知道是不是计算方法上的问题)
  • 将近40%的社会化媒体的用户通过手机访问这些内容:97%的用户通过计算机访问社会化媒体,37%的用户通过手机访问。p. 7
  • 在美国智能手机使用者用得最多的应用中,社交网络类的应用排名第三:60%的使用率。p. 8
  • 55岁以上的社交网络使用者数量正在大幅增长:在过去一年间增长了109%,是增长最大的族群类型。p. 9
  • 有更多的女性使用社交网络、博客以及在线视频服务(在被调查的网站中,只有Linkedin和Wikia有更多的男性使用者)。但是男性观看视频的时间更长。p. 4, p. 10
  • 53%的活跃的社交网络使用者至少关注一个品牌,32%的人至少关注一个名人。p. 11 (我很好奇这一项在中国的数字)
  • 轻博客服务Tumblr在过去一年间,使用者增加了三倍。p. 12

另外,第7页还有另外一张图很有意思。反映的是2011年第1季度的一个调查(脚注未提供这个调查的范围),在手机所拥有的功能中,社交媒体排在第二位,一共有47%的手机拥有这个功能,但是一共有30%的使用者认为这个功能是有用的(也排在第二位,但是远远落后于GPS)。另外,扫描条码也进入了这个列表,分别有20%和21%的人有这个功能以及认为这个功能是有用的。其实是蛮高的。

最后,根据第8页的图表,现在有很多年轻人在用MySpace,这让我很吃惊。