21世纪的馆藏:投资的校准和协作的行为:ARL报告一则

美国研究型图书馆协会(ARL)在上个月发表了一篇文章:“21st-Century Collections: Calibration of Investment and Collaborative Action”(21世纪的馆藏:投资的校准和协作的行为;PDF文件,4页)。

文章提到了我们需要对馆藏制定更好的测量方法,来应对社区中的如下核心议题:

  • 图书馆预算的问题让一些图书馆通过限制更多以及以需求为驱动的方式来满足本地的需求;
  • 期刊价格继续增长,反映了出版商继续吊死在一个无以为继的模型上,因而人们需要通过开放内容这样的运动来改变学术生态和市场环境【今天才知道俺们学校的OA项目:SUrface】;
  • 研究型大学管理并且保存各种类型的数字财产,因而需要数据管理和数字保存项目;
  • 研究型大学图书馆也需要对实体资源和数字资源都进行合作的储存/保存项目。

而对于21世纪研究型大学图书馆的馆藏,这篇文章从下述的方面加以讨论:

  • 研究者:
    • 全球和跨学科的兴趣持续增长,特色馆藏对于社区会更加重要;
    • “个人馆藏”的价值和角色将会继续增长,储存在个人数字设备上的数据将会转移到图书馆的服务器中;
    • 对于研究过程中和预出版作品的正式和非正式的分享将会变得越来越多、越来越重要;
    • 版权和权利管理对于研究者的传播和自典藏作品的能力是至关重要的,因而这些问题需要被考虑到政策中;
  • 内容:
    • 馆藏在两个重要的方面实现着增长:学术产品的新版本以及学术过程中的资源(比如博客和维基);
    • 反映了复杂对象的新的文学类型正在出现(比如链接到数据库或者视频的期刊文章、带有互动功能的内容);
    • 管理机构独特的资产(特藏、研究数据、机构典藏)正在变得越来越重要;
    • 对于政府信息的平等获取是民主的保障;
  • 出版:
    • 出版商的兼并和整合;
    • 出版的内容和服务越来越多,出版商会实验新的模型;
    • 数字保存和数字典藏会成为出版商共识的一个重要组成部分;
    • 多种类型和来源的开放内容将会随着盈利和非盈利等不同类型的项目(包括混合的模型)得到蓬勃发展;
  • 基础结构:
    • 机构间实现共享的储存协议;
    • 随着图书馆的重心从保存实体资源到管理数字研究的转变,研究型图书馆需要维护相互连接的数字内容;
    • 发现服务的转变将会重新定义“馆藏”的范围;
    • 图书馆的采访政策向更加外显的用户需求倾斜(比如PDA),以增加经费的效率;
    • 图书馆将会使用复杂的数据分析和成本建模技术。

——————Nalsi的分隔线——————

hangintogether.org: 21st-Century Research Library Collections (文章中附带了ARL5月份一次会议的内容汇集

ACRL预出版报告:From stack to the web: the transformation of academic library collecting

OCLC 报告一则:美国25家最大的公共图书馆馆藏分析

OCLC在2011年11月发表了“美国25家最大的公共图书馆馆藏分析”的报告(The Top 25 US Public Libraries’ Collective Collection。点击此处查看PDF文件,11页)。(至本博文发表时,本报告还没有发表在OCLC的网站上)本报告分析了美国馆藏量最大的25家图书馆(列表见报告第2页)在WorldCat数据库中的馆藏情况。

首先这个报告识别了3个概念及其数字。这25家公共图书馆在WorldCat数据库中一共有3410万馆藏数(一座图书馆只要有一个出版物的一个复本就算是一个馆藏,但是即便有一个出版物的多个复本,也仍然算是一个馆藏。相当于FRBR中的单件)、1350万个独一无二的出版物(相当于FRBR中的载体表现)和1100万个独一无二的作品。我很惊讶的是馆藏和出版物比竟然这么低(相当于,平均一个载体表现只有2.5个图书馆有收藏)。相对而言,作品和载体表现的比率倒是可以被OCLC之前和FRBR有关的研究所佐证。

不过前一个数字可以由本报告中图2的馆藏覆盖率所解释。在所有的馆藏中,有89%的馆藏只有1-5家图书馆有收藏;7%的馆藏有6-10家图书馆收藏。超过11家图书馆收藏的馆藏量不超过3%,而被超过20所图书馆收藏的馆藏数更是不超过1%。可见,这25家图书馆的馆藏是高度分散的,公共图书馆的馆藏中有大量独特的文献,这支持了文献共享的必要性。

对此一种观点认为馆藏量最大的两座公共图书馆,纽约公共图书馆(NYPL)和波士顿公共图书馆(BPL),因为其发展定位高度的专业化,所以可能影响了上述数字。但是在排除了这两座图书馆的馆藏之后,馆藏覆盖率(图3)和之前的结果并没有太大的变化。

另一个相关的问题是,研究者分别提取了25座图书馆都有收藏的馆藏和只有一座图书馆收藏的馆藏。前者的结果颇可预料,受欢迎的馆藏多是以一般读者为受众的作品。而后一个结果则很有趣,只被一座图书馆收藏的馆藏的主题分布高度分散,通过分析具体的馆藏,研究者得出结论:稀少的馆藏并不能证明它是有价值的

下一部分研究涉及各种图书馆群体之间出版物覆盖范围的比较。报告分别比较了25座公共图书馆和美国其他所有公共图书馆、25座公共图书馆和大学和研究型图书馆(ARL)、所有的公共图书馆和所有的大学和研究型图书馆、以及所有公共图书馆和所有的美国大学图书馆(是ARL图书馆加上非ARL的大学图书馆)的出版物分别有多少是重合的。我很惊讶25座公共图书馆绝大多数馆藏都被ARL的馆藏所覆盖,比率远远高于它和其他公共图书馆比较。(然后仔细一想,因为ARL的馆藏基数太大,而且上述NYPL和BPL都是ARL的成员,所以似乎也没什么不好理解的。)不过再一次,独特的馆藏构成了各地区、类型的图书馆资源共享的重要原因,就像最近Ohio州公共图书馆和专业图书馆共享项目所示。

报告的图8再一次涉及了“稀有”馆藏的问题,25家公共图书馆的出版物中,只有27%(360万种)在WorldCat的数据库中只被不超过5家机构收藏。不过再一次,通过抽取这些出版物,研究者认为稀缺性并不意味着价值。但是,研究者也认为在进行数字化和保存项目的时候,应当优先考虑这些稀缺的出版物。

最后一个数字(图9)涉及这25座公共图书馆馆藏图书的版权年。较之于数据,我觉得报告中提到的另外一件事可能更有趣。根据美国的版权法,1923年以前出版的作品(在调查中占13%)已经处于公共域中。1923-1963年之间出版的作品(14%)可能受版权保护,但也可能不受版权保护(取决于版权是否被更新)。而1963年以后出版的作品(68%)仍然在版权保护中。版权问题是需要数字化项目考虑的问题,在这件事情上,似乎是出于同样的原因, RDA把版权年提升为一个超越于出版、印刷年之外的单独的元素。

————————Nalsi的分割线————————

via: Los Angeles Public Library: Moderator and Participant Research

OhioLink-OCLC馆藏与流通分析:报告及ppt

2011成果报告:http://www.oclc.org/research/publications/library/2011/2011-06.pdf (pdf文件,37页)

目的:为了更好的理解OhioLINK(Ohio Library and Information Network,俄亥俄州88所大学图书馆以及俄亥俄州立图书馆的联盟)的图书流通和馆藏的情况、尽可能的减少重复馆藏并且增加藏书的多样性。

方法:收集了OhioLINK图书馆几乎所有图书和手稿的馆藏和流通情况,时间范围是2007年春-2008年春的一年时间。因为同时采用了不同数据源的数据(Worldcat基于载体表现的馆藏信息以及图书馆OPAC基于单件的流通信息),所以采用了OCLC的作品集算法可以在不同的层次上进行分析。

本报告的另一个主要内容是对数据的使用提供了简要的介绍。报告最后的词汇表对于理解一些相关的术语也是特别有用的。相关数据可以免费下载(各机构总体数据),本报告的作者鼓励其他机构使用其他的方法分析相关的数据,并且和其他机构的数据进行比较。

————————

一个基本的分析可以参见这个研究活动页面上提供的一个ppt的链接(35页)——当然,本页上还有其他各种有用的链接。这个ppt是Akron大学(也是OhioLINK的成员馆)的Julie Gammon和OCLC的Ed O’Neill在2010年10月的一个研讨会上的一次报告。

#8 提供了一个总体的数据。OhioLINK的单件总数是2900万,在07-08年的范围内被借出了210万次;而载体表现层的两个数据分别是677万/104万。

#17 尤其提到了四个藏书的指标:流通率(总体流通数量/藏书综述)、覆盖率(某个学校的藏书载体表现的数量/OhioLINK载体表现总数量)、完整度(OhioLINK的全部借阅能够在某个学校得到多大程度的满足)以及读者等级(从0:幼儿-1:学术的区间)

#22 是本研究对于80/20的验证。但是本研究的数据表明,6.5的载体表现(45万个/677万)完成了80%的流通数量。这个密集程度比传统的观点要大很多。

#24 分学科资源的流通率:艺术休闲类和医学类的最高,商业经济和法律类的最低。很有趣的是,在下一张幻灯片上,法律类图书的重复率也是最高的。

#27-29 其他语种的馆藏:出乎我的意料,德语和法语是最高的(都超过了20%)。中文图书只有4.3%。但是更让我惊讶的是#29上的其他语种的馆藏占总体馆藏数量的比例,这个数字从1920年以来呈现总体的下降趋势,从历史最高的18%下降到现在的5%。我很好奇这是为神马?

#35是一些总体的结论:

  • 非英语馆藏的使用率有限(我想这也是我们国家的图书馆的问题吧)
  • 不同主题、机构……的流通率差别很大
  • 馆藏的重复率很高
  • 下一步的措施:进一步的分析;哪些信息是有用的,哪些是没用的;我们有没有错误的地方;我们是不是漏掉了什么;数据的共享

P.S. O’Neill在Slideshare上的另一个ppt和本ppt的内容基本相当。