南京参会记·联编会第二天

今天是联编会的最后一天议程。

早上开始是昨天下午讨论的汇报,内容本身没有太大意思。做了两件事:试用了本人Nexus One作为wifi热点的功能,很成功;然后近距离的(一整个上午都在)观察了一下编目员这种人,作为对于前日精灵老师问题的回答。

对我来说传统的编目员基本上可以和以下三个概念划上近似于的等号:保守;过分重视实际工作;完美控&细节控(当然,这三点其实都并无褒义或者贬义,如果你觉得有,那我我只能说你想太多了)。广东中山图书馆的美女馆长介绍了昨天她们组讨论中,一个编目员大声疾呼:“不要抛弃6字段。”让人忍俊不禁。

比较有意思的一件事是有人透露,山东省已经建立了省内的联合目录,包括公共、社科、农科等领域的机构(并将在将来容纳大学图书馆的资源),现在已经有100万条数据。他们还建立了地方文献的目录(在同一个界面下),现在有5万条数据。

另外,当然昨天本人所在的小组也有人提到,当前套录过于容易,因此编目员的水平越来越低了。这两件事这件果然存在如此明确的联系么?很想辩证一下。

第二部分是索晶同学继续昨天的系统演示。感想之一是,把国图的新系统和OCLC的系统联系起来是很自然的想法。比较二者在一些事项上的差别可能是很有趣的,比如一些特殊字段的规定(尤其是049字段);然后,我很期待国图的UCS能够做出像worldcat local一样的服务,那将是很有趣的事情,也会为许多图书馆解决ILSOPAC的问题吧。

会上做了几个任务的演示,过程多少有些不够精细。不过据说后续会有更加正式的培训,所以显然不是问题。

然后是国家联编中心的总校对(我很爱这个称呼)万爱雯做去年数据的质量分析。这一部分应该是整个大会分贝最大的一部分,和我之上对于我心目中编目员特质的分析遥相辉映。

最后是顾主任的总结发言,谈到了如下几件我觉得有趣的事情。(希望没有触碰到顾主任所说的“家里人”的界限)

虽然有很大困难,但是联编中心会坚持公益性的取向。

随着新系统的投入使用,传统的数据传播方式可能也会发生变化,因为传统的方式(光盘,以及?)带来了一些问题,比如数据外泄。

他还提到了国图和Calis规则差异的问题。一方面他认为这两方的规则显然存在一些差异。最近即将提出的著录和标目细则(著录细则的征求意见稿已经有了)希望能解决这些问题——后者的改变可能会导致规范制作方式上的变化。(VIAF会不会是一种解决的方式,不追求当前层面上的统一,而在更大的层面上追求整合?)随着前几年UNIMARC书目数据和规范数据的格式都推出了新版本,CNMARC格式也在修订中(分别建立了规范组——flybabywl同学),新的修订工作中有双方的人员加入,也是希望能够解决这一问题。

下午去参观华丽丽的南京图书馆。用钱堆出来的图书馆,有很多很有趣的设计,比如很方便的布线,还有书架上随处可见的抽拉式的挡板,方便上书员放书,也方便读者放书。古籍书库无比豪华。采编在地下二层,不见天日。能我想起来把照片从手机里导出来再上照片。

今天南京阴雨,有点冷,忘了带长袖,正在考虑是不是去买一件。有点累了。不过下一个会更加精彩,期待。明天多半去南京博物院。而且要干活了,否则预定的安排可能要做不完了。报告完毕。

 

————

 

联编会第一天

报到日

开场

 

南京参会记·联编会第一天

早上8:00开始开会,在华丽的南图。距离宾馆步行只有10分钟。

开场是领导讲话。陈力馆长提到了三个问题:

  • 不断增长的资源(不断增长的出版业、少儿资源和特种资源)对于编目工作的冲击
  • 虚拟资源对于编目工作的冲击(国图引进了metalib,但是使用状况不理想)
  • 当前编目工作在整体图书馆事业中的位置。(主讲人认为编目员是培养图书馆人才的地方,编目技术是图书馆员的一项基本技能)

下面是顾犇主任的联编中心年度工作报告,以下是去年的一些数字和工作:

  • 至2010.5,成员馆724家,数据用户1171个,14个分中心
  • 2009年,数据下载245万余,上传17万条(开始包括学位论文数据——两个数字的不对称),30家上传馆(增加8家,包括首图)
  • 数据质量控制:5家图书馆定期反馈;质量控制小组的设想
  • 业务培训:
  • 分中心工作:至2010年3月,11个省级分中心发展用户594家;制定分中心各种工作章程和细则(有必要么?)

在他提到今年的工作重点中,最重要的事情可能就是,随着引进了Ex Libris的新的联编系统,国图开始试图建立“全国范围内的联合目录”——各馆可以上载馆藏信息,想象一样Worldcat吧。当然这个议题其实就是本次会议最重要的一个议题。另外两件我个人比较感兴趣的事情包括:

  • 修订中文普通图书著录细则
  • 拓展港台图书的数据上传工作

 

接下来Ex Libris的一位同学和国图采编部的索晶同学开始介绍新的联编系统(Union Cataloging System, UCS)。本人之前完全没接触过联编这件事,所以听的注意力非常分散。以下是官方提供的新系统的特点:

  • c/s and b/s两种模式
  • 基于Oracle数据库
  • 面向读者的界面提供各种OPAC2.0功能
  • 支持多种格式:两种MARC格式,DC以及一种自定义格式
  • 支持多语种
  • 开放底层数据结构
  • 提供国家图书馆的规范控制:名称、主题
  • 批处理服务
  • Z39.50协议
  • 可扩展性:提供若干个API

 

在结构上,UCS分为三个部分:

  • GUI client:是联编系统中编目的部分,它的一些特点如下:
  1. 支持多种书目格式
  2. 数据自动核查功能
  3. 部分字段的自动生成功能
  4. 规范控制
  5. 用户自定义的索引和检索点配置
  6. Z39.50的下载和上传
  7. UTF-8(小语种字符集)
  • Web app:专门负责数据的批上传、下载并提供统计报表
  • Web opac:是面向读者的界面,包括各种主流的OPAC2.0的功能

另外,UCS还提供了两个第三方的服务(?),一个是曾经丹诚开发的dp2的Z39.50软件,另外一个是叫做x-service的服务(如同名字,这个服务很神秘),根据索晶同学的描述,这个服务负责在异构ILS中向联编中心上载数据,是一个基于xml的服务。

像其他服务一样,UCS也设定了一些本地的字段来实现一定的功能。比如:

  • 049:成员馆控制号字段,相当于MARC 21中的035字段(新的系统可以根据用户馆系统中的049|b进行定期的质量追踪,每当数据有了最新的更新,可以及时反馈给用户馆)
  • 文献类型字段:200|b, 245|k (未来成员馆可能会有文献类型上的控制,某些图书馆只能上传、下载某些类型的数据)
  • COP字段:版权保护字段(在版权保护期限内,其他成员馆无法下载该数据)
  • 910字段:馆藏字段:|l和|n连接到opac中显示的馆藏信息
  • QUA字段:书目状态字段。N为预编数据、Y为待审数据;A为正式数据。每一个状态都有一定的判断标志和处理的流程。
  • ……

这个系统在另外两方面和之前的系统构成对比。一方面是编目权限等级的设定(主要是针对数据的上载)。新的编目权限等级据说来自于Aleph系统中catalog level的设定。等级包括0-60,联编中心的总校对老师是最高级的60,其余递减,每一级机构分配10个等级(比如分中心的编目员是31-40、上传馆的编目员是21-30;在每一级机构留下10个等级是为了便于机构内部的分级)。在不涉及到横向关系上,等级高的人可以修改等级低的人的编目数据,反之则不行。

另外一件事就是在用户馆上传、下载数据的流程上有了较大的不同。

在传统上,用户馆现在本地的系统上编制书目数据,然后提取ISO2709格式的数据上传给联编中心。新的系统有四种上载的模式(自动生成049字段):

  • GUI的联机操作
  • GUI的批处理操作
  • Web app的批处理操作
  • Z39.50

 

新系统还提供了5种书目下载的方式:

  • GUI的联机下载
  • GUI的批处理操作
  • Web opac的下载
  • Web app的批处理操作
  • Z39.50

(细节如果有问题的欢迎指正……)

总之听完上午的部分是又冷(虽然我不太明白为什么)又饿又困。然后中午吃过饭,下午1点去参加分组讨论,到了会场发现关着灯,然后拿出会议日程一看,是两点开始。然后两点过去,下午的活动正式开始。索晶同学在我们屋,于是他成了会议的核心(索晶同学的回答问题时间)。

联编大省浙江和辽宁问到了有趣的问题。以浙江省为例,作为省级分中心,它们需要为本地的成员馆提供数据,因而它们下载的数据并不等于浙江省图书馆的馆藏;另外一方面,它们会根据书店的样书预先编制数据,因而它们上载的数据也不代表它们的馆藏。所以浙江省图书馆的代表就提问:“全国联合目录”的界限到哪里?省市一级么?而且,这件事也说明了书目和馆藏数据在实际上是分离的。另外一方面,这件事也反映了一整天我都在思考的一个问题,全国联编中心和地方分中心的关系到底是什么?后者是否真的有必要存在?(显然有或者没有必要都是有道理的,对于正方来说,国家图书馆如果直接和全国各地的图书馆打交道,它们一定会被累死,而且肯定没办法很好的满足各地的需求;但是另一方面,当前的构架让“全国联编中心”恐怕就变成了一个中央化的空架子,就像这个案例说的,所谓全国不过是各个省的省会而已。)

不考虑后面一个问题,索晶同学给出的答复有两个,一方面是制定更灵活的审校政策,地方的上传馆直接给全国共享目录上传数据,但是由各个省份中心来做第一步的审校。并且采用更灵活的上传下载方式。

最后有一个老师提到的问题是,联合目录应该从本馆的一般性资源开始做起,还是从本馆的特殊资源开始做起。显然后者是更有意义的,但是也是更不好做的。这件事也很有意思。

本人本着高度务虚的精神把这个联合目录比做了OCLC的Worldcat,当然当下的发展虽然迟缓,也是很振奋人心的。那么不知道国图是否有下一步的发展计划,比如云计算,或者至少是FRBR化。索晶同学不出所料的回答没有。对我来说,我觉得后面一个问题在中文世界的实现是很值得期待的,前者更是有一个有趣的事情。所以虽然务虚,但也是积极的。

晚上去秦淮河边吃饭。回来的路上发生了把我雷焦了的事情,五雷轰顶。(p.s.本人现在在星巴克用隔壁咖啡馆的wifi账号上网……)

————

报到日

开场

 

OCLC学术讲座|产品推介会参加记

长途跋涉从单位来到国科图。大学的时候经常来——因为这里很安静,而且有很多有意思的K类图书。上班之后就一次也没来过了。来之前听说了某个同学的八卦一则。

到了之后见到不少认识的同学和老师,比如徐青一同学和表哥。

来之前就被同事打预防针,说OCLC的讲座一般都是广告。讲座开始发现果不其然。当然王老师讲座中的戏剧张力是我很欣赏的,不过内容和cloud computing实在没有太多关联。worldcat local确实是一个cloud computing的精彩案例,不过主讲人似乎把太多精力放到了opac2.0这个内容上——虽然我也不否认这件事很有意思就是了。他提到,现在已经有超过1000家机构在使用worldcat local了,确实挺多的,我个人也很期待第一个使用这个服务的中国图书馆——多希望是我们呀。

另外,今天上午小小的做了一下功课:
Marshall Breeding: In Challenge to ILS Industry, OCLC Extends WorldCat Local To Launch New Library System

另外,他传教士般的语气让人印象深刻。

然后是蔡淑思女士介绍CONTENDdm这个服务。这一部分让我印象很深刻。比如它的强大的功能、它对于不同程度的对象的不同等级:你可以选择在自己的服务器上架设,也可以把服务构架在云上。另外就是本地的数据可以自动的被worldcat收割,继而出现在互联网上。总之这是一个相当值得关注的服务。

于是回头看了一下精灵老师的博文:ContentDM试用记。感觉有了一些新的认识——第一次看基本没看懂。

Nalsi的2009年总结

之前发表在书社会上,修改之后重新发在这里。

————

这是我工作的1.5-2.5年,之前我都是在7月写总结的,不过决定从今年开始换过来了(因为发现之前的两次都找不到了)。

本职工作上面今年有些懈怠了(惭愧啊),不过说起来就完全的本职工作来说(英文书的编目),也没有太多值得关注的新东西。不过希望明年能更关注分类法、
FR家族的另外两个文件、语义网以及其他。(似乎不能太贪心,不过确实有很多想学习的东西)——在考虑联合一些同事在微博上重新建一个我们图书馆的非官方网站,不知道能不能做起来——关键是能提供怎样的服务,还在考虑这件事,希望大家给出你们的意见。

上半年趁着在外面租房住拼命读书(因为当时没有电脑
用),那段时间应该是我有生以来读书读得最狠的一段时间。不过今年读的书严重转向小说,希望明年能多读一点历史/人类学的作品。——在工作方面,今年读到
最重要的一本书可能就是《图书馆2.0》了,这本书开启了我的新世界,这是毫无疑问的。

下半年参加了两次会议(云计算和2.0),写了一篇论文,认识了一些师长和图林中人——用某位同学的话说就是“找到组织了”——所以几乎没来得及读书。

翻译了一些东西,其中一些产生了还不错的反响。(译言啊,快回来吧)

当前形态的“西文编目笔记”是今年年初开始写的(可是我感觉写了好久),中间搬过一次家,目前仍然在寻找最合适的书写方式。据说本博开始变得有名了,但是无从确认。总之希望大家继续关注。

发起了学习小组,先后弄了1.0和2.0的两个版本,目前的活动叫做IG,期待明年的第一次正式活动。不过我也意识到组织活动真的很难。

用饭否,饭否挂了,开始用译言没多久,译言也挂了。今年开始关注网络、2.0和政治,幸福指数迅速下降。

第一份合同名义上还有两年半,未来很惆怅。

今年要感谢很多人,尤其是精灵老师,K师和表哥。

————

关于明年,希望继续保持学习和翻译的动力,希望能参加至少一次会议,希望能多读书。

一个定量的指标就是希望一周能翻译一篇文章,希望两周到一个月能读一份报告——希望吧。