【翻译】拥抱无序

原地址:http://managemetadata.org/blog/2009/02/25/embrace-the-chaos/

作者:Diane Hillman

译者:Nalsi

————

我本周参加了code4lib会议,我写下这篇文章就是为了让我明年还能记得,我真的不在乎……

 

我不在乎最新的分面搜索。我不在乎最新的开源OPAC。我不在乎最新的开源图书馆系统。我不在乎系统的升级和软件的样品。我不在乎API/标准/零售/LC/OCLC的攻击。我也不在乎重新发明20世纪的标准,这让图书馆编目员心神不宁(毕竟,这是他们的工作)。

 

来到这里的人都是伟大的,我在乎他们每一个人,也在乎他们的团体,我在性格里就是亲近这些图书馆的“奇客”(geeks),而且这个会议就是为了筛掉其他所有人。所以我在这里很好,但是这次会议提供的信息对我一点用处都没有,真是让我生气。而且尽管我非常喜欢这些家伙,但是用互联网接力聊天(IRC)的方式发表评论(这本应当让所有人,包括报告人都能看到)和说笑话,难免让人觉得难以融入。对于新来的人来说,不管人们多么热情,他们仍然会觉得困难。

 

我想站起来嚷嚷一句:“伙计们,听着。世界在前进。我们要跟上!”我觉得我们不需要非得进入图书馆,除非是过去10年里的会议。我最近一年都没用过图书馆的OPAC或者图书馆系统,除非是我要研究系统本身。我曾经登录到一座大学图书馆的网站,为了下载订阅才能获得的期刊上的文章,但是我后来发现这些文章在Google上就有,而且最近这个网站还老登陆不上去。

 

这次会议的许多发言和讨论都是关于替代性方案的:全文和元数据,编目员创建的元数据和用户创建的元数据,开源软件和商业软件,GoogleOPAC,数据分配标准A和标准BMARC和其他一切。人们有一种看法是,互操作性意味着每个人都不得不在一些层面上达成一致。但是真实的情况是,每个人都需要适应这个观点:所有人都支持几个标准和数据格式的理想世界是我们曾经生活的世界,或者我们想象中的世界,但是现在已经没有了,而且它也不会再回来了。

 

我们现在的所有就是无序。许多许多人非常努力的工作试图控制变得越来越混乱的数据以及越来越不可预测的用户行为。他们试图控制用户,甚至是专家,这些人越来越多地使用Google或者YouTube来获取信息。他们试图知道怎样来处理不断增加的数字馆藏、不断下降的用户满意度以及不断减少的预算。

 

让它去吧。无序是好的。让你的系统保持开放和灵活。看。听。与Google整合而不是和它相抗争。整合社会网络中的资源。分享一切。聚合。看。听。

 

拥抱。

————

译者的话:前一段受到精灵老师的推荐读了《新数字秩序的革命》,然后又看到Keven老师对于未来规范控制的见解。我觉得Keven老师的一句话是特别正确的:无序只是另一种层面上的秩序。关键是我们怎样找到它/它们。

【翻译】FRBR第二组和第三组实体的怪异之处

来源:http://kcoyle.blogspot.com/2008/12/frbr-and-group-2-3-oddities.html

作者:Karen Coyle

译者:Nalsi

————

你现在或许已经认识到了,只要我发现一些新问题(至少,对于我的新问题),我经常会转回到FRBR。或许因为我不是个编目员,看上去我之前阅读FRBR漏掉了一些核心的概念。这也许就是我和一些有丰富经验的编目员之间对FRBR理解不同的原因了。

 

这次,我是在思考实体是怎样用于主题关系的。但是在我得出结论之前,总是有出版者跳出来折磨我。

 

FRBRRDA中的创作者和出版者

 

第二组实体和第一组实体之间的关系也就是所谓的“责任关系”。下表显示了两个第二组(G2)的实体:个人和团体是怎样和第一组实体产生关联的:

作品 由G2 创造

内容表达 由G2 实现

载体表现 由G2 生产

单件 由 G2 拥有

(需要指出:FRBR把第一组和第二组实体的关系限制到只有四个,我觉得这点很奇怪,但这就是FRBR的规定。我奇怪人们该怎样处理,比如一本书特定内容表达的插图者。当然,增加插图不能让它成为一部新的作品?)

 

FRBR的第四部分,第二组实体并没有包括在第一组实体的属性之中。换句话说,作品的属性不包括作品的创作者,单件的属性也不包括拥有者。

 

所以我很奇怪的在载体表现的属性中读到下面的话:

4.4.5 出版者/发行者

载体表现的出版者/发行者是载体表现上指名名称、对载体表现的出版、发行、发表或颁布负责的个人、集体或组织。一个载体表现可以与一个或多个出版者或发行者相关联。(所有FRBR的引文来自于王绍平等人翻译的简体中文翻译版)

 

既然第二组实体并不在第一组实体的属性之列,很明显出版者并非是个人或者团体的实体。但是第一组实体和第二组实体的关系是这样说的:

5.2.2 与个人与团体的关系

第二组实体(个人和团体)通过4种关系类型链接到第一组实体:将个人和团体链接到作品的“被……创作”关系;将同样两个实体链接到内容表达的“被……实现”关系;将它们链接到载体表现的“被……生产”关系;以及将它们链接到单件的“被……拥有”关系。

 

本质上,实体的定义和载体表现的属性之间这个明显的不一致和从载体表现上转写数据的实践有关:

 

粗看之下,本模型定义的某些属性似乎与模型中已经另外定义为实体并通过关系与所考察实体相联系的研究对象是重复的。譬如,载体表现的属性“责任说明”似乎平行反映了实体个人与团体以及将这些实体与该载体表现体现的作品和/或内容表达相联系的“责任”关系。然而定义为“责任说明”的属性直接与载体表现本身出现的标识信息相关,而与包含于该载体表现的作品与负责创作或实现该作品的个人和/或团体之间的关系不同。(4.1)

 

这句话说明,FRBR想象自己推行了实体关系的模型,但实际上,它并没有比我们当前的书目数据(它融合了撰写的资料、编目员提供的资料以及受控的标目)更加接近这个模型。

 

然后是第三组实体

 

这个比较容易解释,因为它非常容易:第三组实体(概念、实物、事件、地点)只能用作主题,比如:

因本次研究的需要,只有当地点是作品主题时(例如,地图或地图集,或旅游指南等的主题),才作为实体看待。

 

这就消除了任何把地点当作是“出版地”的想法。更不要说这组每一个实体的属性都非常少;实际上,它们都只有一个属性:

概念/实物/事件/地点的术语

 

结果

 

结果就是FRBR并没有给我们的书目数据一个真正的实体关系模型。这对于我们想要让图书馆数据朝着实体关系的方向上发展的人来说是很沮丧的,这也意味着,如果想到实现实体关系的模型,我们就要超越FRBR现有的内容,超越由RDA实现的FRBR的版本。我多少了解了这一点,但是从FRBR文献本身中得到确证,还是让我感到气馁。更沮丧的是,这个事实原本就摆在那里,但是却没发现。

 

我重读了一遍FRBR in RDF以及Scholarly Works Application Profile,他们每一个都对FRBR的概念作出了一些有趣的扩展,让FRBR更加接近实体关系的模型。在我看来,DC/RDA工作组也需要从FRBR出发才能实现目标。但是问题就是:我们能向前走多远,而且还需要和图书馆数据保持一致?

 

————

 

译者的话:下午重读了Diane I. Hillman在去年的一个ppt,感觉比第一次读能读懂的地方多了,虽然还是有很多读不懂的地方。正巧看到里面提到这Karen
Doyle的博客,近来就正好读到了这篇文章(当然还有很多其他的文章),下午理解能力有问题,所以粗粗的翻译了一遍。作者的意思似乎是:FRBR并不是万能的,虽然我很不愿意接受这个观点,但是不得不承认,FRBR(以及RDA)里面确实有很多有问题的地方,而且需要进一步学习。

 

也希望大家都能加入讨论。

 

090201:MARC 21 4XX/8XX字段的规定

去年,MARBIMARC21的维护机构)正式废止了MARC21440字段,并且在0810月更新的MARC21格式里做出相应修改。各方报道和讨论都已经很多了,我在这里提供我自己的汇总和理解。

主要修改如下:

1、废除440字段,440字段成为“废除”(obsolete)状态,根据MARC21的规定,废除状态的字段可以继续出现在数据中,因此无需删除。(但不同机构在这一点上有不同规定,见下文)

2490字段成为丛编说明(series statement)的唯一字段。指示符第一位仍然有01两个值,但是1的意义不再是“做不同形式的根查”,变成“在8XX字段,提供相应的丛编附加款目”。同时,该字段增加了3子字段,用来记录丛编的限定信息(受到了一些严厉的批评,因为需要不断维护)。

38XX成为了丛编附加款目的唯一字段,它同样增加了3子字段,而且因为490并非8XX的唯一入口,所以同时增加了x子字段,用来记录丛编的ISSN

4、之前的实践是:遇到丛编说明的,首先要判断丛编说明与丛编规范的形式是否有差别,如果没有差别做到440字段,如果有差别做到490字段。再根据是否有相对应的规范形式判断是490的指示符是什么,以及是否提供8XX字段提供检索。目前的流程跳过第一步,直接判断数据是否有相对应的规范形式:如果有相对应的规范形式,指示符为1,做8XX字段的附加款目,如果没有相对应的规范形式,指示符为0,不做8XX字段。

5、关于过往440字段的处理方法:LC的规定是完全保留之前的440字段,因为obsolete的字段可以保留;但是颠图书馆的规定则是,尽可能修改之前的440字段。


我本人对于LC的编目实践不甚了解,所以见到LC有一些09年的数据仍然使用440字段,所以很不能理解。但是,虽然时间尚短,LC很多预出版数据都已经明确遵从新的规则了(最重要的标志就是,490830完全相同)。