【翻译】思考链接

原文地址:http://kcoyle.blogspot.com/2008/09/thinking-about-linking.html

作者:Karen Coyle

译者:Nalsi

————

我前一篇日志谈到了“可提供性”(affordances),我总结出两种元数据的连接,内在元数据连接和交互元数据连接。我感觉这里非常混乱(其中一些混乱就是本人造成的),所以我决定在这里分解一下头脑中的垃圾,在这个领域内开始一次新的对话,看看我们是否能够得出一些结论。

 

根据RDA所包含的FRBR,存在一种“基于关系/实体的模型”(relational/object-oriented
model
)。我对这个东西有一些基本的质疑,因为我觉得基于关系的模型和基于实体的模型是非常不同的。这个关系/实体的概念会让我愣下神——一些东西听上去是有意义的,但是我无法理解它的意义。所以我决定把它看作是在一条书目数据内部的一组关系。

 

FRBR/RDA的模型中存在着实体:作品、内容表达、载体表现、单价(WEMI),还有个人、团体、概念、实物、事件和地点。有趣之处是所有这些实体都不是单独存在的。这是一个互相依赖的实体群,不是单独的数据的集合。这让我们难以想象,因为今天的模型实际上是由单独的书目数据和规范数据(包括名称和主体)组成的。但是书目数据包含来自规范数据的标目,所以书目数据本身是完整的,这个事实扭曲了我们的看法。规范数据,即便是名称规范数据,实际上是受控词汇表。这些词汇表有助于书目描述,这意味着,我们需要找到一种方式,实体本身以及实体之间的连接都能得到表达。

 

而且,我们需要决定数据的定义是什么。一个人要描述一部作品,他必须描述其创造者,那么看上去作品个人(或者团体)都必须是同一条数据的组成部分。否则,这条数据就不能独立存在。所以,数据中包含了个人意味着什么,而这个实体又出现在哪里呢?或者,一个不确定的连接指向这个(假想的)实体是否足以让这条书目数据变得完整?换言之,如果这条书目数据(它是作品的一部分)有一个连接指向一个存在于别处的个人,这条书目数据是否完整?

 

注:我重新读了FRBRFRANAR中论述实体个人的部分。FRBR中只在个人这一部分只提到“人名标目”,而FRANAR的实体个人则有许多其他的元素。这和我们对于个人名称字段和个人规范数据的分别是相同的。

 

书目实体之间还存在其它类型的关系。在我看来,一共有两种关系:独立的和从属的。从属的关系出现在WEMI实体之间,这些实体本身都不是完整的。实际上,我把WEMI看成是存在相互依赖的各个部分的单一实体。(我承认,这是当前图书馆编目的看法,一条扁平的数据包含了同时存在于单一实物之上的所有书目等级的信息)

 

需要指出的是,在图书馆编目数据的意义上我把WEMI看作是单一的实体。这个实体的不同等级对于它自身来说是有意义的。比如说,一部文学批评通常指的是一部作品,或者是内容表达。出版商或者书店的广告提到的是载体表现。图书馆识别并流通单件,古书商人处理的基本上都是单件。

 

独立的关系即不同书目实体之间的关系:

作品作品:两部作品相互映射或相互参照(被引用,引用,一部作品根据另一部作品而来,比如戏仿或续编)

整体部分:一部作品包含在另一部作品之中(文章和杂志,章节和书,卷册和丛编)

单件单件:所有类型的复制

 

在更大的程度上,这些关系都可以表达为属性,isCreatorOf, isExpressionOf,
isCitedBy
。但是存在两种关系的念头在我脑海中挥之不去:如果在元数据的记录中没有这种关系就会出现空白的关系,以及书目项目之间的关系。我惊讶于复杂实体内部及其之间的连接。比如,请想象一条书目数据连接了储存在SKOS格式中的主题词汇。这条SKOS记录中有许多字段都是关于preferred and alternate
headings
(忘了规范的翻译是什么了)、概念、向广义词语和狭义词语的连接,以及所以这些在各种语言中的表现形式的。如果书目记录中的属性具有“该词汇在法语中的定义”又会如何呢?它会连接到哪里?或者它只能够指向作为整体的词汇表?

 

艾柯论图书馆

Umberto
Eco是本人最喜欢的作家之一,近日重读他写的一本随笔集(是在报纸上发表的一系列小品的集合)
《带着鲑鱼去旅行》,内中讽刺到了很多东西,图书馆也未能幸免于难。

 

看完这本书很是开心也颇有收获,特地把那篇文章的全文打了出来,引大家一笑,并希望能带来一些思考。

 

————


《天下图书馆一般黑》

一、各类图书目录都必须分开存放,越分散越好。必须尽心尽力将书籍目录与期刊目录分开,这两种目录都必须远离主题分类目录;同样的,新到图书必须与旧书远远分开。可能的话,这两种目录的字句拼法最好不一样。例如,旧有图书里的“poama”一字,新到图书应拼成“peama”。新书里的柴科夫斯基应按照国会图书系统拼写成“Chaikovski”,而就有目录仍循旧拼法“Tchaikovsky”。

二、主题应由图书馆管理员决定。书的归类绝对不可迎合版权页上显示的内容主题类别。

三、图书编号应无法解读,而且要尽可能复杂,以便任何人填写借书单时,最后一行的号码都填不下,因此假设它们不重要。然后柜台服务员会把单子退还给他,警告他一定得照规矩填写。

四、申请借阅到取得书籍的时间,拖得越久越好。

五、每次只出借一本书。

六、借阅单按照规定填妥后,由柜台人员借出的书,不准带进参考室阅读,然后使用者就必须把工作拆成两部分:一半是阅读,一半用来查参考书。图书馆必须打击一切混淆两者的人以及同时阅读数本书的企图,免得读者患斜眼。

七、在可能的范围之内,尽量不提供复印机;若不幸这种机器业已存在,使用它也应极端耗时费力,收费应当比附近任何一家复印小店都贵,而且每次最多只许复印两三张。

八、图书馆员应该把读者视为浪费宝贵光阴(要不然馆员本来可以专心工作)的无赖,而且个个都可能是小偷。

九、参考室管理员的办公室必须是攻不破的。

十、刁难借书行为。

十一、绝不协助民众向其他图书馆代办借阅,或最起码得花好几个月。不管如何,最理想的流程应是确保读者无从得知其他图书馆的藏书内容。

十二、基于这一政策,偷书应该非常容易。

十三、开放时间必须与当地上班时间完全重叠,这乃是基于先见之明,与工会与商会负责人磋商的结果;周六、周日、晚间与午餐时间都闭馆,自是不在话下。图书馆最大的敌人就是打工的学生;它最好的朋友是托马斯·杰弗逊之类,自备大量私人藏书不需要上公立图书馆的人(但他们死后,却很可能把所有的书都捐给图书馆)。

十四、任何情况下,图书馆内部都绝无可能找到提供饮食处;同时,若不先把借用的书籍全部归还,也绝无可能离开图书馆去觅食,因此,一杯咖啡下肚后,读书人又得重填申请单,重复借书的过程。

十五、任何人在任何一天,都绝无可能找到前一天使用过的书。

十六、绝无可能得知目前借出的书是在谁的手上。

十七、若有可能,不设厕所。

十八、理想状况下,民工应该进不了图书馆。如果不小心被他闯进来,而且根据1789年的原则,据理力争自己那份并未得到社会大众认同的权利,他也绝无可能获准进入书库圣殿——充其量只允许很快地看一眼参考书架。

机密附注:所有馆员都必须有某种身体残疾,因为国家机关有义务为残障公民提供工作机会(消防队正考虑跟进采用这一原则)。说得更明白点,图书馆员必须跛脚,以延长接过借书单,走进地下书库,再走回来的时间。对于有必要借助梯子,爬到离地8英尺高的书架上取书的独臂人员,应加装义肢以考虑安全。双臂都残缺的工作人员应用牙齿递交借阅的图书(图书馆规则不主张递交超过8开大的书)。

 

————

 

P.S.
:这篇文章的写作时间是在1990年代初,自然你可以看到这篇文章里的许多东西现在的中国已经是看不到了,比如你需要填索书单然后图书管理员帮你取书(虽然绝大多数图书馆的库本依然是这样),或者你需要查卡片目录。算是对二楼的回应,一些事情无须我们去改变自然也就改变了。可是另一些事情却依然根深蒂固的存在着,比如图书馆工作人员的素质偏低;或者第一条(因为本人是编目员),标目的选取。

【翻译】拥抱无序

原地址:http://managemetadata.org/blog/2009/02/25/embrace-the-chaos/

作者:Diane Hillman

译者:Nalsi

————

我本周参加了code4lib会议,我写下这篇文章就是为了让我明年还能记得,我真的不在乎……

 

我不在乎最新的分面搜索。我不在乎最新的开源OPAC。我不在乎最新的开源图书馆系统。我不在乎系统的升级和软件的样品。我不在乎API/标准/零售/LC/OCLC的攻击。我也不在乎重新发明20世纪的标准,这让图书馆编目员心神不宁(毕竟,这是他们的工作)。

 

来到这里的人都是伟大的,我在乎他们每一个人,也在乎他们的团体,我在性格里就是亲近这些图书馆的“奇客”(geeks),而且这个会议就是为了筛掉其他所有人。所以我在这里很好,但是这次会议提供的信息对我一点用处都没有,真是让我生气。而且尽管我非常喜欢这些家伙,但是用互联网接力聊天(IRC)的方式发表评论(这本应当让所有人,包括报告人都能看到)和说笑话,难免让人觉得难以融入。对于新来的人来说,不管人们多么热情,他们仍然会觉得困难。

 

我想站起来嚷嚷一句:“伙计们,听着。世界在前进。我们要跟上!”我觉得我们不需要非得进入图书馆,除非是过去10年里的会议。我最近一年都没用过图书馆的OPAC或者图书馆系统,除非是我要研究系统本身。我曾经登录到一座大学图书馆的网站,为了下载订阅才能获得的期刊上的文章,但是我后来发现这些文章在Google上就有,而且最近这个网站还老登陆不上去。

 

这次会议的许多发言和讨论都是关于替代性方案的:全文和元数据,编目员创建的元数据和用户创建的元数据,开源软件和商业软件,GoogleOPAC,数据分配标准A和标准BMARC和其他一切。人们有一种看法是,互操作性意味着每个人都不得不在一些层面上达成一致。但是真实的情况是,每个人都需要适应这个观点:所有人都支持几个标准和数据格式的理想世界是我们曾经生活的世界,或者我们想象中的世界,但是现在已经没有了,而且它也不会再回来了。

 

我们现在的所有就是无序。许多许多人非常努力的工作试图控制变得越来越混乱的数据以及越来越不可预测的用户行为。他们试图控制用户,甚至是专家,这些人越来越多地使用Google或者YouTube来获取信息。他们试图知道怎样来处理不断增加的数字馆藏、不断下降的用户满意度以及不断减少的预算。

 

让它去吧。无序是好的。让你的系统保持开放和灵活。看。听。与Google整合而不是和它相抗争。整合社会网络中的资源。分享一切。聚合。看。听。

 

拥抱。

————

译者的话:前一段受到精灵老师的推荐读了《新数字秩序的革命》,然后又看到Keven老师对于未来规范控制的见解。我觉得Keven老师的一句话是特别正确的:无序只是另一种层面上的秩序。关键是我们怎样找到它/它们。

【翻译】FRBR第二组和第三组实体的怪异之处

来源:http://kcoyle.blogspot.com/2008/12/frbr-and-group-2-3-oddities.html

作者:Karen Coyle

译者:Nalsi

————

你现在或许已经认识到了,只要我发现一些新问题(至少,对于我的新问题),我经常会转回到FRBR。或许因为我不是个编目员,看上去我之前阅读FRBR漏掉了一些核心的概念。这也许就是我和一些有丰富经验的编目员之间对FRBR理解不同的原因了。

 

这次,我是在思考实体是怎样用于主题关系的。但是在我得出结论之前,总是有出版者跳出来折磨我。

 

FRBRRDA中的创作者和出版者

 

第二组实体和第一组实体之间的关系也就是所谓的“责任关系”。下表显示了两个第二组(G2)的实体:个人和团体是怎样和第一组实体产生关联的:

作品 由G2 创造

内容表达 由G2 实现

载体表现 由G2 生产

单件 由 G2 拥有

(需要指出:FRBR把第一组和第二组实体的关系限制到只有四个,我觉得这点很奇怪,但这就是FRBR的规定。我奇怪人们该怎样处理,比如一本书特定内容表达的插图者。当然,增加插图不能让它成为一部新的作品?)

 

FRBR的第四部分,第二组实体并没有包括在第一组实体的属性之中。换句话说,作品的属性不包括作品的创作者,单件的属性也不包括拥有者。

 

所以我很奇怪的在载体表现的属性中读到下面的话:

4.4.5 出版者/发行者

载体表现的出版者/发行者是载体表现上指名名称、对载体表现的出版、发行、发表或颁布负责的个人、集体或组织。一个载体表现可以与一个或多个出版者或发行者相关联。(所有FRBR的引文来自于王绍平等人翻译的简体中文翻译版)

 

既然第二组实体并不在第一组实体的属性之列,很明显出版者并非是个人或者团体的实体。但是第一组实体和第二组实体的关系是这样说的:

5.2.2 与个人与团体的关系

第二组实体(个人和团体)通过4种关系类型链接到第一组实体:将个人和团体链接到作品的“被……创作”关系;将同样两个实体链接到内容表达的“被……实现”关系;将它们链接到载体表现的“被……生产”关系;以及将它们链接到单件的“被……拥有”关系。

 

本质上,实体的定义和载体表现的属性之间这个明显的不一致和从载体表现上转写数据的实践有关:

 

粗看之下,本模型定义的某些属性似乎与模型中已经另外定义为实体并通过关系与所考察实体相联系的研究对象是重复的。譬如,载体表现的属性“责任说明”似乎平行反映了实体个人与团体以及将这些实体与该载体表现体现的作品和/或内容表达相联系的“责任”关系。然而定义为“责任说明”的属性直接与载体表现本身出现的标识信息相关,而与包含于该载体表现的作品与负责创作或实现该作品的个人和/或团体之间的关系不同。(4.1)

 

这句话说明,FRBR想象自己推行了实体关系的模型,但实际上,它并没有比我们当前的书目数据(它融合了撰写的资料、编目员提供的资料以及受控的标目)更加接近这个模型。

 

然后是第三组实体

 

这个比较容易解释,因为它非常容易:第三组实体(概念、实物、事件、地点)只能用作主题,比如:

因本次研究的需要,只有当地点是作品主题时(例如,地图或地图集,或旅游指南等的主题),才作为实体看待。

 

这就消除了任何把地点当作是“出版地”的想法。更不要说这组每一个实体的属性都非常少;实际上,它们都只有一个属性:

概念/实物/事件/地点的术语

 

结果

 

结果就是FRBR并没有给我们的书目数据一个真正的实体关系模型。这对于我们想要让图书馆数据朝着实体关系的方向上发展的人来说是很沮丧的,这也意味着,如果想到实现实体关系的模型,我们就要超越FRBR现有的内容,超越由RDA实现的FRBR的版本。我多少了解了这一点,但是从FRBR文献本身中得到确证,还是让我感到气馁。更沮丧的是,这个事实原本就摆在那里,但是却没发现。

 

我重读了一遍FRBR in RDF以及Scholarly Works Application Profile,他们每一个都对FRBR的概念作出了一些有趣的扩展,让FRBR更加接近实体关系的模型。在我看来,DC/RDA工作组也需要从FRBR出发才能实现目标。但是问题就是:我们能向前走多远,而且还需要和图书馆数据保持一致?

 

————

 

译者的话:下午重读了Diane I. Hillman在去年的一个ppt,感觉比第一次读能读懂的地方多了,虽然还是有很多读不懂的地方。正巧看到里面提到这Karen
Doyle的博客,近来就正好读到了这篇文章(当然还有很多其他的文章),下午理解能力有问题,所以粗粗的翻译了一遍。作者的意思似乎是:FRBR并不是万能的,虽然我很不愿意接受这个观点,但是不得不承认,FRBR(以及RDA)里面确实有很多有问题的地方,而且需要进一步学习。

 

也希望大家都能加入讨论。