【翻译】MARC必须死掉

链接地址:http://www.libraryjournal.com/article/CA250046.html

作者:Roy Tennant

译者:Nalsi

————

MARC产生之时,披头士组合还刚刚成立,当时我们还穿着让人尴尬的衣服,梳着让人尴尬的发型。当时的电脑体积庞大,结构复杂,价格昂贵,我们谁也想不到,有一天我们家里会摆着一台电脑,甚或手上提着一台电脑。尽管时代本身并不一定让技术过时(过去40年里,木质铅笔有多少进步呢?),但是电脑标准的发展却突飞猛进。

MARC在某种程度上就是一种时代错误。它刚开始出现的时候,电脑的内存、存储工具以及计算能力都水平很低而且价格昂贵。但是,这些东西现在已经是无所不在而且非常便宜了。

Marc的时代

你看一条MARC数据就知道我是什么意思了。但是别太费心就好。只有两种人相信自己不用查一大堆资料就能看得懂MARC数据:少数顶尖的编目员或是烂醉之人。在MARC数据中,字段的意义并没有明白的标示出来,相反,它是用数字形式表示的,所以不熟悉这套复杂句法的人理解不了它们。但是这种不知所云的困惑(尽管烦人)却并不是MARC让我们遇到越来越多问题的原因。

MARC 的问题又多又严重,这就是为什么我们之中的一些人越来越确信,MARC已经不再有用。比如说Dick Miller的幻灯片:“XML和MARC:选择还是替代?”David Flanders在文章中也说:“MARC的刻板和内在的不规律开始给编目员和用户带来问题。如果把XML应用在书目描述上,MARC已经落后于当前对于书目描述标准的研究了。”

在这个专栏中,我用MARC指称几件相互关联的事清,其中包括MARC句法,MARC数据元素以及《英美编目条例》。这些事情相互关联的太厉害了,所以梳理的工作(这是必须被抛弃的想法)和从头再来至少是一样困难地。在下个月的专栏文章中,我将会通过研究放弃MARC的策略来仔细研究这个问题。现在,让我们来仔细观察几个具体的问题吧,这几个问题都汇聚了上述我们称之为MARC的标准。

粒度

MARC是一个复杂的标准,但是它却缺乏最基本的控制和平衡,也就不能保证在编目的时候实现合适的粒度(也就是描述单个元素的细微程度)。比如说,一本书的编者应当标目在700字段,用|e表明这个人是编者。但是编目机构通常都不采用|e这个子字段,因而人们只能猜测700字段的这个人到底是怎样的角色。

在许多情况下,人们只能通过参考题名字段才能得知编者的身份。这件事是因为MARC和AACR2在很大程度上专注于把编目卡片的格式转化成为电脑的格式。在题名的字段中,你会觉得只能找到一本书的题名,但是这个字段实际上存在着奇怪的附加物,比如说会有“edited and with an introduction by Peter Green”这样的内容出现在一个子字段之中。Peter Green编辑了这本书不应当掩藏在题名字段的一个子字段的字符串中。还有一个更加惊人的例子是,编目往往混淆了个人名称的名和姓。

可扩展性及语言

把我们的编目从卡片转移到电脑中是一项浩大的工程,而且还远没有完成。一些图书馆正在往这些数据中增加额外的信息,来丰富这些数据,比如说目次表。尽管把目次表放到MARC数据中是可能的(参见Blackwell以骇人听闻的细节描述了他的“目次表扩展服务”的计划),但这并不恰当。从根本上讲,MARC是平的,而目次表却是等级结构的。这在XML语言里却只是个小事情。(想要了解更多的MARC翻译成XML的信息,参见XMLMARC网站)

我甚至无法想像我们能够在MARC数据的哪里放下一本书的封面图像(或者是书封信息、评论),好让这些信息既容易让那些需要的人获得,又容易让那些不需要的人无视。

MARC至少提供了一些手段来处理多字体的资源(比如说一本书有中文的题名以及翻译过来或者转写的题名),但是MARC操作的方式让它很难用软件来处理。比如说,相关题名之间的关系在MARC中就是个问题。关于这些问题的更多信息可以参考Moving from MARC to XML网站。

技术的边缘化

MARC从来都是一个神秘的标准。没有其它任何一种职业使用MARC或者类似于它的东西。如果我们去采购软件来处理这些数据,我们只能局限在图书馆卖主的小市场环境中。对于这些人来说,他们设计的系统必须能够用MARC格式导入/导出数据。

但是更广阔的信息产业都在向XML转移,把它作为建立、交换信息的方式。这种转换并不意味着我们放弃当前的系统,转而使用任何基于XML的搜索工具。但是如果我们重新设计我们的书目记录标准,让这些标准使用XML格式,卖主会发现用何种方式生产我们需要的产品既便宜、又方便。

真正的原因

图书馆存在是为了满足当前以及未来用户社区的需求。为了做好这一点,图书馆需要使用能够提供的最好的技术。随着网络、XML、可移动计算的兴起以及其他技术的发展,图书馆能够更加灵活,能够更加迅捷的作出反应,用更加激动人心的方式为他们的用户提供服务。当然图书馆也可以不这样做。如果图书馆坚持过时的标准,他们会发现,想要像他们所期望的那样为他们的用户提供服务会变得越来越困难。

为了让标准既足够满足当前的需要,也足够灵活来提供新的机会,我们需要从书目记录的要求开始(比如,你可以看一下FRBR),继而发明出新的编目标准,来提供力量以及灵活性。这显然是一个巨大的工作,而且需要国会图书馆以及OCLC这样的机构参与进来。我们在30年前做了一次,现在,我们能够再做一次。MARC是在披头士的时代诞生的,现在已经到了展示出漫长而曲折的道路的时候了。

————

译者的话:看的时候才发现,这篇文章竟然已经7年了,7年之中,我们又有多少进步呢?

【翻译】FRBR中的功能

链接地址:http://celeripedean.wordpress.com/2009/04/04/function-in-the-fuctional-requirements-for-bibliographic-records/

作者:Jennifer Eustis

译者:Nalsi

————

直到最近,FRBR这个题目,尤其是题目里的“功能”这个词都没能吸引我,让我觉得不是信息组织和编目工作的视角上的什么重要变化。我最近浏览了FRBR的
很多讨论,于是我改变了看法。我读到关于FRBR的模型是怎样不同于AACR2背后所隐含的理论模型的讨论。AACR2这个内容标准依赖于强制性的格式,FRBR有别于斯,它构建于功能之上。

 

第一次考虑起FRBR和AACR2背后所隐含的理论之间差别的时候,我把问题简单的看作是格式与功能之间的差别。但是我就FRBR提出了几个简单的问题,重新评估了这种两分法。

 

我的第一个问题关注功能以及功能对FRBR意味着什么。根据用户的不同任务,书目数据也承担几种不同的功能。请记住,根据FRBR,用户涵盖的范围很广,从
图书馆的赞助者到图书馆员。FRBR界定的用户任务包括:找到资源、识别一种特定的资源,选择资源,获取资源。我用的“资源”这个词的含义非常宽泛,资源
并不仅仅意味着一个单件,它还包括作品、内容表达或者载体表现(FRBR的第一组实体)。我们知道这点之后,书目数据就必须能够起到功能,来让读者能够轻
易找到、识别、选择以及/或者获取到资源。换句话说,书目数据必须具备最基本的功能性。这需要书目记录以更自然的语言来表达,以便任何用户都能够理解记录
的背景。而它的背景也处于更加复杂的相连数据(linked
data)之中,好让用户能够了解一条记录和其他相关资源之间的联系。书目数据需要更好的预估读者怎样看待并且使用信息,尤其是在数字的环境中,这把我们
带回到相连数据,以及数据和信息之间富有意义的关系上。

 

我的第二个问题关注的是功能性是否真的能够让它自己和格式区分开。如果用户需要找到一个特定格式的资源,书目数据应该具备最低等级的功能性,好向用户提供该
信息。实际上FRBR的解释是,书目数据所起到的功能是基于许多种文献的。原因之一就是我们都知道,用户想要找到不同格式所呈现的不同类型的资源。


本研究还力争在文献、载体与格式所覆盖的范围方面完整无缺。研究组查阅了各种资料,这些资料确认的数据涉及文字、地图、视听、图形和立体资料;涉及纸质、胶片、磁带与光学载体;还涉及声学、电学、数字与光学记录方式。(第4页)

 

在这种意义上,功能超过格式,因为它提出了信息组织的概念等级。但是这二者并没有分开,格式是基于用户任务的书目记录功能的表达。

 

因此,区分格式和功能是在误导我们。实际上,视角的变化在于单件的编目以及组织语境化以及相联系的数据之间的差别。FRBR引入了working
with data的观念,这种观念适合于数据记录的关系的框架,因为无论是满足任何用户任务,它都起到了核心的作用。

 

如果数据能够和其他数据产生越来越多的关联,这就能够帮助我们丰富继而改善书目数据的功能性。正是在这个意义上,William
Denton和Jodi Schneider谈到了FRBR实体之间的强关系和弱关系。这也把我们导向了Tim
Berners-Lee所讨论的“关联数据”的理念。