写在论文边上(一):几种“边缘”的MARC格式

“边缘”是我想到下面要介绍的几种机读格式的第一反应,但是我深知这个词很不好甚至于可能是不对的,可是我暂时也想不到更好的说法。Kokabi Mortaza曾经在1990年代中期写过连续四篇介绍MARC历史的论文(对于我来说这当然是一个“经典”的文本),在论文里她(我不太确定是男生还是女生)用了“MARC-like”这个词,不过翻译成中文也是怪怪的。

问题在于,什么是MARC格式?当然所有人都知道MARC就是MAchine-Readable Catalog的缩写,而且MARC格式符合ISO2709的标准(这个标准规定的是格式的数据结构),比如Wikipedia上面就是这么说的。可是,显然任何一个概念都存在边缘地带,下面要介绍的三种格式:MAB、CCF和Mekof-2都遵循ISO2709,为什么它们不是真正意义上的“MARC格式”?我必须承认,我不太懂。

[只是我个人的猜想,对于某一种MARC格式来说,更重要的是它从哪来的,而不是它遵循何种规范。至少上述三种格式都并非来自于其他已有的MARC格式——比如LC/USMARC、BNB/UKMARC或者UNIMARC。]

总之,作为一种习惯性的看法,这三种格式确实不在“MARC俱乐部”之列。接下来就是对这三种格式的简单介绍。

————————

这三种格式在图书馆领域里名气最大的可能就是德国曾经的机读书目格式MAB了,MAB是Maschinelles Austauschformat für Bibliotheken的缩写,直译过来也就是“图书馆自动化交换格式”。MAB 1格式是1960年代晚期开始开发的(作为背景:1968年,英美两国开发出了各自的MARC II格式),1972年正式出版。作为书目格式的后进国家,遵循之前的惯例是最简单的做法,但对于德国来说,遵循英美的格式存在很大的问题。最大的障碍来自于编目规则的差别(著名的“两种编目体系”)——德国当时使用的是Regeln
fur die alphabetische Katalogisierung(RAK,著录规则)和Regeln fur den Schlagwortkatalog(RSWK,主题编目规则);另一个问题是MARC II中缺乏等级的数据结构(UK MARC II比LC MARC II有更好的对等级的表达,但是仍然不够?);最后一个问题就是德国不满意MARC II中子字段的设置。

实际推行的MAB I具有以下几个特点:首先就是严重依赖于编目规则;其次是可以识别出不同种类的数据(比如说多卷册图书和其中的某一卷,并且使用连接技术——文献普遍认为MAB的这一特点是后来UNIMARC的前驱);再者就是这个格式以字段为基础,几乎不使用子字段。这个格式遵循的是德国的DIN1506规范,后者又遵循ISO2709规范(但存在一些差别)。1977年德国开始用这种格式交换数据磁带。

在1992年(?),MAB 1发展成为MAB 2。根据德国国家图书馆网站(2009年3月更新),MAB 2包含书目数据、个人名称、团体机构名称、主题词和本地数据(相当于MARC21的社区格式?)等五种格式,并且计划开发地址和图书馆数据(address and library data)以及分类和记数数据(classification and notation data)两种格式。

当然关于这种格式最重要的一件事就是,德奥两国从2001年开始就在讨论放弃MAB格式,转而使用MARC 21,并在2004年正式作出决定。关于这件事可以参见精灵老师的博文以及德国国家图书馆的专题页面,内容都很丰富(连同放弃使用之前的编目规则,转而使用AACR2——09.11.14更新,Catalogablog报道,MARC21书目、规范、馆藏三种格式已经翻译成德文)。

————————

第二种要介绍的格式是东欧的经互会(COMECON)参与国开发的一种格式:MEKOFMEzdunarodnyj
KOmmunikadvnyj Format),直译为“国际交换格式”。具体而言,它是由位于莫斯科的国际科学技术信息中心(International Centre of Scientific and Technical Information, ICSTI)开发的。这个格式有两个版本,MEKOF-1和-2,前者遵循ICSTI和ISO2709相似的一种规范。后者采用一种比ISO2709更加复杂的结构(比如更复杂的等级结构),人们普遍认为后一种格式开发得更加完善。

这种格式在俄罗斯一直使用到1990年代。(1995年,俄罗斯开始基于UNIMARC开发新的格式。)

————————

CCF(Common Communication Format)是由联合国教科文组织开发的。设计这个格式主要不是面向图书馆社区的需求,它主要是为了解决second services(又是一个我不太明白的词)的目录需求。1978年UNESCO成立了特别小组来开发一种“通用交换数据”,小组包含了众多相关的国际组织的成员,比如IFLA、前面提到的MEKOF和ISO等等。小组决定,新的格式应当兼容当时流行的各种格式,并且应该遵照ISO2709标准。设计CCF主要参考了当时的下述六种格式:

— the Reference Manual [Martin, 1974;
Simmons & Hopkinson, 1992],
— UNIMARC [IFLA, 1987],
— ISDS Manual [ISDS, 1983],
— MEKOF-2 [ICSTI, 1979],
— ASIDIC/EUSIDIC/ICSU-AB/NFAIS Interchange Specifications [ASIDIC,
1978], and
— the USSR-US Common Communication Format [USSR, 1978].

根据这六种格式化约出CCF包含的最小的数据元素。CCF和UNIMARC有些相似,它并不是作为某种具体的格式出现的,它的目的就是为了交换书目数据。作为一种交换格式,它的最大的特点表现为数据元素很简单,而且兼顾各种书目格式的数据结构。

这个格式最终在1984年出版。1988年出版第二版。1992年,CCF格式析为书目信息(bibliographic information)和事实信息(factual information)两部分出版。