RDA中的主题:ALA/ALCTS/CaMMS/主题分析委员会讨论论文笔记

最近正好看到代表ALA立场的ALCTS/CaMMS主题分析委员会(这个委员会的现任主席是曾蕾老师的同事Athena Salaba教授)关于“RDA中的主题”的讨论论文,这篇论文最后的修改时间是2013年7月11日,可以看作是ALA对于这个RDA中仍然悬而未决的大问题的一个最新的回应。

以下是本人对这篇论文的一些笔记,不过所有内容以原文为准,所有的术语的翻译都以即将出版的RDA中文译本为准(本文中尽量加上了对应的英文术语):

1、RDA中主题的总体方式:ALA建议RDA提供关于主题的概述,并且提供核心实体、属性、关系的定义,好让主题部分能够整合到RDA总体的模型中。

2、模型的选择:ALA建议RDA采用FRSAD的模型而不是FRBR的第三组模型(参见推荐#5:ALA建议使用FRSAD中“Thema”这个单一实体表示RDA中的主题词,把FRSAD中的“Nomen”实体作为“Thema”的属性。FRBR中的第三组实体不作为RDA中的主题实体看待,因为这样更加灵活)。并且在RDA的导论章节解释RDA和FRSAD模型的整合。

3、术语:ALA建议使用“Subject”和“Name of Subject”取代“Thema”和“Nomen”两个术语。

4、用户任务:ALA建议在RDA 0.0中记录FRSAD的用户任务。建议JSC把FRSAD中“发现”(“Exploration”)的用户任务扩展到面向FRBR第一组和第二组实体。

5、主题之间的主要关系:ALA暂时接受FR模型中“主题关系(其中包括“has as subject”和“is subject of”)只存在于‘作品’和‘Thema’之间”的设定。(因为现实中存在主题和内容表达的对应关系,以及可能的主题和载体表现/单件的对应关系,但是需要判定RDA主题的用例才能决定这件事)。

6、主题和形式:FRSAD中的主题属性只包括作品的知识属性(aboutness),但是并不包括作品的形式和类型。ALA建议JSC推动FRBR评估小组(FRBR Review Group)把形式/类型开发为FR模型的扩展。ALA还建议JSC表明其愿意接受代表提出的关于这个问题的提案的立场——不管这些提案最后会产生哪些行动。

7、RDA中的主题章节:ALA建议删除现在RDA中所有预留的主题章节,并且建议采用如下章节:

Section 4. Recording Attributes of Subjects
Chapter 12. General Guidelines on Recording Attributes of Subjects
Chapter 13. Identifying Subjects (上述两个章节可以被合并)
Section 7. Recording Relationships to Subjects
Chapter 23. General Guidelines on Recording the Subject of a Work
Section 10. Recording Relationships between Subjects
Chapter 33. General Guidelines on Recording Relationships between Subjects
Appendix L. Relationship Designators: Relationships between Subjects (可能并不需要这些关系指示符,主题指示符可以在每个主题系统里被设定)

8、事件:ALA建议在记录主题的属性和关系的总体规则中加入“事件作为主题标目”(目前是RDA预留的15和36章)的指南。记录“事件作为团体”的属性和关系保留在11和32章。(理由:因为不同主题系统处理事件的方式不同,RDA不应该进行任何限制。)

9、地点:ALA建议现在的第16章“识别地点”的内容应该被保留,但是应该考虑把这一部分内容转移到第11章“识别团体”。(理由:现在记录地点的规则局限于地点作为司法管辖单位,而且是主要用于命名政府和政府机构。把这部分内容转移到第11章可以让任何记录“地点作为主题”的规则出现在关于主题属性和关系的总体的指南中。)

10、主题实体的属性:ALA建议“Name of Subject” 在RDA中作为“Subject”的属性来处理;而“Nomen”在FRSAD中的属性作为RDA中“Name of Subject”的属性来处理。这将是RDA第一次定义属性的属性(但是委员会在这种情况下这是成立的)。ALA建议“主题的优先题名”(Preferred Name of Subject)和“主题的变异题名”(Variant Name of Subject)作为“主题的题名”(Name of Subject)元素的子类型来处理,以便和RDA其他地方对名称的处理保持一致。

ALA建议JSC研究哪些FRSAD的属性应该被包括到RDA中。ALA建议“主题的类别”(Type of Subject)、“主题的优先题名”、以及“元数据方案”(Scheme)应该成为RDA的核心元素。而“主题的变异题名”、“主题的识别符”(Identifier of Subject)、“范围附注”(Scope Note)、“参考信息源”(Source Consulted)以及“识别状态”(Status of Identification)作为非核心元素。

ALA认为现在FRSAD中“Nomen”的许多属性都是“关于数据的数据”(元数据?),因而ALA建议JSC未来把这些元数据整合到RDA数据模型中。

11、检索点:ALA指出RDA识别实体的章节包含了创建规范和附加检索点的部分,这对于主题这个实体来说也是适用的。但是有许多分面的主体系统需要创建各个面的预组的主题词,在这种情况下,整体的字符串可以作为检索点,而单个的面可以作为首要名称。但是这种实践并不是通行的,而且在RDA里进行这样的区分也未必是合适的,因而这个问题需要JSC考虑。

12、关系:对于FRSAD里面的“Thema to Thema”关系,ALA建议RDA用一种非常概括的方式来处理这种关系,以便不会对任何主题系统产生不必要的限制。ALA在考虑把通用的主题词表关系(比如:broader term、narrower term、related term)包括进来,但是即便是这样也可能会对有不同结构和内容的主题系统产生不必要的限制。

参考资料:ALA/ALCTS/CaMMS/Subject Analysis Committee: Treatment of Subjects in RDA: A Discussion Paper

【翻译】为什么我们那么着魔于FRBR的实体

http://dilettantes.code4lib.org/blog/2011/11/why-do-we-obsess-over-frbr-entities/

作者:Ross Singer

译者:Nalsi

_

自从FRBR面世以来,关于如何推行这个模型的问题,人们一直争论不休、意见各异。作品和内容表达的边界是一个有争议的问题,就更不要说改编、复制、衍生、翻译和这类问题的混乱了。这件事很复杂而且正把我们拖到水中,因而我们虔诚的创造出了基于FRBR的数据,它却只会让争论和意见的分疏变得越来越严重。

我们的看法是:(绝大多数)我们的做法只是浪费时间。

解释一下,我不是想要埋葬FRBR,我只是觉得我们应该不再那么关注(第一组)实体,而是去思考我们为什么对FRBR的实体模型感兴趣(提示:事物之间的关系)。

我们探索我们的元数据如何在关联数据/RDF模型下工作,但人们存在一种过分的担心,即我们的遗产数据(MARC21/AACR2)缺乏足够的可信度来采用FRBR模型。我们知道书目数据里通常有基本完整的载体表现,一些作品(创作者、贡献者和主题)和一点内容表达(语种、媒体)。RDF构建于开放世界的假设之上,因而我们不需要知道作品和内容表达的一切就能识别它们,并且对它们进行陈述。(当然,我们对它们知道越少,之后重新结合起它们也就更难,但这是另一个问题了)

作为案例,我们来看下面这条MARC记录。

000 01209cam a2200313 i 450
001 344918
005 20090410163635.0
008 760528s1976 nyua j 001 0 eng
906 __ |a 7 |b cbc |c orignew |d 1 |e ocip |f 19 |g y-gencatlg
010 __ |a 76019078
020 __ |a 0671328026 (lib. bdg.) : |c $6.64
035 __ |9 (DLC) 76019078
040 __ |a DLC |c DLC |d DLC
042 __ |a lcac
043 __ |a n-us-la
050 00 |a E356.N5 |b L86
082 00 |a 973.5/239/0924
100 1_ |a Lyons, Grant.
245 10 |a Andy Jackson and the battles for New Orleans / |c by Grant Lyons ; illustrated by Paul Frame.
260 __ |a New York : |b J. Messner, |c c1976.
300 __ |a 96 p. : |b ill. ; |c 22 cm.
500 __ |a Includes index.
520 __ |a Traces the events preceding and during the Battle of New Orleans where Andrew Jackson led the American troops to a decisive victory over the British.
650 _0 |a New Orleans, Battle of, New Orleans, La., 1815 |v Juvenile literature.
600 10 |a Jackson, Andrew, |d 1767-1845 |x Juvenile literature.
650 _1 |a New Orleans, Battle of, New Orleans, La., 1815.
600 11 |a Jackson, Andrew, |d 1767-1845.
700 1_ |a Frame, Paul, |d 1913-1994.
991 __ |b c-GenColl |h E356.N5 |i L86 |t Copy 1 |w BOOKS

现在,让我们抽取RDF形式的FRBR实体:

@prefix dcterms: <http://purl.org/dc/terms/> .
@prefix frbr: <http://vocab.org/frbr/core#> .
@prefix rdagr1: <http://RDVocab.info/Elements/> .
@prefix bibo: <http://purl.org/ontology/bibo/> .

<http://lccn.loc.gov/76019078>
a frbr:Manifestation;
bibo:isbn “0671328026″;
bibo:lccn “76019078″;
bibo:pages “96″;
dcterms:extent “22 cm.”;
rdagr1:statementOfResponsibility “by Grant Lyons ; illustrated by Paul Frame”;
frbr:embodimentOf _:expression1 .

_:expression1
a frbr:Expression;
dcterms:language <http://id.loc.gov/vocabulary/languages/eng>;
dcterms:format “text”;
frbr:embodiment <http://lccn.loc.gov/76019078>;
frbr:realizationOf _:work1 .

_:work1
a frbr:Work;
dcterms:title “Andy Jackson and the battles for New Orleans”;
dcterms:creator <http://viaf.org/viaf/48006744>;
dcterms:subject <http://id.loc.gov/authorities/subjects/sh85091385>, <http://id.loc.gov/authorities/names/n79088888>;
frbr:realization _:expression .

我漏掉了很多东西,一则是为了简便,二则是我不确定它们属于哪个实体(比如,版权日期?贡献者——在本书中是插图作家?)而且我用的是Ian Davis对于RDF形式的FRBR的原始解释,因为我不知道怎样在RDF词汇表中表达“_:ex isExpressionOf _:wo”这样的关系,而且如果我甚至能够找到IFLA的FRBR词汇表的话,URI就会变得太难懂,没有人能够理解我想说什么了。

但是这个小小的练习出现了好几个问题。一方面,在资源内散布属性会自动增加构建检索来找到它的复杂性(尽管无论你如何分割它,你都得有一些连接点:比如说作者应当是它自己的资源)。它还要求所有的实体都必须出现,否则链条就断了。如果我们不要内容表达,我们就没办法把载体表现连接到作品。另一个引人注目的忽略是,我们还不知道我们在描述的是什么(但是,再一次,这可能是因为我对于FRBR和RDA的无知所致)。

我已经被告知推行这样一个模型并不是为了开发者的方便,这么说很对,但是这里有一个更大、更基本的问题。

我曾经在图书馆里工作超过15年的时间,更具体的说,我在图书馆用RDF也有四年的时间了,而我在试图使用这种模型的时候曾经倍受打击:我们怎么可能期待没有受过编目员训练的人来理解这个东西呢?让问题更复杂的是,(当前)并没有好的方法把FRBR词汇表和其他更简单、更通用的词汇表连到一起(比如Bibliontology)。

这就是我的问题的核心。我们是否真的在乎载体表现或者是内容表达,还是我们只是想要了解事物本身(比如说一本书,或者一篇文章)以及事物之间的联系(改编、赋值、衍生、翻译和其他的关系)。换句话说,我们是不是真的需要遵照全部的FRBR模型,来从这种数据模型里获益?

大概在一年前,我在open.vocab.org上制作了一组属性,以帮助我在推行FRBR的工作(把Open Library使用RDF模型和LinkedLCCN等)中遇到的一些问题。这件事的背景是,我想把比如一本书,模型化为bibo:Book,它可以附加dcterms:creator、bibo:isbn、dcterms:language等属性。但是这意味着我不能说这本书是一个frbr:Manifestation,因为它还有内容表达和作品的属性。与此同时,我也想要能够把一个作品的不同版本关联起来。

所以我就想出了现在称之为commonThing的属性:

其中的想法就是我们知道我的bibo:Book里面有FRBR第一组实体的信息,所以为什么我们不直接暗示FRBR实体的存在,然后根据它来创造出资源之间的关系?

比如,如果你有_:book1 <ov:commonWork> _:book2,你就是在说这两本书共享一个FRBR的作品(它们可能也共享其他实体,但是要点在于你可能不知道)。_:book1和_:book2可以被模型化为任何东西,这并不重要。而且,如果FRBR第一组实体的等级会被模型化,你也可以使用commonThing来把_:book1通过ov:commonManifestation链接到对应的载体表现。

我并不是说这是处理FRBR带给我们的困境的完美的解法(Jakob Voss使用他称之为SOBR的方法解决了这个问题),但是这种方法确实让对话开始远离FRBR第一组实体对于我们注意力的独占,并且让我们更接近这些实体的目的和意义的所在。(顺便说,我很喜欢第2组和第3组实体)

【翻译】国会图书馆可能开始放弃MARC

原地址:http://www.libraryjournal.com/lj/home/890784-264/library_of_congress_may_begin.html.csp

作者:Michael Kelly

译者:Nalsi

 

国会图书馆(LOC)宣布,它将对书目控制进行一次重要的重新评估,这可能会导致它们逐渐放弃有40年历史的MARC 21格式,现在有数十亿条数据都是用这种格式进行编码的。

“这件事有10分。”当被问及这个项目的范围和重要性的时候,Sally McCallum毫不犹豫的这么说。McCallum是LOC网络开发和MARC标准办公室的主管。

书目框架转换方案(Bibliographic Framework Transition Initiative)的目标是,在当前的技术变革和预算限制的条件下,决定“我们需要做什么,才能转换我们的数字框架”, LOC图书馆服务副馆长Deanna B. Marcum这样说,她也是这个项目的领导者。“如果我们能找到一种方法,把图书馆资源和整个信息资源的世界联系起来,而不只是关注书目信息,这是非常重要的。”她说。

MARC长久以来一直支持着资源共享以及节约编目开销,并且是通过机读形式呈现并且传播书目信息以及其他相关的信息的最主要的标准。通过反思MARC,Marcum说,LOC希望判断,这个标准是否能够“实现进化,并且做到所有我们希望它做的事情,不然我们就取代它”,换成能够和互联网世界更兼容的标准。

LOC考虑需要在当前的元数据编码标准中保留哪些内容,因此,图书馆社区最终可能需要适应其他的数据结构。

“我们的巨大的图书馆基础结构在很大程度上是围绕MARC格式建立起来的,放弃MARC格式可能会导致一些扰乱,并且要耗费一些东西,所以这件事必须要进行的聪明而且仔细,”McCallum说,“我们也可以继续使用MARC,但我们并不希望这样。”

受到RDA的驱动

人们希望,向新的数据结构的转变能够“让书目数据在最新的技术和技术配置下得到应用,比如语义网。”McCallum说。

“我认为我们需要更加乐于探索这些新的数据结构,”McCallum说,“这样,我们的社区能够更容易的使用其他的数据结构,比如XML或者RDF。”

图书馆社区还渴望“从新的以及正在出现的内容标准中获得最大的好处”,如在RDA测试的评论中所提及的,Marcum说。

RDA是一个编目规则,它涵盖了所有的内容和媒介类型(包括数字资源)。RDA大概在一年前发布,用以取代《英美编目条例》第二版(AACR2)。开发RDA是因为人们认识到,图书馆在数字环境下运行,需要处理非图书馆员创建的元数据。RDA把图书馆的编目记录和新的元数据整合在一起,但是在测试中出现了进一步的问题,因而催生了这个新的项目。

“许多人评论说,即便新的编目规则RDA能够让我们把零散的资源更好的连接起来,但是,使用MARC作为新记录的载体其实是有内在的困难的。时间会让我们重视这个问题。”她说。

数据控制未来工作组成立于2006年。它也帮助推动了新的日程。

“它们提出了这个议题。是否到了重新评估MARC标准的时候,这个问题确实是它们提出来的,”Marcum说,“我认为,通过关注这个问题,我们所有人都对现存的障碍变得更敏感,这个障碍阻碍我们当前的系统让信息变得完全可检索。”Marcum说。

变化会慢慢发生

LOC计划,任何变革都只会逐渐推行。

“MARC在未来10年仍然会存在。它使用的太广泛了,”McCallum说,“有太多的服务和产品是根据MARC开发的,因此它的使用只能会是慢慢的减少,然后人们改用其他的标准,当他们能够负担得起改用其他的标准的时候。”

“我们希望变化带有稳定性,”McCallum表示。LOC担心,图书馆承担为海量数字资源提供编目元数据的工作,它们需要承担其费用。

这个项目还会:

  • 促进图书馆元数据在更广阔的网络搜索环境中的再利用
  • 探索在关系导航中对数据模型的利用,比如FRBR,不管这些关系是图书馆员主动编码,还是因语义网而可识别
  • 计划把当前的元数据转移到更新的书目系统中,这些书目系统位于LOC更宽广的技术基础结构下

Marcum说,这个项目将是“完全合作性的”,最初的讨论将会在6月的ALA年会上开始。现在预计将会在2012年和2013年和利益相关者举行一系列会谈。

————

相关阅读:

书目框架转换方案网站

编目精灵III:准备抛弃MARC?美国国会图书馆启动“书目框架转变行动”

编目精灵III:“书目框架转变行动”引来一片赞扬

书蠹精:国际编目领域的重大新闻:美国国会图书馆可能放弃MARC格式

读书笔记:如何在图书馆中推行FRBR模型

 

Implementing FRBR in libraries : key issues
and future directions / Yin Zhang and Athena Salaba.

@Worldcat

本书的两位作者来自肯特州立大学。本书出版于2009年。

前几天正好在书堆里看到这本书,就利用几天下班的时间看了下。前三章讨论的是一些关于FRBR的基本信息所以略过未读,直接从第四章开始。后面几章分别讨论了FRBR的应用、在图书馆目录中的实践、相关的研究综述、以及未来的发展方向。虽然总体仍然以文献研究为主,但是不乏我之前未曾关注的资料收集。

第四章FRBR的应用主要介绍了两个问题:FRBR对于不同类型馆藏的应用情况,以及在不同类型机构中的应用情况。

对于前一个问题,作者分析了艺术品、经典文献、小说、手工印刷材料(hand-press materials)、国家级文献、现场表演、移动图像、音乐、口头传统作品等资源类型采用FRBR模型的问题和优势。总体而言、含有大量内容表达和载体表现的专著作品、音乐和小说是最适合使用FRBR模型的一些资源类型。其他作品类型虽然可能也能从FRBR模型中收益,但是推行这一模型可能会涉及对模型概念的重新解释和修订,比如扩展第一组实体的概念以及实体间的关系。

对于第二个问题,作者分析了传统图书馆、图书馆联盟、数字图书馆、机构典藏、互联网档案和图书馆等类型的馆藏机构推行FRBR的相关问题。虽然FRBR确实意图成为跨越不同社区的存在,但是似乎它在其他社区的被接受程度并不太理想,尤其是最后几个和图书馆迥然有别的机构,对于FRBR的关注仅限于理论上的探讨。

第五章作者收集了采用FRBR模型的一些案例。作者把这些案例分成了全功能系统、原型或者试验系统以及算法和软件三类。

全功能系统:

Worldcat.org (http://www.worldcat.org/)

UCLA Film and Television Archive (http://www.cinema.ucla.edu/collections/explore)

原型或者试验系统:

OCLC Fiction Finder (http://fictionfinder.oclc.org/)

Library Australia FRBR Prototype (http://ll01.nla.gov.au/)

RedLightGreen(已停用,功能并入Worldcat.org

BIBSYS (http://www.bibsys.no/english/pages/index.php)

Kent State University FRBR Project(书中说这个项目持续到20109月。现状不明。)

软件:

XC (http://xtensible.net/)

Virtue ILS (http://www.vtls.com/products/virtua)

Innovative Interfaces (http://www.iii.com)

VisualCat (http://www.portia.dk/websites/productgallery.htm)

OpenFRBR (http://openfrbr.heroku.com/)

IFPA (http://pclib3.ts.infn.it:8080/ifpa2/main.html)

LibDB (http://sourceforge.net/projects/libdb/)

算法:

OCLC FRBR Work-Set Algorithm (http://www.oclc.org/research/activities/past/orprojects/frbralgorithm/default.htm)

Tool for Converting Bibliographic Records (http://www.ercim.eu/publication/Ercim_News/enw66/aalberg.html)

呈现工具:

FRBR Display Tool (http://www.loc.gov/marc/marc-functional-analysis/tool.html)

FRBR Floater(网上已经找不到它的网页了,不过还能看到一些博客和书目的介绍)

第六章第七章多有重合的地方。我比较感兴趣的是第七章里用德尔菲法进行的一个调查。这个调查发现了被调查者关注最多的8个问题(按得分顺序前后排列):

 

  • 开发基于FRBR的编目规则
  • 关注基于FRBR的记录结构、记录编码标准以及实施FRBR的框架
  • 开发、测试工具和软件,用于FRBR化的处理
  • 探索、开发、测试FRBR实施的不同方法
  • 对基于FRBR的系统进行用户调查,保证这些系统能够有助于终端用户
  • 开发基于FRBR的规范作品标准,用于FRBR的实施
  • 测试FRBR模型和实际数据的相关程度,以及对不同社区的适用程度,保证这个模型是有效并且可用的
  • 对来自不同标准和实践的数据进行FRBR化的处理

对我来说,FRBR这个模型非常让人担心的事情是,在图书馆开始大张旗鼓的推行它之后,我们似乎还不太能证实它真的能有助于终端用户。本书的作者曾经对这个问题进行了一个用户调查,见此处。本书作者在最后几章中也反复强调了另一个问题,就是FRBR不同的实践者会对这个概念模型进行不同的解释和界定,而当下缺乏标准的框架来统一的实现FRBR模型。