首页 - 译文学习区 登录 注册
Diane Hillman评价了R2最近公布的北美MARC市场调查。她认为这个报告虽然详细的描述了当前的MARC数据市场,但是它严重体现了资助者——国会图书馆——的意识形态,没能及时跟进关联数据的发展趋势。

琥珀中的蠹虫

  • 3344阅读
  • 0
  • 0评论
译者:Nalsi
发布:2010-01-24 10:38:53 挑错

琥珀中的蠹虫

几个礼拜之前,我参观了我们这里很棒的地理博物馆,这座博物馆离我家只有6英里。当时正赶上一个琥珀展开幕,这个展览包罗万象:科学、历史、地理和……珠宝。我必须承认(认识我的人都不会惊讶)展览的珠宝很棒,我一边看一边想起了我自己收藏的各式各样琥珀。嘿,你尽管笑吧,但是在那些日子里,我在家干活,几乎没有机会用任何首饰,所以这个开幕式真是让我不能自拔。

珠宝就说到这吧,我想说的是小虫和书目。正如你在科学博物馆里面能够期待的,他们总是很强调琥珀是一种媒介,保存了历史上零碎的东西,尤其是生物学的历史。作为一种保存的媒介,琥珀坚不可摧,尽管,当然它对生物学标本的大小也是有限制的。我过去没意识到这件事,但是很显然,假的琥珀到处都是,发现假货的方法之一就是,里面的标本如果太大,就不可能被胶质的树液困住。这个展览上也有一些很棒的假货,包括彩色塑料中一条小蛇,它看起来很像琥珀。

科学家关注琥珀是因为它中断了生物的腐烂过程,这些生物幸运(还是不幸?)的被树液捕获。这些琥珀捕捉到这些小虫短暂生命中的一瞬,让我们可以在我们的时代——几百万年之后的今天——仔细研究它们。和琥珀相似,R2咨询公司进行的北美洲MARC数据市场研究也捕捉了历史的一瞬,这一瞬间的事情可能发生的太晚了,不能对未来产生怎样的影响,但是它还是赶在海啸到来之前,及时捕捉到了编目界当下的状况。

R2报告之于元数据专家的吸引力正如琥珀之于生物学家。它详细描述了当前编目流通的世界,尤其关注了“运转不佳的市场”,这个市场像托普西【译注:Topsy,《汤姆叔叔的小屋》中的角色】一样随着MARC记录的流通自生自长。报告正确的指出,图书馆希望“数据免费”,但商业的方式是收回生产成本并且维持一定的利润,这两种方式之间产生了断裂,而且不难预测,报告会支持后一种看法。

这个报告读起来让人如醉如痴,尤其当我们知道这份报告是受到国会图书馆委托撰写的——它几乎不是和背景无关的分析。我尤其感兴趣的是,它对于图书馆以外提供MARC数据的商业的描述,不管它们是承包者,还是材料供应链上的一环。我曾经就职于R2报告中描述为“绿色层”(详见下文)的一家大型学术机构,所以我了解MARC市场这一部分的规模,但是我和它几乎没有任何联系。

这篇报告的主旨是,MARC的传播网络是一个功能紊乱的混合体,这个市场的一部分是图书馆奉行的“免费”,另一部分则是商业市场。作者认为,“社区”应该提供更多的MARC数据,这样人们就不必依靠备受折磨的LC了,而且作者提供了大量数据来支持他们的观点。他们相信我们还有足够的时间来做这件事,节约每个人的钱,然后就会发生承诺的改变,所有事情都需要重新思考。

我的偏见已经众所周知,以下是我对这个报告的评论,为了方便,它分为以下几个标题:

功能紊乱?或许吧……

报告的第一部分的绝大部分篇幅都在描述当前的“市场”,并讨论了相关的调查的结果。R2想在这里说明,LC为所有人提供补贴,它让每一个人都得到了利益。

 图书馆和服务商(至少是好的服务商)依赖“服务”,这样它们各自的客户才能发现它们,但是图书馆和服务商对于服务的理解是不同的。在商业世界,服务存在于收益性的语境中,它需要抵消所有的开销,还能创造出额外的收益,让公司能够继续发展,而且也是对先期投入的回报。图书馆的服务伦理则没有这些问题,比较不会受到开销的限制。

这个报告中有很多有趣的描述,描述了作者所谓的分化的市场,这个市场抑制有用的市场刺激,以增加输出:

 这种张力存在于社区价值和商业价值之间,存在于理想主义和实用主义之间,存在于社会责任和私人利益之间,它深深影响到了图书馆市场的某些方面。编目——它被许多人视作图书馆事业的核心——也受到了这种张力的影响。

作者在“社区”和“商业”的冲突中的立场一目了然:

 分享数据,但是没法收回分享的开销,这样做的动力是一种社区利益的体现,但是如果没有补助或者交换,这种做法是不能长久的。从商业的角度,这是个糟糕的买卖。

或许下面这句话更加明显:

我们应当注意到,LC让人们免费获取它的MARC数据,而且可以通过多种渠道获得。无所不在的开放数据库是最主要的原因,导致了当前的经济困惑,让MARC数据市场备受折磨。

这个报告把复杂的MARC市场分成了三层,这种分类十分有趣,而且不无教益。它包括“绿色层”,这一层包括“市场中最古老、最传统的部分,它生产了几乎所有MARC数据。”这一层既包括图书馆也包括商业组织,以及OCLC。如上文所述,它是“社区”和“商业”的混合。要点在于它们是市场的贡献者——即便它们也是消费者。根据R2的数据,这一层包括了97%的专业图书馆、63%的公共图书馆和比例相当的中小学图书馆。

它下面的一层(根据报告的分类,它显然是在下面的)称之为“蓝色层”或者“机会主义层”,根据作者的定义,这一层包括“非OCLC图书馆,以及资金不足、编目能力不足的图书馆。”更有意思的是,这一层“也包括开放数据库提供商和无所不在的(是否是说“有害的”?)Z39.50协议,人们用它们发现并且获得免费的MARC数据。”R2注意到了不同层次之间的边界是不断变化的:“在加拿大和美国,‘绿色层’过去曾经采用‘蓝色层’的实践和预期,一旦图书馆的经费减少,而且Z39.50的端口丰富。几乎所有的图书馆,不管它们的规模和类型如何,都会采取一种耐心的策略,定期的在‘蓝色层’中重新搜索新的可用记录;但是对于‘蓝色层’中的图书馆来说,这种方法是编目工作的首选……开放获取和开放档案计划存在于蓝色层中,它们背后是一个基本的哲学立场,认为信息的获取应该是免费而且自由的。”

这个系统“底层”是图书馆以外的“紫色层”,在报告的描述中,这一层毫无疑问是当前MARC世界的真正威胁,而不仅仅是嘈杂的图书馆社区对于分享观念的威胁:“非图书馆(紫色)层的运作在很大程度上无视MARC数据的经验,而且无视总体而言的图书馆市场。当然,我们需要关注这一部分的活动,因为这一部分的发展是传统价值和传统经济结构最严重的威胁,它不仅仅威胁到了‘传统的绿色层’,甚至还威胁到了‘机会主义的蓝色层’。在这里,更新的技术和非MARC的数据格式得到使用和开发。”

显然,我们遇到了图书馆的敌人,根据R2的看法,我们的敌人正是我们自己。但是等一等,在让人讨厌的“紫色层”中还有我们意想不到的同伴。除了人们通常的怀疑对象——GoogleAmazon——之外,我们发现“……OCLC同时在‘传统的绿色层’和‘紫色的非图书馆层’中运作。但是,OCLC的成员馆则活跃在‘机会主义的蓝色层’中,它们分享数据的方式可能会和OCLC所有权的政策发生冲突。”

报告明确划定了战线,“信息需要是免费的”的一方明显是敌人,不管它们披着传统图书馆的外衣,还是张着血盆大口,毫不在意当下的MARC市场,想要一砖一瓦的拆掉图书馆数据的竖井。不论我们寻求这些改变是为了帮助在预算中拼命求生的图书馆,还是为了帮助寻求创新以满足其用户的图书馆,这都是个羞辱,羞辱啊!

R2的解决方案

报告的作者确实提出了那个在我们看来最重要的问题,但是却轻易的把这个问题排除在他们的研究范围之外:

 “编目的实践从没遭遇过像现在这样的仔细研究(无论是好是坏)。有两个问题至关紧要。首先,我们已经有了全文索引、开放URL链接和其他的发现选择,在这个时代,传统的编目和MARC数据——即便通过RDAFRBR实现了现代化——还是必要的么?这是一个很有价值的问题,可惜它不在本报告的讨论范围之内。”

我们可以不去管RDAFRBR代表传统MARC数据的“现代化”这样一个古怪的命题,因为它们只在一个有限的技术语境下才代表“现代化”,更不要提我们这个领域中的外人,或者是我们这个领域以外的人所创建的数据了。然后报告的作者转而提出了他们真正想要提出的问题:

 “作为专业人员,我们如何理解并解释生产、传播编目记录的开销和收益呢?原编数据来自何处?由谁生产?生产原编数据有什么好处?影响原编的障碍是什么?图书馆市场怎样看待编目工作的价值?任何组织投资生产原编数据,它们的回报如何?共享编目以及传播免费或者低成本的记录如何影响了市场?LC以及单个图书馆的工作在何种程度上补贴了市场中的活动?”

问题在于,如果不能回答第一个问题,其他问题的答案看起来都是无足轻重的。

 “就像我们所说的,市场需要调整,我们需要创造出刺激生产的因素,又能维护免费共享数据的社区伦理。只有社区负担所有生产的开销,合作的伦理才能得到维持。”

在我看来市场确实会进行调整,而且如果人们了解了传统编目的完全开销和暴跌的投资回报率——也就是第一个问题的内容——这个调整的过程会来得更快,但是调整的方式恐怕不是R2预测的方式,也不是那些想要为它们的MARC数据获取回报的人希望的方式。

作者通过讨论人行横道,生动的描述了他们的世界观:

 ONIXMARC数据的翻译,以及完全可操作的MARC向非MARC元数据的翻译的人行横道可能完全改变当下的三层结构。到目前为止,蓝色层和紫色层的主要参与者都没能实现共享书目和规范数据的概念。我们可以看到一些鼓励跨市场合作的工作(比如OCLC/NISO论坛),但是,市场的每一层内部和不同层次之间都存在激烈的竞争。更成问题的是,每一层都有截然不同的需求和刺激,所以我们很困难建立足够程度的应急措施或者投资,以建立新的解决方案。”[RIN]

显然,如果在我们的世界里,人们知道世界以外存在的唯一相关的数据是ONIX,人行横道看上去就是一种笨方法,但是把这种看法称作“有局限的”似乎是太善良一点了。

最后,R2认为我们还有足够的时间来探索这个市场的潜力,我们可以发现并且利用未曾发现的能力(比如人们还不知道的编目员),或者提供经济上刺激。在我看来,这个观点是错误的,完全背离了我们设计转变,去往一个不同未来的需求。我同意图书馆还会在一段时间里使用MARC,但作为一种有问题的交换格式,它不是图书馆数据世界的关键。R2的战略让旧世界苟延残喘,损害了我们快速发展的可能性。

神牛效应

这很让人悲伤,因为整篇报告虽然是一个有趣的生物学标本,可是它完全没有分析图书馆以外的数据活动,只是把这些活动及其组成部分妖魔化了。它们把LC说成了“可怜的尼尔”(Poor Nell),他们拒绝通过创新的方式创造并重新使用LC生产的数据,比如说,美国记忆、LC Flickr项目和许多其他数字化的计划都积极的(而且是公开的)推进元数据的封装(metadata envelope),这些方法大大的激励了我们。这篇报告没能理解,它们害怕的改变,他们正确的认为会完全损害当前市场的这些改变,正在迅速的侵蚀着MARC和传统市场的边界,恐怕用不了5-10年,R2预测的事情就会真的发生了。

去年在芝加哥举行的ALA年会上,我们的小组进行了一个关联数据的项目,很高兴有许多人来参加,EricMiller让人信服的预测说,整合“云”中的“免费”元数据的投资盈利将会超过人们在传统上对于质量的关注。[Miller]主流的媒体,比如纽约时报,正在积极的采用关联数据,试图把它们的数据与DBpediaFreeBase上的数据整合起来。[Sandhaus]

考虑一下Jon Phipps的这段话:“编目市场的未来需要和‘自由以及比足够好更好’进行竞争。有人在最开始嘲笑Google太简单,而且在搜索中忽略了元数据,和那一样,专业编目社区忽略(或者是有意挡开)生产关联数据的系统巨大的未来,因为他们觉得这是有风险的。随着语义网络和图书馆数据集合的关系越来越清楚,RDA词汇表代表了对编目员权威的挑战,它是一种分裂性的、改变现状的技术。” [Phipps]

现实是,不仅仅只有市场在改变,我们的专业也在改变。这个报告分析了为什么相当数量的编目员说他们没法达到预期的输出标准,作为这个分析的一部分,R2推测认为:“这些数据让我们发问,编目员在做什么。Bob Wolven和其他一些人认为编目员正在把它们对于编目原则的知识应用在新的情况中,尤其是为数字和档案馆藏创建元数据。”[Wolven] R2似乎在暗示这件事情很糟糕,它从实际上在生产MARC数据的机构那里抢夺资源,但是这些新的角色对于图书馆的生存和更新至关重要,至少比维持当前MARC记录生产的角色重要得多。

R2报告提出了解决问题的方法,包括更关注如何收回编目的成本、创建编目数据的重新中心化,如果我们采取了这些措施,我们就会阻碍转变的发生,让人们没法参与到更开放的关联数据的世界。这是一个退步,因为在我们的社区里,共享和去中心化的数据已经内化成为我们的一部分,我们距离开放获取数据的世界只有一步之遥了。

很奇怪,这个报告以我的老朋友Sherman Clarke的一句话作为结尾(这句话没有署名,看上去好像是对于调查的评论一样):

 “作为一个集体,我们需要有一个模型,让我们在机制上建立数据记录,或者是增加机构的记录和其他记录的元数据数量来做到这一点。OCLC已经做了很多事情通过输入的记录来构建主体记录;现在我们需要的是更接近元数据的东西,它们在新一代的环境中已经是很常见的了。如果一个人增加了一个标签或者评论或者是图片,这些信息就能出现在主体的丛集中。它不是一条书目记录,而是作品/内容表达的一个特定载体表现的书目元数据云。”

是的,你说对了,Sherman。我们需要的变化不是关于记录的,也不是关于编目员的。我们需要的使用新的方式思考信息和附加价值。

————

[Miller] Miller, Eric. “Linked Data and Libraries:Grassroots Program: From Legacy Data to Linked Data, Preparing Libraries forWeb 3.0. Available at: zepheira.com/talks/ala-em-lod.pdf

[R2] Study (for the Library of Congress) of the NorthAmerican MARC Records Marketplace, October 2009, R2 Consulting LLC, RuthFischer, Rick Lugg. Available at: www.loc.gov/bibliographic-future/news/MARC_Record_Marketplace_2009-10.pdf

[RIN] Research Information Network. (2009). Creatingcatalogues: bibliographic records in a networked world. Available at: www.rin.ac.uk/files/creating_catalogues_REPORT_June09.pdf

[Sandhaus] Sandhaus, Evan. “150 Years of SemanticTechnology.” Presentation at the Cornell University Libraries Metadata WorkingGroup Forum, Nov. 13, 2009. Slides will be available from: metadata-wg.mannlib.cornell.edu/forum/index.php?date=2009-11-13

[Wolven] Wolven, Robert. (2008). In search of a newmodel: Columbia University Libraries: Robert Wolven reflects on what’s next forcooperative cataloging. netConnect, 1/15/2008. Available at: www.libraryjournal.com/article/CA6514925.htm

 

相关译文来自无觅插件
共计0条评论
×提示

您已经赞过此文了。

确定