首页 - 译文学习区 登录 注册
薇罗尼卡格林伍德(Veronique Greenwood)是一位科学作家,其作品曾在《纽约时报》杂志、《国家地理》、《发现》杂志和《科学美国人》等刊登发表。 获得耶鲁大学分子细胞发展生物学位。

小说中六个主要的叙事弧线

  • 14111阅读
  • 0
  • 2评论
译者:孙颖 原文作者:Veronique Greenwood
发布:2017-01-02 14:10:30 挑错


薇罗尼卡格林伍德(Veronique Greenwood)是一位科学作家,其作品曾在《纽约时报》杂志、《国家地理》、《发现》杂志和《科学美国人》等刊登发表。 获得耶鲁大学分子细胞发展生物学位。

近年来,文学一直从一个不寻常的视角得到关注:数学。 除了统计物理学家分析冰岛传说的角色之间的联系,以及计算机科学家探索英文小说中词汇的出现和消失,佛蒙特大学的一个数学家团队现在查阅了超过1,000个文本,看看是否可以从这些文本中自动提取他们的情绪弧。结果显示颇为有趣,不仅是关于叙事,而且还显示可以用这种方法来研究文学。

佛蒙特大学团队的研究人员与测试对象一起创建一个能够分配情感价值词汇—正面、负面或中立面的程序。 “恐怖分子”在程序的词库中被列为负面词汇,“胜利”为积极词汇。  然后,他们从名为古登堡计划、由志愿者付出巨大努力将其数字化的书籍中挑选出文本,这些书目前在公共领域著作的存储库中。最后,研究人员进行了一系列分析描绘出情绪弧在文本中的形状。

事实上,根据2016年6月在ArXiv.org(全球最大的预印本系统)上发表的论文,一些模式反复出现。 研究人员所研究的作品中约有85%的作品可以被分为六组。一些团体借用了丰富多彩的名字—例如“伊卡洛斯”,一种先上升后下降的情感类型; 和“白手起家”,一种先负面后上升的情感类型。一些古登堡计划书库中最多下载的作品适合“灰姑娘”情感模型,先上升,然后下降,最后再上升。你可以了解到你如何开始得出什么故事演绎的好的结论,或者人类故事中的弧数是多么得少。

但是,看看最初包括在研究中的书,你可能开始质疑这些结果的可靠性。 首先,分析不仅使用了《罗宾逊克鲁索》和《圣诞颂歌》,而且还使用了诸如《护理札记》和《初学艺术史》这样一类书籍。 处理汉斯·克里斯蒂安·安徒生的故事集,使之好像是一个单一的故事,而不是一系列独立的叙事。 最适合伊卡洛斯叙事弧的书籍是《196瑜珈经集合》。 另一个奇怪的能够与灰姑娘叙事弧相合的书籍是波伊提乌斯的《哲学的慰藉》。

这里有些东西不大对头,事实上,这是做自动分析的困难之一。处理大量的信息是一件敏感的事情,比如在古登堡计划可用的书籍资源中,筛选这些书籍以确保你得到的答案与你想问的问题所匹配。安德鲁·里根(Andrew Reagan),一位研究生也是论文的主要作者,很同意这样的观点——甚至得到这种大杂烩式文本他要付出很多心血。毕竟,古登堡计划有很多的字典、诗歌甚至人类基因计划文本资料,这些都需要被移除。

从6月份,安德鲁·里根首次将他的文章发布在网上时,就已经收到了关于如何更好地过滤掉那些文本数据的建议和提示。例如, 他学会了如何访问国会图书馆对古登堡计划中书籍的分类。这与以往不同:“我能够使用它,并选择只是英文小说的全部作品”,里根说道。所以,今年九月里根发布的最新修订的文章版本,只使用到了这些英文书籍。

但相同的类别仍然出现。它们仍然覆盖了大约85%的故事。但这进一步表明模式并不是小说作品所独有的,假如这个团队一开始就只选经过验证的小说来作分析的话,人们可能会猜想这些模式只是小说独有了。在没有准确地知道这些弧线为什么存在的情况下,或者知道读者视角中的象征含义,是难去阐释这些弧线。

与此同时,佛蒙特集团正在努力获取有关Google图书数字化文本的详细信息,这些信息应该能够产生上个世纪在美国发表的故事的更多数据。Google数据应该可以从某一时期获取图书,并将它们与来自同一地点的书籍在不同时间或同时的另一个地方进行比较,看看是否可以得出有趣的结论。而且未来的的结果或许能够描绘出特定文本类型的情感弧线,比如侦探小说或浪漫小说。

回过头来,存在一个更首要的问题。事实上,这样做会遇到令人惊讶之事吗?? 使用计算工具去消化比一个人在相同时间的阅读量多得多的文学作品,会告诉我们靠自己阅读从来不会注意到的事情吗?很难知道。但是当你想一想阅读古登堡计划的每一本小说要花多少时间,想一想描述其中的模式需要什么样的技能和努力,你就会明白为什么至少有些人认为这值得一试。


相关译文来自无觅插件
共计2条评论
meihelen发表于:2017-01-03 09:43:14

and computer scientists exploring the life and death of words in English fiction:【以及计算机科学家探索英文小说中的关于生与死的词汇】=> ……英文小说中词汇的出现和消失。

And their results show something interesting, not just about narratives, but also about using this approach to study literature:【结果显示颇为有趣,方法不仅用于叙事故事中,而且还可以用来研究文学】=> ……,不仅是关于叙事,而且还显示可以用这种方法来研究文学。

Then they selected texts from the massive volunteer effort to digitise books known as Project Gutenberg:【然后,他们从志愿者付出巨大努力的文本中挑选出合适文本,将其数字化名为古登堡计划书籍】=> 然后,他们从名为古登堡计划、由志愿者付出巨大努力将其数字化的书籍中挑选出文本。

回复

meihelen发表于:2017-01-03 17:49:40

Something is not quite right here, and indeed, this is one of the difficulties of doing automated analysis:【事实上,有些显示并不是相当准确的,这是做自动分析的困难之一】=> 这里有些东西不大对头,事实上,这是做自动分析的困难之一。(indeed 指的是后半句。)

the graduate student who is the paper’s lead author:【一位本科毕业生也是论文的主要作者】graduate student 是“研究生”。

he’s learned how to access the Library of Congress classifications for the books on Project Gutenberg:【在古登堡计划中,他学习了如何访问国会图书馆的分类图书】=> 他学会了如何访问国会图书馆对古登堡计划中书籍的分类。

his latest, revised version of the paper, put up this September, uses only those:【今年九月里根发布的最新修订的文章版本,只使用到了这些方法】 those 指的是前面提到的 full works of English fiction,与【方法】无关。

But that goes to show that the patterns aren’t exclusive to works of fiction, as one might have assumed if the group had looked only at verified fiction at the beginning:【但这表明,模式并不是小说作品所独有的,人们可能会猜想,团队是否一开始只看取经过验证的小说】=> 但这进一步表明模式并不是小说作品所独有的,假如这个团队一开始就只选经过验证的小说来作分析的话,人们可能会猜想这些模式只是小说独有了。

Are there, in fact, surprises to be stumbled on in this way?【事实上,在这种方式上被束缚会感到惊讶吗】=> 事实上,这样做会遇到令人惊讶之事吗?(stumble on: find sb/sth unexpectedly or by chance.)

Can using computational tools to digest far more literature than a single human could read in the same amount of time tell us things we’d never have noticed on our own? 【可以使用计算工具去分析筛选更多的文学作品相比于一个人在相同时间范畴里的阅读量,告诉我们我们自己从未注意到的事情吗】=> 使用计算工具去消化比一个人在相同时间的阅读量多得多的文学作品,会告诉我们靠自己阅读从来不会注意到的事情吗?

But when you think of the time it would take to read every novel on Project Gutenberg, and the skill and effort required to describe what patterns are there, you can see why some people, at least, think it is worth a try:【但是当你想一想他可以带你在古登堡计划中阅读每一本小说,而且计算机的技术功劳可以形容描绘出小说的模式,你可以看到为什么有些人认为这至少值得一试】=> 但是当你想一想阅读古登堡计划的每一本小说要花多少时间,想一想描述其中的模式需要什么样的技能和努力,你就会明白为什么至少有些人认为这值得一试。

回复

×提示

您已经赞过此文了。

确定