首页 - 译文学习区 登录 注册
Voice technology is making computers less daunting and more accessible 有了语音技术,电脑不再令人敬而远之,反而更加平易近人

【20170107封面文章】语音技术:轻而易“语”

  • 29964阅读
  • 2
  • 7评论
译者:linda10030 原文作者:Economist
发布:2017-01-09 11:30:21 挑错

语音技术

轻而易“语”

有了语音技术,电脑不再令人敬而远之,反而更加平易近人

英国科幻小说作家亚瑟·克拉克(Arthur C. Clarke)曾经指出,任何科技只要先进到足够的程度,就和魔法没有区别。迅速兴起的语音电脑证明了他的观点。它用起来就像是变魔法:对着空气说句话,附近的智能设备就会帮你如愿以偿。

亚马逊智能音箱(Amazon Echo)是一种声控筒状台式电脑,听到“阿丽夏”(Alexa)这个名字,它就会做出反应,挑选歌曲,选择电台,讲笑话,回答各种琐碎问题,还能控制智能设备;甚至早在圣诞节到来之前,它就已经入住了4%的美国家庭。语音智能助手还扩张到了智能手机行业:苹果(Apple)的语音助手西里(Siri)每周要处理超过20亿个指令;在美国,安卓手机的谷歌搜索指令有20%都是通过语音发布的。电邮和短信的语音输入技术已经发展得足够稳定,十分好用了。说话就能解决,何必还去打字?

这种转变非同小可。尽管语音技术看起如此简单,但通过提供自然的交流方式,它具备着改变电脑的力量。从Windows操作系统,到图标和菜单,再到触屏技术,这些和电脑打交道的方式更加直观,比输入复杂键盘指令更受欢迎。但是,一旦能够与电脑交谈,就不存在将“用户界面”抽象出来的必要了。就像手机不光是没有线的电话,汽车不光是没有马的马车,没有屏幕和键盘的电脑也有潜力变得更好用、更强大、更无所不在,超乎今人的想象。

语音技术并不会完全替代其他形式的输入与输出。有时候,要和机器聊天,打字仍旧比语音更容易(据说,亚马逊打算研发一种带有内置屏幕的语音设备)。不过,从告诉你剩余洗衣时间还有多长的洗衣机,到企业呼叫中心的虚拟助手,作为人们与周边科技互动的方式,语音注定会越来越受青睐。然而,要充分发挥其潜力,语音技术还需要进一步突破,解决好由此产生的微妙问题,拿捏好便利性与否与隐私权之间的平衡。

 阿丽夏,深度学习是啥?

电脑指令系统已经伴随我们好些年了。但是,他们性能不稳定,需要经过长时间训练,才能识别特定用户的语音。“无需训练就能可靠地识别几乎任何人的讲话,这是电脑的新功能,也是“深度学习”能力的最新印证。深度学习”是一种人工智能技术,该技术可让某种软件系统接收上百万次案例训练,这些案例往往是从网络上精选出来的。现在,有了深度学习技术,机器在转录准确性上,已经与人无异,电脑翻译系统正在飞速发展,文本转语音系统的机器人腔越来越少,更加接近自然人声。简言之,电脑对各种自然语言的处理能力都今非昔比了。

尽管深度学习意味着机器能更加可靠的识别人声,发音也不再生硬,但是机器依然无法理解语言的意思。这是语音技术中最困难的一点,真要想蓬勃发展,这是声控电脑所必须克服的问题。电脑必须能够理解文字的意思,才能就某个话题展开连贯对话,而不是像今天常见的,电脑只对简单的、一次性的语音指令做出回应(“嘿,西里,帮我设个10分钟的闹钟”)。在大大小小的高校和公司中,研究员们正在研究这个问题,设计能够针对复杂任务进行细致对话的机器人,从检索信息,到提供房产按揭建议,再到安排行程等。(亚马逊设置了100万美元奖金,奖励能够连贯地愉快聊天20分钟的机器人)

动口代替动手

在语音电脑的发展问题上,消费者和监管者也发挥着一定的决定作用。尽管目前来说,语音技术尚处于相对原始的发展阶段,但它已然让人们陷入两难:声控系统的个性化程度越高,允许接触的私人日程、电邮和其他敏感信息越丰富,则发挥的用处也越大。这引发了人们对隐私和安全问题的担忧。

从更复杂的角度看,许多声控设备一直都处于待命状态,等待被声音指令一触即发。联网的麦克风监听着每个房间,每一部智能手机,已经有人在担心这一切意味着什么了。并非所有的音频都发送到了云设备——在设备开始将用户语音传达给实际处理语音请求的服务器之前,他们随时等待着“一声令下”(“阿夏丽”,“好,谷歌”,“嘿,微软小娜”,或“嗨,西里”)——但是,一旦开始储存音频,就难说谁会在什么时候保留什么录音了。

警方在阿肯色州调查的一桩谋杀案中,亚马逊智能音箱有可能听到了凶杀过程,于是警方要求公司提供该智能设备可能获取的任何音频资料。亚马逊公司却拒绝合作,理由(受到了隐私拥护者们的支持)是这种要求是否合法尚不明确。无独有偶,2016年,苹果供公司也拒绝配合协助FBI调查员解锁一名恐怖分子的苹果手机;这两个案例都突出了明确法规的必要性,出于安全利益考虑,对个人隐私的何时何种侵扰属于合法,应该得到明确。

尽管这些问题尚未解决,消费者们仍旧愿意接受语音电脑。在许多情况下,语音比其他交流方式要方便、自然得多。与众不同的是,当你使用它时,还可以同时做其他事情(开车,健身或在街上走路)。语音可以让由于种种原因不能使用屏幕和键盘的人们感受到电脑的力量。它不仅给电脑带来惊人影响,还影响了语言使用本身。电脑同声传译让许多人不必会说外语;在一个机器可以讲话的世界中,小语种生存下去的可能性更高。触屏的到来是人类与电脑互动模式的上一次重大转变。语音的飞跃有过之而无不及。


相关译文来自无觅插件
共计7条评论
胡雨洁发表于:2017-01-09 19:21:11

我昨天也翻译了这篇文章,但是不知道怎么发到译言上面来。今天突然看到了你的版本,对比了我的,发现了一些我译得不够好的地方。
标题我直接译为的“语音时代”,
第二段“The Amazon Echo, a voice-driven cylindrical computer that sits on a table top and answers to the name Alexa”中的 answers to the name Alexa我译为“回答问题的语音机器人Alexa”,看了你的版本觉得“听到“阿丽夏”(Alexa)这个名字,它就会做出反应”似乎更为合适;
“ Just as mobile phones were more than existing phones without wires, and cars were more than carriages without horses”这一段我看了你的才豁然开朗原来是“电话不只是···汽车不只是····”的意思。
另外··when spells replace spelling 中后面一个spelling为什么会翻译为动手呢请指教。
我的译文发在知乎的~https://zhuanlan.zhihu.com/p/24772969

回复

胡雨洁发表于:2017-01-09 20:07:15

working on 到底是正在研发还是正在生产呢?

回复

胡雨洁发表于:2017-01-09 20:15:32

Computers are, in short, getting much better at handling natural language in all its forms 中in all its form该如何解释?我理解为"以它的形式“感觉不太对

回复

linda10030发表于:2017-01-11 11:57:41
胡雨洁:working on 到底是正在研发还是正在生产呢?

@胡雨洁:work on,从事于…; 继续工作; 努力影响[说服]; 致力于;
好像没有生产的意思。

回复

linda10030发表于:2017-01-11 11:58:34
胡雨洁:Computers are, in short, getting much better at handling natural language in all its forms 中in all its form该如何解释?我理解为\"以它的形式“感觉不太对

@胡雨洁:in all its form 各种形式的语言,中文,英文,日文,法文等等。自然形成的语言,无论是什么形式的语言。

回复

linda10030发表于:2017-01-11 12:00:43
胡雨洁:我昨天也翻译了这篇文章,但是不知道怎么发到译言上面来。今天突然看到了你的版本,对比了我的,发现了一些我译得不够好的地方。
标题我直接译为的“语音时代”,
第二段“The Amazon Echo, a voice-driven cylindrical computer that sits on a table top and answers to the name Alexa”中的 answers to the name Alexa我译为“回答问题的语音机器人Alexa”,看了你的版本觉得“听到“阿丽夏”(Alexa)这个名字,它就会做出反应”似乎更为合适;
“ Just as mobile phones were more than existing phones without wires, and cars were more than carriages without horses”这一段我看了你的才豁然开朗原来是“电话不只是···汽车不只是····”的意思。
另外··when spells replace spelling 中后面一个spelling为什么会翻译为动手呢请指教。
我的译文发在知乎的~https://zhuanlan.zhihu.com/p/24772969

@胡雨洁:when spells replace spelling 直译是“当魔法取代拼写”,但如果这么翻译,完全体会不到作者用spell和spelling一词多意的玩味,所以我就翻了一个中文的“动口”—“动手”,这是完全意译的,主要是在保证大致意思的基础上,把原文中小标题的俏皮保留下来。

回复

meihelen发表于:2017-01-11 18:48:32

a bot that can converse “coherently and engagingly” for 20 minutes:【能够连贯地愉快聊天20分钟的机器人】engagingly 更像是“吸引人地”、“抓住人注意力地”,即说话切题、有内容,让人不会走神,倒不见得【愉快】。

devices wait for a trigger phrase ... before they start relaying the user’s voice to the servers that actually handle the requests—but when it comes to storing audio, it is unclear who keeps what and when:【设备开始将用户语音传达给实际处理语音请求的服务器之前,他们随时等待着“一声令下”……——但是,一旦开始储存音频,就难说谁会在什么时候保留什么录音了】=> 设备等着听到“一声令下”……才会开始将用户的语音传达给实际处理语音请求的服务器——但是谈到储存音频的话,就难说谁会在什么时候保留什么录音了。

【受到了隐私拥护者们的支持】用“隐私权”较好。

回复

×提示

您已经赞过此文了。

确定