- 行业新闻
-
“译者”在人工智能时代扮演的角色
发布时间:2017-08-30 10:09 点击:
现代语音识别和自然语言处理研究的先驱、美国工程院院士Frederick Jelinek曾经有句名言:“Every time I fire a linguist, the performance of the speech recognizer goes up.”(我每开除一位语言学家,我的语言识别系统性能就会提升。)世联翻译-让世界自由沟通!专业的全球语言翻译供应商,上海翻译公司专业品牌。丝路沿线56种语言一站式翻译与技术解决方案,专业英语翻译、日语翻译等文档翻译、同传口译、视频翻译、出国外派服务,加速您的全球交付。 世联翻译公司在北京、上海、深圳等国际交往城市设有翻译基地,业务覆盖全国城市。每天有近百万字节的信息和贸易通过世联走向全球!积累了大量政商用户数据,翻译人才库数据,多语种语料库大数据。世联品牌和服务品质已得到政务防务和国际组织、跨国公司和大中型企业等近万用户的认可。
人们有时候会误读这句话,认为在自然语言处理技术发展的进程中,语言专家的作用微乎其微,拯救世界的任务还得落在程序员身上。
我去专门查过Frederick Jelinek大牛的维基百科介绍,里面有段话很有意思(注意粗体加下划线的部分):
“Although its fame and iconic status are undisputed (it was for example used as the title of a 1998 speech by Julia Hirschberg), its context is unknown and its specific wording and dating are unclear. According to Daniel Jurafsky and James H. Martin, Jelinek himself recalled the quote as "Anytime a linguist leaves the group the recognition rate goes up" and dated it to December 1988 (Wayne, Pennsylvania), further noting that the quote did not appear in the published proceeding,[2][3] whereas Roger K. Moore gave the wording as "Every time we fire a phonetician/linguist, the performance of our system goes up" and dated it to an IEEE Automatic Speech Recognition and Understanding workshop held in 1985.[4] According to Steve Young, "the story goes that one day one of his linguists resigned, and Fred decided to replace him not by another linguist but by an engineer. A little while later, Fred noticed that the performance of his system improved significantly. So he encouraged another linguist to find alternative employment, and sure enough performance improved again."”
思考
自然语言处理专家嘴边经常提及这句话,搞机器翻译技术的专家也时不时拿这句话调侃一下。如今很多机器翻译团队里并没有所谓的“语言学家”(Linguist),不需要任何语言学家就能搭建一套高效能的机器翻译程序,产出他们眼中高质量的机器翻译译文,发布令他们兴奋不已的成果。
而令他们兴奋不已的论文数据又会令媒体记者的双手颤抖不已,写下惊天地泣鬼神,令翻译人员闻字丧胆的热文。
但以下新闻引发了我的思考:
新闻一:
《谷歌:用算法和大数据“干掉”语言学家》
时间:2013年9月25日
摘要:
谷歌是一家极度看重算法、充满工程师文化的公司,但或许你还是会为此而感到惊奇——他们认为翻译是一个数学和统计学方面的问题。最近,位于谷歌总部的谷歌翻译团队正迅速扩张,他们新招了数名德国计算机科学家,但却没有招收一名语言学家。
新闻二:
《实现无监督学习?谷歌雇百名语言学家为训练数据“镀金”》
时间:2016年12月01日
摘要:
谷歌组织了一个由大量语言学博士组成团队,它把这支团队称为“Pygmalion”,使用这些语言学家人工筛选的数据来训练神经网络。实际上,谷歌的机器通过观察人类的做法来学习如何从长段落中提取相关答案,这个过程需要重复多遍,相当漫长。这些艰苦的努力同时证明了深度学习的能力和局限性。为了训练像这样的人工智能系统,需要大量的、由专业人士筛选过的数据。这些数据不容易得到,也不便宜,而且对这种数据的需求不会很快消失。
新闻三:
《特写 | 人工智能背后的人》
时间:2017年4月7日
摘要:
秦娇今年刚满 30 岁,几个月前刚刚从呼叫中心跳槽到一家「数据加工」公司。虽然跨了行业,她并不觉得两份工作有什么不同,都是按照甲方的要求和己方的工作节奏,把人手安排到一个又一个项目中去。
公司刚成立不到一年,眼下业务大多是标注数据,即根据项目方要求,人工为图片、视频和语音内容打标签、做标记。标注好的数据会被人工智能公司用来训练算法模型,然后应用到图像识别、语音识别等不同领域。
「数据加工」公司所在地距「大数据之城」贵阳五十多公里,是一座只接受科技公司入驻的「数字小镇」。
小镇的隔壁有一间规模不小的高职学校,学校的学生构成了这家公司目前主要的员工来源。高职学校初建的目的是教育扶贫,因此学生们大多来自贫困山区,学校会提供不少补助和奖学金。在数据加工公司兼职赚来的钱不仅足够生活,有些学生还会拿出一部分补贴家用。偶尔这份工作还能成为职业跳板,「我们的学生踏实又努力,有的去北京实习,因为熟悉标注工作、又认真,反馈回来说比同样实习的北京大学生强得多」。
除此之外,她们还可以承接小语种的语料收集工作。地处西南、临近东南亚,当地的人际关系链和频繁的商务交往能提供不少便利。
我不知道诸位读者看到这三条新闻后是什么样的感受?我的感受是这样的:
严格意义上来说,“语言学家”、“语言专家”、“语言学博士”与“翻译学家”、“翻译家”、“翻译专家”、“翻译学博士”是两个圈子的人。我如果说“我身边最牛的翻译根本不知道语言学是什么”,你信吗?我如果说“做翻译根本不需要语言学知识”,你信吗?我如果说“现在的翻译专业学生根本不需要《语言学》”,你信吗?
机器翻译研发团队之所以没有大牛翻译,并不是因为翻译人员没有作用,而是因为他们已经过气了,机器翻译研发团队手里拿来训练机器翻译程序的“语料/数据”是哪儿来的?还不是一堆他们并不知道名字的译者一个字一个字翻译出来的,但翻译完就完了,他们并不清楚自己的译文以后会起到什么作用,以为只是作为“作品”被陌生读者阅读罢了。
谷歌之所以又需要语言学博士来标注数据了,并不是因为他们的技术没有作用,而是因为他们手里的数据不够用了,需要由人来补充新的更高质量的数据。而机器翻译研发团队还没有开始招募“语言学博士”、“翻译学博士”,是因为人翻译的速度太慢了,价格又太贵了,短时间内提供的高质量的双语数据对机器翻译程序性能的提升并没有太大提升,而直接从第三方公司手中买廉价的双语数据或者自己写程序去抓取免费的双语数据则更划算一些。
标注数据这种工作跟富士康流水线上装配手机的工作一样,“恶心但必需”。“人工智能”时代,耗费多少“人工”,就有多么“智能”。
译者通常认为自己产出的“双语平行文本”没有什么用,但通过技术可以进一步挖掘双语平行文本中的诸多信息,比如双语术语、语义信息、句法信息等。那些年长的译者花几十年从双语文本中靠经验挖掘出来的“知识”可能远不及计算机程序几秒钟挖掘出来的的信息。
那人工智能时代,“译者”究竟扮演着什么样的角色?在我看来,只要世界不停转,译者就有翻译不完的文字,只要有翻译不完的文字就有赚不完的钱,所以译者的生存问题是不会受到影响的。
但,在今天的翻译行业生态环境下,“译者”也要顺应适者生存、优胜劣汰的法则,总有人因为不适应人工智能时代工作模式的变革而被淘汰,也总有人会在人工智能时代找到驾驭技术迎难而上的突破口。
人工智能时代,聪明的“译者”要做一个“变革者”,熟悉技术、拥抱技术、使用技术。但在这个过程中,译者其实处于非常弱势的位置,因为最终改变译者命运的不是译者自己,而是为译者提供技术服务的开发者。因此,聪明的“译者”还要做一个“合作者”,熟悉提供技术服务的人、使用他们提供的技术。
结语
人工智能时代,年轻一代译者的价值应当在两方面凸显,一方面是自身的翻译水平,另一方面是自身的技术认识。老一辈的译者可以在翻译水平方面引领年轻一代译者的发展,但不能冥顽不化,令年轻一代错失认识技术的良机。“技术”包罗万象,年轻一代译者并不需要样样精通,也绝无可能,需要有人引领年轻一代译者认识对其有价值的真技术。
作为年轻一代译者,被机器翻译专家开除并不可怕,可怕的是被翻译专家开除。- 上一篇:翻译技术与工具分类
- 下一篇:口译员如何提升记忆力