漫谈人工智能机器翻译的前世今生

96
视界云科技社区
2017.12.28 11:05 字数 1617

在人工智能发展进程中艾伦·麦席森·图灵,这位著名英国数学家、逻辑学家,最早提出了机器人是否会思考的概念,图灵也被誉为现代计算机科学之父和人工智能之父!

艾伦·麦席森·图灵(1912年6月23日-1954年6月7日)

人工智能(Artificial Intelligence)简称AI,AI能根据大量的历史资料和实时观察(real-time observation)找出对于未来预测性的洞察(predictive insights)。

我们把时间推回到半个多世纪的某个夏天,此时麦卡锡、明斯基等众科学家们正在举办一场Party,在这次聚会上探讨和共同研究了用机器模拟智能的问题,也是在那时,“人工智能(AI)”的理念正式被提出!

如今人工智能商业化正在快速推进中,比如我们所知道和了解的人像识别、图像识别技术、语音识别、自然语言理解、用户画像等,现在我们所讨论的机器翻译也是AI一大主要战场!

现在我们再把焦点放回到机器翻译上,现阶段机器翻译也被主流的称之为:统计翻译

机器翻译的基本原理是:从语料库大量的翻译实例中自动学习翻译知识,然后利用这些翻译知识自动翻译其他句子。

这件事听起来似乎很简单,但是实际上难度超过了我们的想象!

不同语言的语序不一样,即使是同一个句子,它也可能有很多种正确的但不同的翻译方法,而且纵使是同一个句子,在不同语境下的内涵和意义也不尽相同,如果再考虑到文化、宗教、政治、信仰等等复杂原因的影响呢!

大体上来看机器翻译的几大障碍包括:一词多义、理解上的歧义、结构不同造成的歧义、词性多解、文化因素不同,等等都是制约和影响翻译质量的因素。

机器翻译涵盖人工智能、数学、语言学、计算语言学、语音识别及语音合成等多种学科及技术,显然机器翻译本身很不简单,是一个复杂、庞大、意义重大的系统工程!

纵观机器翻译发展的进程,可以把其划分为下面五个重要阶段:

1.机器翻译正式拉开序幕

1947年

美国人Weaver提出的把翻译看成是一种解码的过程

1949年

Warren Weaver发表《翻译备忘录》,正式提出机器翻译的思想

1954年

美国乔治敦大学首次用IBM-701计算机进行英俄翻译,通过这次机器翻译的公开演示,算是正式拉开了机器翻译研究的序幕

IBM-701计算机的英俄翻译

2.机器翻译陷入低潮期

1966年

1964年,美国科学院成立了语言自动处理咨询委员会(Automatic Language Processing Advisory Committee),委员会经过2年的研究,于1966年公布了一份名为《语言与机器》的报告。

该报告全面否定了机器翻译的可行性,并宣称“在近期或可以预见的未来,开发出实用的机器翻译系统是没有指望的”。

机器翻译开始陷入低谷和空前的萧条中!

3.机器翻译进入复苏期

1970年

转换生成语法理论取得重大进展及AI技术的进步,机器翻译进入复苏期

4.机器翻译走向繁荣期

1976年

加拿大蒙特利尔大学与加拿大联邦政府翻译局联合开发的TAUM-METEO系统,是机器翻译发展史上的一个里程碑,标志着机器翻译由复苏走向繁荣

5.机器翻译持续发展期

1985年

日本著名机器翻译专家长尾真(MakotoNagao)在《TranslationbyAnalogy》中首次提出基于实例的机器翻译思想

其基本思想是:不通过深层的分析,仅通过已有的经验知识,通过类比原理进行翻译

1993年

IBM的Brown和Della Pietra等人提出的基于词对齐的翻译模型,标志着现代统计机器翻译方法的诞生

1994年

Robert Frederking提出多引擎机器翻译方法

其基本思想是:

1.多个翻译引擎同时对输入的句子进行翻译,不仅对整句进行,同时对句中任何一个片段也给出对应的译文,并对这些译文片段给出一个评分

2.各个翻译引擎共享一个类似chart的数据结构,根据其源文片段所处的位置,将这些译文片段放在这个公共的chart结构中

3.对各个引擎给出的片段评分进行一致化处理,使之具有可比较性

4.采用一个动态规划算法(chartwalk算法)选择一组刚好能覆盖整个源文输入句子,同时又具有最高总分的译文片段作为输出

2003年

爱丁堡大学的Koehn提出短语翻译模型,使机器翻译效果显著提升,借助同时期Franz Och提出的对数线性模型及其权重训练方法,短语翻译模型在工业界开始广泛采用

2005年

David Chang提出了层次短语模型,同时还有多个大学和研究所在基于语法树的翻译模型方面研究也取得了长足的进步

人工智能机器翻译的春天和蜜月期是不是真的已经到来?

回到当下,人工智能机器翻译尚不能做到无障碍的沟通和顺畅无碍的进行语义上的理解和交流。

显然距离我们最终想要机器翻译达到的效果,还有很长的路要走!

未来,我们拭目以待更多更亮眼产品的出现!

Web note ad 1