小黑游戏最新手机游戏下载平台

手游资讯 最近更新 热门排行
您现在的位置:首页 > 软件资讯 > 应用教程 > 不是翻译器的“翻译” EWW颠覆传统翻译方式

不是翻译器的“翻译” EWW颠覆传统翻译方式

2025-01-01 17:51作者:佚名来源:本站整理浏览:884

不是翻译器的“翻译” EWW颠覆传统翻译方式


    互联网的发展让五湖四海的人们聚在了一起。在交流中,无论人们以哪种母语进行思考,都会用英文作为默认的沟通工具表达思想。现在,人们早已习惯翻译工具带来的“即点即得”的便利,但在写作中,人们感觉到,只知道词语的意思并不能写出连贯而准确的句子。

  在微软亚洲研究院,自然语言计算组(NLC)一直在研究如何帮助母语不是英语的人更好的写英文,主任周明博士介绍说:“我们发现,人们在英语写作中最大的问题是如何选择一个恰当的词,这也是人们感觉最困难的事情。”

  再见,“Chinglish”

  微软Office 2003企业版就集成了这样一个英文写作辅助工具,English Writing Wizard(简称EWW),它可以帮助用户选择合适的单词进行搭配。

  “EWW不是一个翻译工具。”采访一开始,周明就向记者强调这个问题。EWW不是翻译工具,因为它不翻译整个句子,更不翻译整篇文章;EWW也不是一个电子词典,因为它不提供单词的详细释义。EWW的功能恰在两者之间,它翻译的对象比单词长、比整句短,因为它只翻译短语。例如,在“订客房”和“订计划”这两个短语中,EWW可以分别用不同的英文动词对“订”做出翻译;在说“大雨”时,EWW可以告诉用户应该用“big”还是其它的单词(如heavy, strong)来形容大雨……中国人受母语的影响,习惯于在写英语时,常常不自觉地逐词直接翻译,结果写成了“Chinglish”。

  在周明的笔记本电脑上,作为演示的EWW依然是一个单独运行的程序,界面左边用来输入文本,右边用来显示词语搭配及其来源的例句。通过实例,周明逐一演示了EWW的3个功能。一是提供搭配的示例,比如book一词,在搜索结果中显示了它有名词和动词两个词性,由此提供了两组不同的词语搭配。在动词搭配中,book可以连接酒店或航班等词,表示“订客房”和“订机票”的含义。

  周明用paraphrase一词定义EWW的第二个功能,即寻找同义或近义的表达方法。例如输入“overcome difficulty(克服困难)”这个动宾词组时,程序可以搜索到“get over difficulty”等近似的表达方法。这个功能能帮助人们使用更丰富的词汇进行写作,让文章变得更加生动。试想在一本书中,当一章内第五次出现同一个“克服困难”的短语时,可能有一半读者已经睡着了。

  以上两种功能只与英语有关,因此可以在各国用户中通用,甚至是“语文”不太好的英文母语用户。而当中文用户根本不知道某个意思的英文表达时,就用到了第三个功能—浅层翻译,“浅层”意味着它不同于以往的整句翻译。用户可以直接输入中文,比如“订计划”,界面右边则会提供若干种对应的英文翻译。这个功能也体现出EWW比词典更加智能的地方,因为它根据上下文确定了“订”的准确翻译,而电子词典通常只是节约了翻页查找的半分钟时间,却无法给出准确的单词搭配。

  有趣的是,研究EWW的想法来自周明自己的需求,“我学习英语是很认真的,但在写作时还是觉得困难,我特别希望旁边有一个人给我指点,告诉我什么时候用什么单词。于是我积攒了很多别人的英文email,当遇到相似情况时,我就把它们修改一下,写到自己的email里。”简单地说,这是一种有效的英语学习方法,但如果将这种朴素的思想加以提升,试着让计算机自己从语料库里学习单词搭配,那么研究的成果就很可能成为一种成熟的工具,去帮助更多的人解决英文写作的问题。

  事实上,和幼儿一样,计算机也是从模仿别人说话开始学习语言的。为此,研究人员要为计算机准备大量的中英文对照语料,让计算机统计其中各个单词出现的规律,从而分析出它们之间的搭配关系。为了让计算机准确识别出主谓、动宾等搭配关系,计算机的学习算法就显得非常重要。

  这些算法的原理可以这样理解,比如通过分析语料,计算机发现单词“雨”可以和“大” 经常构成定语和中心语的搭配关系,所以机器就学会了“大雨”这个搭配。虽然语料中有可能出现“黑雨”、“石头雨”等用法,但是由于它们出现的概率过小,而不被认作是常用的搭配。通过目前算法得到的梗概信息虽然足以应付日常的需求了,但为了商品化,这些信息还要进行一次手工筛选,以便把准确性再提高一个档次。

  寻找定位

  去年,有一部名叫Lost in Translation(迷失东京)的电影受到了人们的关注,它讲述了在跨语言和跨文化交流中,人们的迷失和迷茫。最近,MIT′s Technology Review杂志借用这部电影的名称,发表了一篇名为“Less Lost in Translation”的报道,以此说明EWW为不同人群的交流发挥的积极作用。

  报道刊发后,很多人都对这个诞生在微软亚洲研究院的英文工具表现出了浓厚的兴趣,而这种热情好像早在周明的预料之中,因为他非常看好EWW的扩展性,也相信EWW在海外存在着巨大市场。“在美国,有2000万人的母语是西班牙语;日本、韩国和法国等非英语国家说英语的人数加起来是母语为英语的人数的3倍。他们和我们一样,在英文写作时会碰到选词的问题。”

  相比于海外市场,国内的市场也十分巨大:办公室人员、高校内的研究人员等受过高等教育的人都是EWW的目标用户。“每年高校毕业生有多少,EWW的目标用户就增加多少。”周明不无自豪地说,能够定位到这个巨大的市场是因为“选研究方向时没有随大流。”现在市场上的英语辅助阅读工具很多,产品也很成熟,但另一方面,英文写作辅助工具却是一片空白,市场上只存在机器翻译软件,以现有的技术,还无法翻译出准确、漂亮的英文文章。在两种产品的夹缝中,EWW发现了用户需求的空白,它以机器翻译的理论为基础,却实现了一种更巧妙的应用,没有掉进以往人们追求的全文机器翻译的窠臼里。

  3年前,这种创新的思想引导周明及其所在的NLC组开始了对EWW的研究。但是开始时,周明设想的EWW与现在的版本有很大的不同,当时他希望当用户写作时,EWW的界面上会不停地显示例句,一副酷劲十足的样子。但是产品组的用户调查给周明泼了冷水,调查发现,用户并不喜欢这样的产品,在没有碰到写作障碍时,他们不想接受EWW的写作建议,觉得自己写得足够好了。于是在EWW研发开始一年后,一切都推倒重来了。

  在给EWW重新定位的日子里,周明翻阅了大量的英文学习资料,他逐渐认识到用户最头疼的问题在于如何选择正确的单词进行搭配。在接下来的两年里,NLC组一直在围绕选词问题展开研究。同时产品组也通过市场调查,及时向研究组提供用户反馈,从而不断调整课题研究的方向。现在,EWW与拼写检查、词典等工具一起被集成到微软Office中了。

  而这也体现了一个了解市场的研究人员的优势,他知道如何在“技术前瞻”和“市场需求”之间寻找到一个平衡点。在周明所在的NLC小组,有70%~80%的科研成果可以转化为产品,高于研究院的平均转化率。周明认为这源自于这个小组的特殊性,它研究的是与中文相关的自然语言项目,“在全世界的中文研究机构中,我们这里应该是最贴近市场的。”


【责任编辑:赢政天下更新小组成员shuijing】


    
    
     
    
    
Tags: 责任编辑:小黑游戏
'); })();