
假设有随时可以请教的语伴,你可能不必在大四时还戴着写着“必胜”的头带奋战英语四级。假设有一种可以当作语伴的学习工具,许多人就不必慨叹自己来自国外国友人罕至的地区,没有机会学习纯正的英语。现在,英库——一款由微软开发的在线英语学习工具,提供了随时可以请教的、讲纯正英语的语伴。
目前,英库的月访问量已经超过1百万,它带来了席卷大量学习者的全新体验,并全线出击打败中式英语(Chinglish)、雷人英语、哑吧英语。在2010年6月30日揭晓的华尔街日报亚洲版(Wall Street Journal
Asia)2010亚洲革新奖的评选中,英库从来自中国、印度、日本、韩国、新加坡到澳大利亚,涉及领域从环保到信息技术将近300个优秀项目中脱颖而出,成为12位最终候选人之一。我们一起来看看英库到底有多酷。
语伴式的在线英语学习工具
“如今微软推出专门的写作搜索引擎英库,使用了下感觉还是不错的,不仅有基本词典,还有词性百搭,词条对比,还有例句筛选,总之感觉比以前不得已的方法有专业很多,特此推荐。”——Jeff
Ye
这是在英库申请2010亚洲革新奖的过程中,微软亚洲研究院的研究员们收集到的用户反馈,其中提及了英库的许多特色功能。在中国,
英语是学生的必修科目,但是,由于地域和学习方法等因素的影响,求学多年的中国学生也难逃哑吧英语、中式英语的泥淖。而英库是一款用户需求导向、针对中国人英语学习特点而设计的辞典,其中有不少具有中国特色的辞典功能。
例如,例句中的单词实现了逐词对比功能。当出现一个例句,你的鼠标点在一个单词上,就会在相应的中文句子翻译中出现对应的单词。如此以来,你可以非常清楚地看到中英文的语法,自己便可以进行语法学习,精准地掌握中英文语言结构的差异。

另外,例句还可以按用户的不同的需求进行筛选。按照难度,用户可
以把它分成:简单、中等、难等,而按照来源可分为:字典、互联网,按照类别可以分为:口语、书面语、技术、标题等。
更有趣的是,英库的研发人员注意到,中国的用户喜欢用中文的发音规律来拼写英文,例如,寻找“香槟(Champagne)”,中国用户可能按照拼音的拼写规律写成“Shampin”。一般情况下,这样是找不到单词的,因此也不能掌握正确的知识。但是,在英库上即使拼错,也会出现相应的推荐词汇,便于用户在其中找到想要的单词。
除了单词,搭配也是一大难题。英库帮你华丽转身,成为“搭配达人”。例如,输入“terrific
prep.”,你将可以找到例如“I
think it looks terrific on you(我觉得你穿上它好极了)”从而了解到“terrific”后面搭配的介词可以用“on”。再如,你想盛赞一位美国丽人,但词汇匮乏,于是搜索“She
is a adj. lady.” 就能找到例如“She
is a charming young lady.(她是一位迷人的年轻女士。)”之类的例句。有了这项功能,申请出国留学的同学、在灯下奋战在大学英语四级的同学,不必苦苦众里寻它,只需轻轻点击,就能找到恰切、地道的搭配。
以上功能对雷人翻译、中式搭配发起了猛功,除此之外,英库学对哑吧英语开了火。平日里我们开口讲英语的能力没有得到开发,一是因为与外国友人交流机会的匮乏,二是因为怕说错。而怕说错很大程度上是因为没有随时可供模仿、学习的材料。英库应用了一项文本到语音的技术,这项功能从语音上对英语母语的人进行了逼真的模仿。它可以把升降调、着重,甚至韵律都模拟得淋漓尽致,而且用户还可以MP3进行方便的下载。如此以来,它就像一个如影随行的语伴一样,让你想学什么就学什么,行走站立睡前发呆的时间都能学到纯正的英语。
值得注意的是,语言是源头活水,每天都有许多新的词汇随着社会生活的变化而产生。英库辞典也是一个源头活水,它的词汇量也在不断地扩大。目前,它已经拥有了数以百万计的术语和句子。英库基于全新的网络挖掘(web-mining)技术,不断地收录高质量的翻译。因此,它所提供的是纯正的、无尽衍生英的、相关性高的搜索结果。英库的网络挖掘系统夜以继日地发现并摘录翻译信息,以数以千计的速度扩展单词和例句。它就如同海绵一般,不断地吸收养分,不断地扩充数据库。
应用驱动的新模式
“这个英库,虽然也是个在线翻译,但是是个做得很漂亮兼强大的web客户端,充分体现了云计算的力量吧”——用户反馈
这些针对中国用户学习英语的特有功能,基于对语音技术、云计算等多项信息科学前沿的的整合应用,得益于微软各个部门之间的分工与合作,也是以应用驱动的新研究模式的结晶。
在微软,英库是一项跨研究组、跨研究领域的合作,也是产品组、研究组分别做出突出贡献的典范。必应和MSN产品组贡献了他们在工程方面的优势和市场经验,使得英库得以作为一项具有竞争力的产品。而微软亚洲研究院的包括自然语言计算(和微软雷德蒙研究院翻译组合作),语音组、人机交互组、和互联网数据管理组,都做出了重要的贡献。在研究组与产品组之间穿针引线进行无缝连接的,是创新工程组。
英库从想法变成现实,还得益于“应用驱动的研究”(deployment-driven
research)策略,和微软对于颇耗时日的基础研究的支持决定。首先,英库是一项长期的研究项目,在十年前就已经由自然语言计算组所启动。其次,“应用驱动的研究”策略,
让它得以在研究开展过程中,就向大众公布,这让它得以获得更长远的发展前景。英库的开发造就了一项从基础研究转化为产品的新转化模式。
英库有多酷
基于出色的跨组合、跨领域、跨部门合作,以用户为导向满足中国特色的英语学习需求,英库正在变得越来越酷。
它把网络数据、机器翻译以及语言学习的经验放置于一个简单易学的用户界面。通过持续不断地发掘并分析网上高质量的翻译,这项技术革新可以填补日益扩大的中英翻译鸿沟。经过微软亚洲研究院的十年努力研发,和必应搜索引擎对英库的引进,英库可以预见一个发展前景。
目前,中国境内的在线翻译可谓是群雄逐鹿。虽然目前有许多很有竞争力的产品,但它们只分别是字典、机器翻译应用或语言学习服务。英库的不同之处在于,它不仅无缝地以简易的用户界面统一了所有这些领域,而且在这每一项领域,都超越了其它的服务平台。作为字典,它拥有着更优秀、更大范围的字词解释来源,由1000万词汇和例句组成。而且这个例句库还在不断扩充当中,就像一个海绵一样吸收着所有的语言。作为机器翻译引擎,它得到了相关领域的领军人物的认可。作为学习工具,英库也更加地新颖并且实用。
2009年,访问量增长了500%,这表明英库在公众当中日渐受到欢迎,许多用户在使用之后,都会成了“回头客”。它在日常生活、教育中的应用价值日渐显现,其中应用的技术也得到了学界权威的认可。
在世博会期间,英库团队与MSN和上海市政府一道,发起并经营了六个月的网站:http://engkoo.msn.cn/expo,旨在纠正上海世博会上的“雷人”英语,超过600名上海学生志愿者参加了这个项目,收集了数以百计的雷人翻译,并将它们分类公布。《中国日报》、《纽约时报》等媒体都竞相报道。根据政府的报道,共有超过万个英语标示牌,被正确地道的翻译取而代之。
在教育方面,英库目前已经被用于许多高校的英语课程当中,其中就包括清华大学英语系。教授们给以积极的反馈,英库也同时得到了其它英语教育界领袖的推崇。
不仅在应用方面,英库所应用的技术也得到了学界的权威认可。在近期举办的中国机器翻译研讨会(CWMT)上,在美国标准与技术研究院(NIST
MT),英库的中英翻译排名第一。
英库所用的文本—语音(TTS)技术在国际文本—语音大赛——2010暴风雪大挑战(2010
Blizzard Challenge)中,力拔头筹。

英库与今日社会的关系尤为紧密。从事信息产业相关工作的人员,进行全球化沟通的需求日益增长;在学校中找到流利而地道的英语学习材料仍旧困难,尤其阻碍了不发达地区的学生学习英语;日常生活、公共空间中随处可见的雷人“中式英语”(Chinglish),对人们的出行造成了不利影响,也有损于公共空间的形象。这些需求都可以通过运用英库的技术得到不错的满足。
正如美国全球翻译服务公司首席执行官Dave Grunwald 的评价,英库的贡献在于“为世界上人口最稠密的国家提供高质量、免费的在线学习工具,微软成功地架起了中国与西方世界的桥梁。踏过语言的鸿沟,中国公司将能够在网络市场和全球市场上更有利的竞争。”
--------------------------------------------------------------------------------------------
欢迎关注微软亚洲研究院微博:http://t.sina.com.cn/msra
相关视频:
英库使用说明视频
相关阅读:
微软教你作英文
微软英库的历史传奇
在http://blog.sina.com.cn/s/blog_4caedc7a0100lxml.html阅读整个文章
发表于
08-26-2010 10:03
作者
微软亚洲研究院