欢迎访问翻译网!

翻译网

您现在的位置是: 首页 > 笔译 >详情

机器翻译的前景分析(机器翻译产品)

发布时间:2024-01-21 22:00:26 笔译 501次 作者:翻译网

【赛迪网】作者简介:Jaap van der Meer老师是国际翻译自动化用户协会(taus)的创始人兼现任主席,被业界誉为国际语言行业的先驱。 1980年,他在荷兰创立了第一家翻译公司ink,并在10年内将其发展成为业内最大的公司之一。 1987年,Ink发布了第一个桌面术语提取和翻译记忆软件。他推动并资助了全球本地化行业标准协会(lisa)的成立会议。他曾担任第一家在纳斯达克成功上市的翻译公司alpnet的董事长兼首席执行官。他经常在会议上发表演讲,并撰写了大量有关翻译技术和全球化趋势的文章。内容简介:在本文中,翻译自动化用户协会(TAUS)主席Jaap van der Meer 先生讨论了全球翻译服务市场的技术突破以及这些技术突破给全球信息通信带来的革命性变化。本文提到的技术是指自动翻译技术或机器翻译(machine Translation)。自1954年以来,世界各地许多大学都开展了机器翻译的研究,但机器翻译仍然没有在商业领域得到广泛应用。然而,从20 世纪80 年代开始,一些翻译服务公司开始使用一种非常原始的翻译辅助工具,通常称为翻译记忆库(tm)。 tm工具将句子翻译存储在数据库中,以便当待翻译文档中重复出现相同句子时,译者可以直接使用它们。与TM相比,机器翻译指的是完全自动化。理论上,机器翻译会让翻译人员失业。然而,机器翻译技术输出的翻译质量无法满足出版和最终用户使用的要求。因此,专业翻译服务行业将继续存在很多年,提高机器翻译和译后编辑机器翻译翻译的技术。第一代机器翻译技术是基于句法分析和转换并结合双语词典:即基于规则的引擎。自20 世纪90 年代以来,人们开发了另一种构建机器翻译的方法,该方法忽略语法并完全依赖于语言和翻译数据的统计技术。这种方法称为基于统计的机器翻译,需要基于大量的单语和双语数据。这种方法利用了过去二十年积累的翻译记忆库数据。翻译作为翻译服务行业的实用技术早该出现,但现在它已经到来,并将改变一切。在不远的将来,当世界各地的人们都说自己的母语时,其他人就能听懂他们的意思。我们正在进入一个融合的时代:翻译技术将作为实用程序嵌入到应用程序、设备、标牌和显示器中。不断在新市场寻找新客户将使这个行业蓬勃发展。政府与民众的联系和沟通将更加便捷。消费者可以随时随地与人交流,仿佛永远没有语言障碍。别误会我的意思。机器翻译并不完美,但它打开了沟通的大门,打破了沟通的障碍。机器翻译可以提升翻译行业的水平,使其不断改进技术,填补国际交流的空白。这个愿景是否过于乐观?如果你像taus 一样相信翻译数据的力量,那么这个想法将不仅仅是一个幻想。翻译数据是机器翻译技术的燃料,数据为翻译引擎注入动力。翻译引擎可能永远无法等同于人类的语言能力,但它足以帮助我们在从未使用过或永远不会使用的语言环境中进行交流。机器翻译将成为新的通用语言。 “机器翻译经过了长时间的实验、尝试和检验,但尚未通过实用性的考验。在数百万人开始点击搜索页面上的翻译按钮之前,机器翻译被认为是乌托邦。但无论翻译质量多么糟糕、多么荒唐,人们都喜欢机器翻译的可控性和实时性。机器翻译是时代的标志,用户控制并驱动它的变化。

进入融合时代自1980年以来,翻译行业每十年都会发生一次变革(如下图所示),但没有任何一次变革像我们今天面临的“融合”变革那样剧烈。信息容量的爆炸式增长,已达到泽字节(10的21字节次方),可能与数十亿新用户随意点击翻译按钮有关。随着我们从20世纪的出口心态转向21世纪的全球开放社会,语言对的混合将从目前的7种源语言和60种目标语言转变为200种源语言和200种目标语言未来十年的目标语言。毫无疑问,纯粹由人驱动的翻译处理不能满足新世纪的需要。在当前的集成时代,公司和机构正忙于改变翻译功能的孤立状态,他们的重点是将翻译集成到内容管理系统等企业应用程序中。这将帮助企业提高能力,而不仅仅是翻译纯文本、说明、手册和软件。但日益增加的翻译量、越来越快的速度要求、甚至即时翻译的需求,都带来了很大的压力。这为创新者抓住融合机遇并提供前所未有的解决方案提供了众多机会。大数据大数据对翻译行业的重要性不可低估。大数据将推动自动化翻译向前发展。大数据将能够解决自然语言处理不同领域的挑战,包括机器翻译。计算机将能够自动运行语义聚类和类型识别过程,这意味着计算机可以识别行业领域(例如医学和放射学)和内容类型(例如规范或专利申请)。大数据对于机器翻译技术的持续改进和定制至关重要。由于现代机器翻译系统需要越来越多的并行数据,而如此大量的数据最终将达到使用传统数据管理技术无法处理的极限,因此大数据技术已成为决定性因素。如果计算机能够访问更多数据,它们还可以进行更好的术语挖掘。大数据可以识别同义词、相关术语、新词、行业术语,并利用并行处理工具自动生成句法分类。将简单的统计翻译模型发展为包含分层树结构(基于语法或对齐)的混合模型,使机器翻译引擎能够进行长距离排序并产生更流畅和准确的翻译,更适合结构差异较大的语言对。如此真实。翻译支持匹配新的内容组合在这个融合的时代,需要翻译的内容进一步从文档和软件版本转变为多屏发布的碎片化文本、音频和视频。最终用户、公众或患者将比现在拥有更大的控制权,并将推动持续翻译流应用程序的发展。该翻译流包括官方(公司、公共、立法)、社会、共享、增值和私人信息。翻译记忆库软件非常适合更新出版商提供的静态文件,但在翻译用户提交的动态内容时却表现不佳。机器翻译技术将更快成熟,成为翻译服务行业的首选工具。机器翻译平台将添加新功能,使专业用户能够添加数据(特定于客户或特定于产品的翻译记忆库、术语表和目标语言文本),这些数据可以几乎实时地训练和定制翻译引擎。适用于每项工作的机器翻译引擎的自助实时培训。与过去针对常见语言对的机器翻译开发成本高昂且耗时相比,未来机器翻译的个性化开发可谓是巨大的进步。它将带动翻译记忆库数据的不断扩大。对于每一个新工作,翻译人员都会寻找匹配的数据来微调翻译引擎。因此,对数据的需求永远不会得到满足。今天谁在使用机器翻译?如今,MT机器翻译技术正在迅速进入商业和政府领域。今年6月,全球化与本地化协会(GLA)和下一代本地化技术中心(CNGL)进行了一项调查。

机器翻译的前景分析(机器翻译产品)

调查显示,在超过500 名受访者中,超过三分之一的受访者表示目前正在使用MT 机器翻译,更高比例的受访者表示他们在业务中没有使用MT 机器翻译。但在未来一两年内,mt机器翻译将会被使用。中国翻译公司MT机器翻译的使用率较低,但不少公司都在投资MT机器翻译。在国内,北京赛迪翻译技术公司长期从事机器翻译的研究和开发,开发了结合句法和统计方法的翻译技术。在文思海辉、csoft、lingosail、sunlike等语言服务提供商中,有的已经构建了自己的引擎,有的则使用开源机器翻译技术(如moses)来训练和定制自己的引擎。华为、有道、百度等中国IT企业都拥有自己的机器翻译研发团队。此外,许多跨国公司,如SDL、Lionbox、Adobe、微软、赛门铁克和EMC等都在中国投资了机器翻译的研发。在欧洲,欧盟委员会翻译总司自20 世纪80 年代以来一直在使用机器翻译。最近,他们已将机器翻译开发完全转向基于开源统计的机器翻译系统,该系统使用欧盟委员会翻译总司收集和翻译的大量法律文本进行训练,包括23 种欧盟语言。使用机器翻译的动机主要不是为了降低成本。翻译自动化用户协会(taus) 最近进行的一项调查显示,受访者使用机器翻译的主要原因是能够处理大批量翻译并更快地交付翻译作业。如何评价机器翻译?对于使用和开发机器翻译的个人或组织来说,最大的挑战是如何评估翻译结果的质量。研究人员开发了bleu、ter等自动评估方法,但对实际用户帮助不大。 TAUS 与许多成员合作开发了动态翻译质量框架(DQF)。这是一个在线知识库和工具集,主要用于对机器翻译引擎进行比较和排名、评估准确性和流畅性、对机器翻译译后编辑进行生产力评估并记录错误类型。 taus 的动态翻译质量框架可帮助所有机器翻译用户和开发人员获得自动翻译性能的客观报告和行业基准。有关TAUS 和TAUS 动态翻译质量框架(dqf) 的更多信息,请登录www.taus.net。