欢迎访问翻译网!

翻译网

您现在的位置是: 首页 > 笔译 >详情

基于大数据的互联网机器翻译核心技术及产业化(大数据与翻译)

发布时间:2024-01-24 20:09:38 笔译 669次 作者:翻译网

大数据时代,数据无处不在,数据的激增会导致沟通需求的激增,进而推动语言服务需求的激增。大数据技术是反映社会技术本质的综合技术。技术社会,其重要特征是技术因素相对活跃,技术发展和技术创新占主导地位。这将对翻译行业的发展产生不可估量的影响。在语言服务行业,很多过去难以量化的信息将被转化为数据进行存储和处理。大量复杂的待翻译项目逐渐浮出水面。因此,激发和利用隐藏在数据中尚未被发现的价值来发展语言服务产业。蓝海是翻译行业的大势所趋。传统的翻译研究者仅限于对语言和文本的研究,并没有充分认识到翻译技术在当今商业环境中所发挥的巨大作用。传统翻译理论也难以描述和解释现代新的翻译技术现象和翻译技术。活动。无论我们是否准备好,大数据时代的翻译技术正在快速发展,翻译研究和翻译教学将在全球范围内发生重大变革。

1、大数据时代的语言服务变革

基于大数据的互联网机器翻译核心技术及产业化(大数据与翻译)

一般认为,语言服务行业包括翻译与本地化服务、语言技术工具开发、语言教学与培训、多语言信息咨询四大业务领域。语言服务产业的发展离不开海量信息的高速处理。然而,在经济全球化的背景下,信息量呈几何级数增长。过去两年产生的数据量相当于人类之前所有时代产生的数据总量。知识的增长和分化已经远远超出了人类的最大承受能力。因此,在信息时代,社会的快速发展必须依靠信息处理技术。大数据计算技术应运而生,解决了数据规模过大、传统计算方法无法在合理时间内完成分析处理的技术问题。基于统计方法的大数据技术和自然语言处理技术广泛应用于语音识别、机器翻译、语义检索等领域。其他技术领域也取得了重大突破(唐志芳,于洋,2015)。近年来,语言服务和技术市场不断增长,市场年增长率逐年提高,从2009年的250亿美元增长到2016年的402.7亿美元。这种变化反过来给语言服务行业带来了新的机遇。进入新信息时代:语言服务的内容不再局限于口译和笔译,而是日益多元化。大数据催生了许多新的业务类型,语言服务市场的结构发生了很大的变化:虽然总体而言,2016年语言服务行业最重要的业务是传统翻译和现场口译,市场总量两者的份额从2013年的57%增加到近73%。但与2013年相比,会议口译(占比3.32%)、手机本地化(占比0.51%)、游戏本地化(占比0.54%)、搜索引擎优化(占比0.35%)、字幕等领域新崛起。语言服务业。换算一下(占比1.08%),这些新兴产业的市场份额虽小,但相对稳定。 (CSA,2016)。与此同时,市场日益多元化导致服务模式发生变化。例如,当前的跨境电商通常需要实时的多语言沟通和翻译,因此实时、动态、碎片化的微语言服务模式已经进入历史舞台,多元化的语言策略也应随之而生。跟上市场。步伐不断变化。

2、大数据时代翻译技术的发展

大数据时代,世界是由数据组成和表达的。我们人类已知的数据只是冰山一角,还有大量数据没有被充分挖掘、理解和利用。面对海量、混乱、非结构化的数据,迫切需要现代语言处理技术来挖掘更多对特定行业有意义和有价值的数据。在新技术驱动下,新兴语言服务市场的重要特征是海量量化、多元化、碎片化、多模态、即时性。这些特点都需要语言技术作为基础支撑。在大数据时代,以翻译为例,翻译作为一种产品,可以用数据来标记,比如原文的诞生、译文生命的延续、译者的风格、译文的版本管理等。翻译、翻译的跨国传播、翻译的受众、翻译的传播效果等诸多因素可追溯,可以生成庞大的翻译数据库,将对翻译教育和研究产生深远的影响。

随着信息技术的发展,特别是近年来在云计算和大数据技术的推动下,语音识别、翻译技术和翻译平台技术都不断发展。大数据时代,语料资源更加丰富,语音识别技术快速发展;科大讯飞还开发了语音听写、语音输入法、语音翻译、语音学习、会议听写、舆情监测等智能语言技术。以SDL为代表的翻译工具开发商还开发了基于网络的技术写作、翻译记忆库、术语管理、语音识别、自动化质量保证、翻译管理等工具,并已广泛应用于工业翻译实践中。计算机辅助翻译软件也取得了长足的进步,从单机版本走向网络协作和云端,从单一的PC平台走向多元化的智能终端。 Flitto、TryCan、Onesky等生态一体化众包翻译平台也受益于大数据技术,蓬勃发展。以中业科技开发的Trycan翻译平台为例。它依托互联网大数据,结合不同国家的语言环境、地域等因素。还依托中业科技背后数万名在线兼职译者和多个资深译者评审系统。尤其是翻译时限,保证各种翻译在一分钟内解决,改变机器翻译和人工翻译的模式,让翻译更加人性化。

3.大数据时代的翻译教学

纵观我国翻译技术教学,传统翻译教学起步较早。 2006年,教育部批准三所大学开设本科翻译专业(Bachelor of Translation and Interpreting,BTI); 2007年,有15所大学开设笔译与口译硕士(MTI); 2011年,MTI大学158所,BTI大学42所; 2012年,159所高校开设了MTI,106所高校开设了BTI; 2016年,共有206所高校开设了MTI,230所高校开设了BTI。翻译人才要满足市场需求,但科技的快速发展要求翻译人员具备更高水平的全方位、立体化的多元化能力。高校输送的人才很难满足企业的招聘需求。在此背景下,北大MTI于2009年开始开设翻译技术和本地化建设课程,并于2013年开创了语言服务管理方向,为企业输送了多批合适的人才,但少数毕业生仍无法胜任。满足企业日益增长的人才需求。 2014年至2015年,北京语言大学、广东外语外贸大学、西安外国语大学等开展本土化培养,旨在培养适应本土化服务市场需求的专业人才。许多大学也开始根据当地区域和经济发展趋势制定本地化项目。特色,开始与国际企业制定定制化人才培养策略。

大数据时代,机器翻译、计算机辅助翻译技术、智能语音转录与识别技术正在快速发展。翻译技术已从桌面转移到云端。翻译技术无处不在,语言服务市场不断变化,对人才的需求也今非昔比。与传统翻译行业相比,现代翻译的对象、形式、过程、方法和环境都发生了巨大的变化。翻译教育也应充分考虑这些变化,培养适应市场需求的人才。在翻译生态环境中,翻译的技术加工包括翻译技术、校对技术、质检技术、管理技术、排版技术等流程,对应的有专业译员、校对员、质检员、项目经理和排版专员等。角色。在这种系统模型中,翻译系统的各种技术需求与人才培养系统的职业培养目标相匹配,要求翻译教学与市场开发必须紧密结合。高校应首先分析市场,设定合理的人才培养目标,然后调整翻译教学内容,在课程中增加市场急需的翻译技术,有针对性地培养懂翻译、懂技术的语言服务人才。例如,在大数据的帮助下,机器翻译技术取得了长足的进步。以微软的机器翻译技术为例。在某些领域,利用深度神经网络技术,准确率可以保持在80%到90%之间。机器翻译系统预翻译后,可通过人工编辑和审校完成。翻译,这就是所谓的机器翻译编辑模式。因此,译者需要知道如何与机器“合作”以及如何高效地进行译后编辑。那么,这部分内容就必须纳入到翻译教学中,以保证高效的人才输出符合企业需求。

另外,翻译技术教学不同于传统的翻译教学。在实施过程中,需要利用现代教育技术和平台(如Moodle课程管理系统、Virtualclass系统、MOOC教学模式),将现代教育的最新成果融入到翻译技术课程中。在教学中,推动翻译教学创新,与时俱进。

4. 总结

大数据时代的翻译技术本质上是数字人文主义下翻译人文与技术的融合。两者相互影响、相互作用、共存。翻译技术是翻译活动和翻译社会的建设和促进。新时代背景下,翻译技术已成为翻译从业者不可避免的命运。我们要以开放的心态拥抱新技术的发展,充分认识技术的人文性和技术性的关系,充分发挥现代翻译的优势,根据技术的优势,紧跟市场的发展,调整我们的人才培养策略和教学大纲旨在培养适应时代发展和市场需求的综合素质现代语言服务人才。

注:原文来自《东方翻译》。作者:王华树,广东外语外贸大学外语研究与协同创新中心教师。本文转载自翻译教学与研究,版权归原作者所有。