乐动网页版_乐动(中国)


    咨询热线:021-80392549

    乐动网页版_乐动(中国) QQ在线 乐动网页版_乐动(中国) 企业(yè)微信
    乐动网页版_乐动(中国)
    乐动网页版_乐动(中国) 资讯 > 人工智能 > 正文

    人工智能真(zhēn)的可以取代同传翻译?

    2019/01/02机器人(rén)网465

    portant;" />

    前阵子(zǐ),一位同传翻译员声讨科大(dà)讯飞“AI同传(chuán)造假”,在网上引起了轩然大(dà)波。人(rén)工(gōng)智能和同传翻译由此(cǐ)成(chéng)为(wéi)大家热议的话题。今天,我们(men)来(lái)谈一(yī)谈“人工(gōng)智能翻译是否(fǒu)真的可以取代同传翻译员”?

    同声传译有多难(nán)?

    同(tóng)声传(chuán)译最早出现在一战后的巴黎和会(huì)上,英法两(liǎng)国(guó)代表借助同(tóng)声传译人员(yuán)的(de)帮(bāng)助,完成了紧张的谈判。

    如今,该技术依然(rán)在(zài)国(guó)际会议上扮(bàn)演着极(jí)其重要的角色。据统计,95%的国际会议都有专(zhuān)业同(tóng)声传译(yì)人员助(zhù)力。

    同传翻译员(yuán)在(zài)台上能够将(jiāng)同传能力运用自如,需(xū)要平时大量的艰苦练习,即使(shǐ)是双语运用自如的专业人员,在实战(zhàn)之前(qián),也(yě)要进行数年的锻炼(liàn)。他们不仅需(xū)要事先学习、熟悉会议资料,还(hái)需(xū)要随机应变的能力。同(tóng)声传译(yì)的工(gōng)作方式也比(bǐ)较特殊,因(yīn)为压力巨(jù)大,一般多(duō)人协同,在(zài)一(yī)场数小时(shí)的过程中,每人轮流翻译几十分钟。

    相(xiàng)较之下(xià),普通(tōng)的口译工作则要简单不少。机器翻(fān)译如能代(dài)替(tì)同声传(chuán)译(yì)无(wú)疑具有巨大的价值。

    人工智能翻译的水(shuǐ)平如(rú)何?

    那么,人(rén)工智能同(tóng)传翻译的能力究竟怎(zěn)样?会不会抢走(zǒu)同(tóng)传翻译员的饭碗(wǎn)呢?

    今年上半年的博鳌亚洲论坛上,首次出现了AI同传。然而,现场配(pèi)备(bèi)的系(xì)统却掉了链子,闹出词(cí)汇翻译(yì)不准(zhǔn)确、重复等低级错误。

    客观来讲,人(rén)工智能或机器(qì)翻译技术在自然语言处理上(shàng),的确有许(xǔ)多突破。这些突(tū)破(pò)给人希望,让人(rén)畅想(xiǎng)未来,但是,短期内的价值,更多(duō)体现在辅助翻译等(děng)领域(yù)。

    当然,目前机器翻译已经取得非常大的(de)进步,在衣食住行等(děng)常(cháng)用生活用语上的中英翻译可以(yǐ)达到大学六级(jí)的水平,能够帮助人们在一些场景处理语言交(jiāo)流的问题,但(dàn)距离人工(gōng)同传以及(jí)高水平(píng)翻译所(suǒ)讲究的“信、达、雅”,还存在很大的(de)差距。

    目前的差距是由现有技术水(shuǐ)平的限制决定的(de),机(jī)器翻译,又(yòu)称为自动翻译,是利(lì)用计算机(jī)将一(yī)种(zhǒng)语言转换为另一种语言,机器(qì)翻译技术的发展与计(jì)算机技术、信息论、语言学等学科的(de)发展紧(jǐn)密相关(guān)。从早期的词典匹配,到结(jié)合语言学专家梳理的(de)知识规则,再到基于语料库的统计(jì)学方法,随着(zhe)计(jì)算(suàn)能力的提升和多语言信(xìn)息的积累,机器(qì)翻(fān)译技(jì)术开始(shǐ)在(zài)一些场(chǎng)景中提供便捷的翻译(yì)服务。

    新世纪以(yǐ)来,随着互联网的普及,互(hù)联网公司纷(fēn)纷成立机器翻译研(yán)究组,研(yán)发了基(jī)于互联网(wǎng)大数据(jù)的机器翻译系统,从而使机(jī)器翻译真正走向实用(yòng),市场上开始(shǐ)出现(xiàn)比(bǐ)较(jiào)成(chéng)熟的自动(dòng)翻译(yì)产品(pǐn)。近年来,随着深度学(xué)习的进展(zhǎn),机器翻译技术(shù)得到了进一(yī)步的发展,促进了翻译质量的提升,使得(dé)翻译更加地道、流畅(chàng)。

    机器翻译(yì)的(de)难点在(zài)哪里?

    这里(lǐ),简单介绍一(yī)下机器翻译的难(nán)点。整个机器翻译的过程,可以分为语音识别(bié)转(zhuǎn)换、自然语言分析(xī)、译(yì)文转换和译文生成(chéng)等阶(jiē)段。在(zài)此,以比较典型(xíng)的、基于规则的机器同传翻译为例(参见下图),模块包含了:语(yǔ)音识别(语音转换为(wéi)文本)、自然(rán)语言处(chù)理(语法分析、语义分析)、译文(wén)转(zhuǎn)换(huàn)、译文生成和语音(yīn)生成等模块。其(qí)中(zhōng)的技术(shù)难点主要是:语(yǔ)音识别、自(zì)然语(yǔ)言处理和译文转换等步骤。



    第一个技术难点是语(yǔ)音识别。近二十年来,语音识别技术取得了显著进步,开(kāi)始进入家电、汽车、医疗、家庭服务等各个领域。常(cháng)见的应用系统有(yǒu):

    语音输入系统,相对于键盘输入方法,它更(gèng)符合(hé)人的日常习惯,也(yě)更(gèng)自然、更高(gāo)效;

    语音控制系统,即(jí)用语音来控制设备的(de)运行,相对于手动(dòng)控制来说(shuō)更加快捷(jié)、方便,可以用(yòng)在诸如工业控制(zhì)、语音(yīn)拨号系统、智能家电、声(shēng)控智能玩具(jù)等许多领域;

    智能(néng)对话查询(xún)系统,根据客户的语音进行(háng)操作,为用户提供自然、友好的数据库(kù)检索服务,例如(rú)家庭服务(wù)、旅行社服务系(xì)统、订票系(xì)统、银行服务(wù)等。

    可以(yǐ)说,语音识别技(jì)术与(yǔ)其他自然(rán)语(yǔ)言处理(lǐ)技术相结(jié)合(hé),可以构建出很多复杂(zá)的应用。

    然而,语音识别的主要难点就是对自然语言的识别和理解。首先必须将连续的讲话分(fèn)解为词、音素等单位,其(qí)次要建立一个理解(jiě)语义(yì)的规则(zé)。由(yóu)于语音(yīn)信息量大,语(yǔ)音模式不仅对不同的(de)说话人不同,对(duì)不(bú)同场景的同一说话人也是(shì)有差异的。

    例如,一个人在随意说(shuō)话(huà)和认真(zhēn)说话时的语音特征是不同的。另外(wài),说话者在讲话时,不(bú)同的词可能(néng)听起来是相似的,这也是常(cháng)见现象。单个(gè)字(zì)母或词(cí)、字的语音特性,受(shòu)上下文的影响,以致改变了重(chóng)音、音调、音量和发音速度等。最后,环境(jìng)噪声和干扰对语音识别也(yě)有较大(dà)影响,致使(shǐ)识别率低。

    第二个(gè)技术(shù)难点是语义解析(xī),这是智能化的(de)机器翻译系统的核心部(bù)分。目前,机器翻译系统可划分为(wéi)基(jī)于规则和基(jī)于语料库两大(dà)类。前者(zhě)以词典(diǎn)和语言知识规则库为基础(chǔ);后者由经过划分并具(jù)有标注的语(yǔ)料库(kù)构成(chéng)知识(shí)源,以统计(jì)学(xué)的(de)算法为主。

    机译系统是随着语料库语(yǔ)言(yán)学(xué)的兴起而发展起来的。目(mù)前,世界(jiè)上绝(jué)大多数机译系(xì)统(tǒng)都采用以规则库为基(jī)础的策略,一般(bān)分为语法(fǎ)型、语义型、知识型和智能型。不同类型的机译(yì)系统,由不(bú)同的成分构成。抽象地说,所有机译系统的处(chù)理过(guò)程都包括以下步骤:对源(yuán)语言的分(fèn)析或理解,在语言的语法(fǎ)、语义和(hé)语用等平面进行转换,按目标语(yǔ)言结构规则生(shēng)成目标语言。

    当前,Google 的(de)在线翻译已经为人熟知(zhī),其第(dì)一代的技术即为基于统计的机器翻译(yì)方法,基本原理是通过收集大量(liàng)的(de)双语网页作为(wéi)语(yǔ)料(liào)库,然后由计算机自动选取最为(wéi)常见的词与词的对应关(guān)系,最后给出翻译结果(guǒ)。

    不过,采用(yòng)该技术目前仍无法达到令人满意的效(xiào)果(guǒ),经常闹出各种翻(fān)译笑话。因为,基(jī)于统计的方法,需要(yào)建立大规模的双语语料库,而(ér)翻译(yì)模型、语言模型参数的准确性直接依(yī)赖于语料的规模及质量,翻译质量(liàng)直接取决于模型的质量和语料库的覆盖(gài)面。

    除了上(shàng)述传统的(de)方式,2013年(nián)以来,随着深度学(xué)习的研究取得较大进展,基于(yú)人工神经网络的(de)机器翻译逐渐兴起。就当前而言(yán),广泛应用于机器翻译的是长短(duǎn)时记忆循(xún)环神(shén)经网络。该模(mó)型擅长对自然(rán)语言建模,把任意长度的句子转化为特定维度的(de)浮点数向量,同时“记住”句子中比(bǐ)较重要的单词(cí),让“记忆”保存比(bǐ)较(jiào)长的会(huì)话时间。该模(mó)型较(jiào)好地解决了自然语言句子向量化的难题。

    其技术核心(xīn)是通过(guò)多层神经网络,自(zì)动从语(yǔ)料(liào)库中学(xué)习(xí)知识。一种语言的句子被向量化之(zhī)后,在网络(luò)中层层(céng)传递,经过多层复杂的传导运算,生成(chéng)译文。这种翻译方法最大的(de)优势在于译文流畅,更加符合语法规范。相比(bǐ)之前的翻译技术(shù),质量有较高的(de)提升(shēng)。

    智能同传(chuán)翻译离我们还有多远?

    需要说明的是,很多(duō)人对机器(qì)翻译有误解,认为机器(qì)翻译偏差大。其实,机器翻译(yì)运用语言(yán)学知识,自(zì)动识(shí)别语法(fǎ),模拟语义理解,进行对应翻译,因(yīn)语法、语义、语用的复杂性(xìng),出(chū)现错误是(shì)难免的。就(jiù)已有的成(chéng)果来看,全场景通用(yòng)的机器翻译,其翻(fān)译质量(liàng)离(lí)终极目(mù)标(biāo)仍(réng)相差甚远。

    随着全球化网络时代的到来,语言障(zhàng)碍已(yǐ)经(jīng)成(chéng)为二十一(yī)世(shì)纪社会(huì)发展的重要瓶颈,实现任意(yì)时间、任意地点、任意语言的无(wú)障碍自由沟(gōu)通是(shì)人类追求的一个(gè)梦(mèng)想。这仅是全球化(huà)背景下的一个小缩影。在社会快速发展的进程中,机器翻(fān)译将扮演越来越重要的角色。


    关键词: 人工智能(néng)




    AI人工(gōng)智能(néng)网声明(míng):

    凡(fán)资讯来源注明为其他媒体来源的信(xìn)息,均(jun1)为转载(zǎi)自其(qí)他媒体,并不代表(biǎo)本网(wǎng)站赞同其观点,也(yě)不代表本网(wǎng)站对(duì)其真实性负责(zé)。您(nín)若(ruò)对该文(wén)章内(nèi)容(róng)有任何疑问或(huò)质疑(yí),请立即与网站(www.bz.xinxiang.zz.pingliang.ww38.viennacitytours.com)联系,本(běn)网站将迅速(sù)给(gěi)您回应并做处理(lǐ)。


    联系电话:021-31666777   新(xīn)闻(wén)、技术文章投稿QQ:3267146135   投稿邮箱:syy@gongboshi.com

    精选资讯更(gèng)多

    相关资讯更多

    热(rè)门搜索

    工博士人工智能网(wǎng)
    乐动网页版_乐动(中国)
    扫(sǎo)描二维码关注(zhù)微信
    扫码反馈

    扫一扫,反(fǎn)馈(kuì)当前页面(miàn)

    咨(zī)询反(fǎn)馈
    扫码关注

    微信公众号

    返回(huí)顶部

    乐动网页版_乐动(中国)

    乐动网页版_乐动(中国)