如何评价最近爆火的ChatGPT,在翻译领域表现如何?

ChatGPT教育2年前 (2023)发布 一起用AI
547 0 0

谢邀!最近在做新的GPT模型,正好回答一下目前翻译领域的应用。

什么是ChatGPT?

推出上线仅5天,注册用户数超100万,上线两个月后,用户数破亿。瑞银集团报告指出,ChatGPT是史上用户增长速度最快的消费级应用程序,它像一颗“核弹”引爆人工智能圈以至整个科技界。ChatGPT是由美国人工智能实验室OpenAI开发的一个对话AI模型,于2022年11月正式推出,因其出色的文本生成和对话交互能力在世界范围内迅速走红,迅速蔓延到其他领域。ChatGPT可谓一日看尽长安花。 ChatGPT的爆火出圈,引发资本市场的强烈关注,在热门题材股关注度从不掉队的A股市场及时抓住热点。爆火的ChatGPT使得与其有相关度的科技公司股价坐上火箭,一大波概念股顺势起飞,连续多日霸占涨幅榜前列。

近5亿条回答,实时积累海量用户点赞互动投票数据,在问答赛道长期占据不可替代地位…凭借AIGC大模型开发的天然优势,以知乎为代表的内容价值型社区近乎直面ChatGPT发展的赛道。2月8日,知乎美股与港股股价一同迎来暴涨,涨幅均超30%,盘中一度扩大至50%。

与ChatGPT直接关联的人工智能领域亦然。2月初,AIGC概念股开盘走强,多年坚实技术积累、核心技术位居世界前沿。作为A股市场人工智能的龙头企业,2023年以来科大讯飞的股票涨幅已经超50%,今天市值已超千亿,在一大群前仆后继的中国AI公司中稳居前列。

为什么最近ChatGPT火了?

会聊天的机器人有什么值得这么出圈的地方?ChatGPT不是第一个,也不会是最后一个。 别说其他前沿AI,siri都行,为什么爆火的,偏偏是ChatGPT? 值得关注的是,ChatGPT的惊艳之处在于不局限于聊天功能,而是迭代变成了一个具备一定创造力的生产力工具:通过大量语料内容训练,在对搜集素材进行消化、整理后,它可以处理非常复杂的语言工作,并进行尽可能符合人类心理预期的输出。写论文、诗歌、简历、视频脚本甚至写程序都没有问题。

ChatGPT非常简单,使用者只需提问即可,只要拥有注册账号,谁都可以先玩一玩,几乎没有使用门槛。 说白了,传统的大模型都只是企业的专属工具,只为能赚钱的业务提供价值,开放给用户的能力、接口和产品体验远远不如chatGPT。并且chatGPT更加接地气,让每个人都可以用得上,不同场景下的泛化能力更强。所以我更愿意把它叫观念革命,而不是技术革命。

ChatGPT主要核心技术+历代模型

ChatGPT的重大革新在于它的训练方法,使用的是transformer模型,并通过预训练在大规模语料库上,再通过人类反馈学习和微调实现专门任务,这是一种新的训练方法。因此,ChatGPT可能启发或颠覆一些传统思路。

·核心技术1:Transformer

ChatGPT使用的核心技术之一是Transformer,这其实从其全称上也能看得出来,Chat Generative Pre-trained Transformer。Transformer是Google于2017年提出的一种采用注意力机制的深度学习模型,是近几年人工智能技术亮点之一,可以按输入数据各部分重要性的不同,而分配不同的权重。 Transformer作为近几年最为常用的神经网络模型,精度和性能上都要优于之前流行的CNN(卷积神经网络)、RNN(循环神经网络)等模型。

这大幅提升了模型训练的效果,让人工智能得以在更大模型、更多数据、更强算力的基础上进一步增强能力。此外,Transformer还具有很强的跨模态能力,不仅在NLP(自然语言理解)领域表现优异,在语音、图像方面也显示出了优异的性能。

·核心技术2:RLHF

此外,OpenAI使用 RLHF(Reinforcement Learning from Human Feedbac,人类反馈强化学习) 技术对 ChatGPT 进行了训练,且加入了更多人工监督进行「微调」(fine tuning)。ChatGPT可以主动承认自身错误并道歉, 会质疑不正确的问题,会承认自身的无知和对专业技术的不了解。

如何评价最近爆火的ChatGPT,在翻译领域表现如何?

GPT历代模型示意图

国内外人工智能领域的研究,一直努力不断探索新的技术路线,大模型是目前重点研究投入的方向。Open AI、谷歌、微软, 国内的百度、阿里、腾讯、华为等也纷纷推出大模型。其中,特别是今天OpenAI 的GPT-3.5架构的ChatGPT,就是典型的AIGC大模型。一经推出反响剧烈,具有了更高的语言理解能力和更广泛的知识领域,ChatGPT有望为AIGC打开一个新的大体量的市场规模,也让人更加期待GPT-4的到来。

ChatGPT在翻译领域表现如何?

最近在做大型预训练语言模型和垂直领域精调模型的对比研究,ChatGPT是典型的大型预训练语言模型,属于什么领域都能说上几句的百晓生,既然题主提到翻译领域,我们可以进行类似的对比研究,正好我手里有台之前在国外时交流一直使用的科大讯飞翻译机

如果说ChatGPT 是典型的大型预训练语言模型,那像科大讯飞双屏翻译机这样的翻译机,就是典型的翻译领域的垂直领域精调模型。与同期AI设备相比,ChatGPT作为最前沿的大型预训练语言模型,翻译效果和速度会更加突出。但若要与垂直领域的专业翻译设备比较,缺陷可能还是比较明显,接下来就将这两个详细进行一个对比。

首先是IP问题,众所周知ChatGPT并未对全球所有国家开放,由于有些国家对于人工智能技术的使用有限制,或由于在这些国家法律规定下OpenAI不能合法提供服务,因此目前ChatGPT无法在这些国家/地区提供登陆服务,比如在我国国内就不能使用,还有泰国,这应该是我们国家的人旅行比较喜欢的国家了,也不在开放使用之列。如果该地区被限制使用,那ChatGPT的翻译效果直接是0,这时候直接选用翻译机才是明智之举。

其次是应用场景,目前ChatGPT只支持打字对话获取翻译效果,这对下沉群体是一个比较大的bug,而像我在国外用的这款科大讯飞双屏翻译机,使用场景会更广泛,语音翻译、拍照翻译、录音翻译、同声字幕、演讲翻译等等都可以用,更细化的功能可以覆盖更广泛的使用场景。讯飞这款翻译机的主客双屏设计也是我比较欣赏的点,视听同步让信息的传递更直观,直接提高了和外国朋友的沟通效率。

在翻译的专业度方面,科大讯飞的翻译机显然会比ChatGPT的翻译更专业,我同时用两款程序跑出了一些例句,ChatGPT的翻译图和两个翻译结果的对比截图都在下面,大家可以看看。

例1例2

​从图上可以看出,就专业性而言,ChatGPT更加口语化,而科大讯飞的翻译效果可以媲美专八、专业领域的行业翻译,主打的同传级翻译应用在演讲翻译、同声字幕、录音翻译这三个功能中,以及其他诸如会话翻译等功能。

​为了测试讯飞的专业性,我拿它进行了六级翻译选段测试。

如何评价最近爆火的ChatGPT,在翻译领域表现如何?

​会话翻译方面我也做了一个小测试,将翻译机和电脑都接入同一个网络,电脑开始播放英文电影,然后点击翻译机的“会话翻译”功能,再看看讯飞和中文字幕的区别,对比下来讯飞的翻译效果更专业,除了略有延迟外,整体翻译结果的表述方式也更符合人物当下的语境。

另外的语种方面,科大讯飞支持83种语言在线翻译、16种语言离线翻译、32种语言拍照翻译,具体语言的选择,大家使用时自己手动调节即可。其中支持离线翻译使用这个优点,真的对只能联网工作的ChatGPT做到了吊打。 ChatGPT的「频繁宕机」,也是劝退很多人的一个缺点,火爆的ChatGPT多次因为访问量激增而宕机,国外用户经常收到“当前需求异常高,我们正调节系统,请稍等”的提示。

大家可能比较会关心ChatGPT的收费方面。2月2日,OpenAI公司宣布ChatGPT的免费访问权限虽然仍将存在,但会推出付费试点订阅计划ChatGPT Plus,定价每月20美元。

付费版功能包括高峰时段免排队、快速响应以及优先获得新功能和改进等。资本投入训练的终极是利用人工智能变现,ChatGPT研发斥资巨大,后期商业化是必然的。如果只是为了更高效便捷的翻译,个人观点,与其阶段性付费给到平台,不如直接get最前沿技术的翻译机一劳永逸。

最后,我想用较宏观的概念解释我们比照得出的结论。如果说ChatGPT 是大型预训练语言模型(以下简称大模型),那么像科大讯飞双屏翻译机这样的翻译机就是垂直领域的精调模型。 从ChatGPT的发布效果来看,大模型训练的AI表现出了不错的效果,但是,垂直领域可能仍然需要精调模型,因为特定领域的数据和任务往往需要专门的模型。大模型通过预先在大量数据上进行训练,具有高效的语言理解能力和广泛的知识领域。

适用于快速生成文本、回答问题等任务,也可以作为其他模型的预训练部分。而精调模型仍然具有其重要作用。它们通过在专业领域的少量数据上进行训练,可以更准确地捕捉特定领域的语言特征。精调模型更适用于应用于特定领域的任务,如语音识别、机器翻译等。 评价人工智能的表现,需要看在具体任务上的完成效果如何,两者可能在未来都有各自的优势和适用场景。

ChatGPT,它更多是在大部分通用场景有了乍一眼很惊艳的表现,尤其是自然语言理解、信息抽取和生成方面,但在精准翻译这种相对专业的垂直领域,使用像科大讯飞翻译机这样的精调模型,用户体验效果会更好,并且后期增量训练也更方便和有效。

© 版权声明

相关文章