AI 实时翻译技术:打破语言障碍,实现流畅沟通
AI 实时翻译技术:打破语言障碍,实现流畅沟通
2024年12月9日修改
在当今全球化的时代,语言障碍一直是人们在国际交流中面临的一个重要问题。然而,随着人工智能技术的不断发展,这一问题正在逐渐得到解决。近日,全球知名的 AI 翻译企业 DeepL 在首尔格兰德凯悦酒店举行了记者见面会,推出了其首款语音翻译解决方案“DeepL Voice”,为人们带来了新的希望。
据 DeepL 创始人兼首席执行官雅雷克·库蒂洛维斯基(Yarek Kutylowski)介绍,他们针对韩国职场人士进行的一项调查显示,每 10 名学习英语的韩国职场人中,有 8 人认为与母语为英语的人交流不方便,并且因为发音问题而缺乏自信。而 AI 技术的应用可以有效地缓解这些不便。
DeepL Voice 分为“Voice for Meeting”(会议语音)和“Voice for Conversation”(对话语音)两种模式。这两种模式分别针对非面对面对话和面对面对话,提供多语言实时翻译服务。它支持包括韩语、英语、德语、日语、法语等在内的 13 种语言的语音翻译,并且实时字幕翻译则适用于 DeepL 翻译器所支持的 33 种语言。
“Voice for Meeting”是一项让参会者可以用各自喜欢的语言发言,而其他参会者可以通过实时翻译字幕来确认发言内容的服务。例如,当使用英语的 A、德语的 B、日语的 C 和韩语的 D 四名参与者进行会议时,A 用英语发言,其余参与者的屏幕上会分别显示出德语字幕(B)、日语字幕(C)和韩语字幕(D)。这样,即使参与者使用不同的语言,发言也能实时翻译成文字,实现无障碍的沟通。
“Voice for Conversation”则是一款用于一对一面对面对话的移动解决方案。移动设备的屏幕会被分为两半,参与对话的两人可以分别看到和听到对方语言翻译成自己语言的内容。虽然在当天的演示视频中,语音听起来有些接近机械音,可能会略显生硬,但理解对方的发言内容是没有问题的。
面对市场上存在众多提供类似翻译服务的竞争对手的情况,库蒂洛维斯基强调:“迄今为止推出的任何产品都没有像 DeepL 那样深入地研究语言。DeepL 的优势在于能够捕捉到细微的语义差别并进行准确翻译。”在随后的问答环节中,库蒂洛维斯基亲自使用“Voice for Conversation”功能,无需通过口译,直接回答了记者们的问题。即使是一些较为专业和冗长的问题,他也能够准确理解并给出回答。
在谈到开发韩语版本时所遇到的困难时,库蒂洛维斯基表示:“尽管韩语的句子结构较为复杂,但与我的母语德语并没有太大的区别。我们在(AI 进行翻译时)采取了分步骤的方法。AI 会先听取句子,确定大致的翻译方向并给出结果,如果预测错误,会重新进行翻译以提供更好的答案。”
此外,DeepL 还宣布将在其今年 7 月推出的下一代大规模语言模型(LLM)中增加韩语服务。该模型是专门为翻译而设计的 LLM,将提供给 DeepL 的专业用户使用。
库蒂洛维斯基还提到,他正在密切关注全球范围内关于 AI 监管的讨论。他认为:“目前全球正在审查或制定的 AI 相关法律法规存在很多模糊之处,因此最终对法律的准确解释将成为企业的责任。我认为类似的情况也会在韩国发生。”
总的来说,DeepL 的语音翻译解决方案为人们提供了一种更加便捷、高效的语言交流方式,有望在全球范围内推动跨语言交流的发展,促进各国之间的合作与交流。随着技术的不断进步,我们有理由相信,语言障碍将不再是人们沟通的阻碍,一个更加紧密相连的世界正在逐渐形成。