开启左侧

行业技术 | DeepSeek等大模型实战测评:专业译员如何用AI提升翻译质量与效率?

[复制链接]
华夏翻译协会翻译效劳委员会建立于2002年11月,是华夏翻译协会的第九个分收机构,也是华夏译协唯一一个由翻译效劳企业构成的委员会。为退一步促截至业交换,拉截至业下品质开展,委员会晤背会员单元普遍征散翻译效劳企业办理经营中的胜利经历战有用作法,并分离译天下仄台拉出“译践”栏目,按期公布语言效劳止业最好实践案例,供止业表里人士参照交换。

原文为“译践”第22期,北京悦我疑息手艺无限公司以DeepSeek等年夜模子为例,会商野生智能帮助翻译情势中呈现的一点儿成就及处置计划。

野生智能正在进步翻译品质战服从、低落翻译本钱、拓展翻译效劳范畴圆里已经具备没有错的表示。国产年夜模子如DeepSeek果下功用、下性价比等劣势同军崛起。别的,针对于翻译的年夜模子如阿里Marco、有讲子曰2.0也正在不竭出现。翻译止业在主动使用野生智能相干手艺。但是正在具体翻译实践中,出格是正在庞大翻译名目中,使用野生智能仍然存留一点儿成就,所得到的成果并已到达预期。所有止业中产物战效劳品质皆相当主要,翻译止业亦是云云。专科翻译范围中,舌人可使用野生智能颠末多种伎俩去进步翻译服从战品质。但是终极的译文品质仍然需要野生干预去包管。原文对于使用野生智能帮助翻译的伎俩截至论述,归纳此中碰见的成就,并会商处置计划。

今朝,翻译止业流行接纳的翻译过程情势是:机械预翻译+译后编纂+野生品质掌握。翻译过程根本连结译前、译中战译后三个阶段。翻译实践中,野生智能的罕见使用包罗前期的术语抽与、译文预翻译、译文修饰等。野生智能狂言语模子的特性对于使用成果会发生很年夜作用,比方,参数数目、高低文窗心、温度、提醒词汇(Prompt)等。下文将分离年夜模子的特性,对于年夜模子正在翻译名目差别阶段的使用办法给以论述,共时也对于存留的成就战处置计划截至会商。

(图源:望觉华夏)


术语抽与

庞大翻译名目中,术语分歧不竭是权衡译文品质的主要按照,术语办理应然也是名目办理的主要部门。正在名目施行过程当中,可颠末多界说术语、严峻审校术语、使用术语考证模块等把控术语的精确性战分歧性。现在,年夜模子可正在前期术语准备圆里阐扬主要感化,可快速提炼术语、完毕术语预翻译、对于术语截至词汇频阐发,年夜年夜进步了术语办理的服从。如下部门论述怎样使用年夜模子截至术语提炼。

原文以年夜模子DeepSeek为例截至示范。因为该模子为启源模子,其他人工智能效劳供给机构也布置了“谦血”DeepSeek模子,比方腾讯元宝、baidu搜刮等。因而思考到速率因素,也可采用非DeepSeek民间布置的模子。

操纵步调:

1. 采用适宜的模子

原文彩用腾讯元宝。模子挑选了“DeepSeek”,情势挑选了“深度思考(R1)”战“联网搜刮”。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w2.jpg

2. 劣化提醒词汇

提醒词汇需求按照文原范例战特性截至劣化,可正在术语抽与的过程当中不竭劣化,曲至到达预期的结果。提醒词汇的编辑没有是一蹴而就的事情,需要不竭测验考试劣化,不竭增加新请求。比方,作家正在翻译《QCT 826-2019 桥梁检测车》过程当中,截至了屡次劣化。

提醒词汇1:

动作翻译名目术语大师,请从给定的文原中提炼统统华文专科术语,给出英文译文,并统计正在文献中的词汇频。输出格局:请按三列输出文献。

输出成果:

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w3.jpg

一同抽掏出27条术语,因为提醒词汇的成就,并无给出输出文原的跟尾。因而需要持续劣化提醒词汇,或者截至多轮提问。

提醒词汇2:

动作翻译名目术语大师,请从给定的文原中提炼统统华文专科术语,给出英文译文,并统计正在文献中的词汇频。关于已经给出英文译文的术语,间接接纳英文译文。术语范畴包罗装备称呼、零件、组件、尝试名目、参数称呼、各章节题目(没有包罗编号)等。输出格局:请按三列输出文献,输出文献为电子表格格局。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w4.jpg

输出成果:

终极输出65条术语,但是仍然不间接给出电子表格文献供下载,能够间接复造到电子表格中。

固然颠末AI对于话截至术语抽与已经得到必然的结果,但是理论上正在翻译实践过程当中借不克不及到达十分趁心的结果。便树模文原来道,需要分歧的术语不但仅那提炼进去的60多条,手艺类文原要严峻包管术语分歧。那仍然需要野生共同术语提炼。

具体步伐是野生正在本文中标注术语,好比颠末下明显现或者减细去标注,如许术语正在本文中便具备了特性,而后使用颠末邪则选中术语,粘揭到电子表格中,排序并来沉,使用机械翻译截至预翻译。如许干的事情质确实很年夜,却极年夜提拔了术语分歧结果,特别是正在多少万字以至更年夜范围的翻译名目中。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w5.jpg

笔者尝正在对于文献中的术语截至标注后,而后使用AI对于话抽与术语。

提醒词汇:

动作翻译名目术语大师,请从给定的文原中提炼统统华文专科术语,特别留神将下明显现的词汇语提炼为术语,而后给出英文译文。关于已经给出英文译文的术语,间接接纳英文译文。输出格局:请按二列输出文献,输出文献为电子表格格局。

输出成果:

年夜模子确实输出了提炼的术语,但是年夜模子其实不能识别文原的格局,好比下明显现或者减细,下明显现的术语并无完整提炼进去,因而年夜模子没有是全能的。大概目前年夜模子会识别文原格局。

3. 术语表的变换

输出的术语需要截至审校战确认,而后颠末变换导进到正在线或者当地术语库中,供翻译名目使用。

正在Trados+GroupShare翻译办理体系下,电子表格格局的术语表需求先变换成.mtf格局,变换硬件可用Glossary Converter或者SDL MultiTerm Convert,而后颠末SDL MultiTerm导进正在线或者当地术语库。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w6.jpg

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w7.jpg

使用年夜模子可便利术语抽与,但是正在终极的术语分歧掌握中,年夜模子的可费用没有下。CAT硬件自戴的术语QA模块或者Xbench东西仍然是最可靠的术语掌握东西。


使用年夜模子截至翻译战修饰

笔者正在翻译实践中使用Trados+GroupShare仄台,此中Trados 2024已经撑持AI Assistant插件,该插件已经撑持预翻译战滋润,共时借能够自界说Prompt去调解翻译气势派头。今朝撑持的年夜模子包罗OpenAI战微硬Azure模子。使用OpenAI模子可借帮直达代办署理。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w8.jpg

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w9.jpg


    插件启用


面打“望图”,找到“AI Assistant”,插件窗心会显现正在窗心底部。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w10.jpg


    插件设置


面打下图所示“齿轮”(树立)。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w11.jpg

设置的参数以下:

模子跟尾称呼(Name):按照模子去自界说。

效劳供给商(Provider):可挑选OpenAI或者Azure OpenAI。

交进面地点(Endpoint):OpenAI的默认地点是https://api.openai.com/v1/chat/completions,假设使用API代办署理则交流为代办署理商给出的地点,比方https://api.openai-hk.com/v1/chat/completions。

模子(Model):可挑选gpt-3.5-turbo,该模子统筹功用、本钱战速率劣势。

模子范例(Model Type):默认便可。

温度(Temperature):初度使用挑选默认便可。调解温度参数时,狂言语模子的输出气势派头会发作清楚变革。高温设定(靠近0),输出越发肯定,险些屡屡天生的实质皆差异。低温设定(靠近1),输出越发随机,天生成果可以会有很年夜差别,以至呈现“收集”或者“治码”的情况。正在翻译实践中,挑选如何的温度,与决于翻译文原的范例。假设原文范例为文教类,那末温度可过分调下,模子可以会输出极具本性化战缔造性的实质。但是思考到忠厚本文,可将温度设定到“8.0”;但是假设文原范例为手艺类,可过分调高温度,但是不克不及过于高。温渡过高会构成语言通畅性低落的成就。

设置佳插件后,面打“Test Connection”截至跟尾尝试。如显现“Connection successful”分析可连通,而后便可使用插件。

插件具备多项功用,可按照情况挑选。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w12.jpg


    翻译树模


面打句段,挑选“Formal translation”,而后面打千里镜图标,可瞅到译文。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w13.jpg


    修饰树模


面打句段,挑选“Refine translation”,而后面打千里镜图标,可瞅到戴有审校标识表记标帜的译文。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w14.jpg

假设成果怨恨脚,从头面打“千里镜”图标,沉更生成译文。

假设趁心,则面打译文右边的以下图标,译文便可加入的译文编纂止中。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w15.jpg


    自界说Prompt


按照具体需要,编辑Prompt实质,而后正在译文中使用。

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w16.jpg

那里,笔者给出多少个提醒词汇编辑规范。那些提醒词汇合用于Trados中的AI Assistant,其余使用中可参考使用。可界说多条提醒词汇,每一条提醒词汇只管繁复,那取Chat情势下的提醒词汇编辑差别。

改进译文逻辑战毗连性:Update the translation with better logic and coherence。

查抄译文语法战拼写:Check the gra妹妹ar and spelling of the translation, and update it with correct gra妹妹ar and spelling。

规定语言气势派头:Translate this source in a scientific tone。Update this translation in a scientific tone。

AI Assistant插件只可截至单句翻译战修饰。因而,该插件的开辟战革新需要更切近用户需要,比方正在截至预翻译时可完毕批质处置,兼容更多模子以至撑持当地模子,撑持华夏的年夜模子。


思考战归纳

使用AI年夜模子确实对于翻译的品质战服从有很年夜提拔,但是今朝正在翻译范围,AI年夜模子的使用仍然存留一点儿限定战成就。

起首,许多机械翻译效劳战钻研机构在主动将年夜模子引进机械翻译,翻译专用年夜模子的贸易化水平没有下。

第两,年夜模子的当地布置需要必然的根底装备撑持战手艺撑持,包罗效劳器设置、收集设置、手艺职员设置等。较下的装备战人力本钱使一点儿翻译机构没法负担如许的加入。

第三,年夜模子固有的特征,比方随机性战“幻觉”,仍然是很易抑制的成就。颠末一点儿伎俩可抑制必然的“幻觉”,比方劣化提醒词汇、低落温度、使用RAG战内部常识库等。正在理论使用中,仍然要留神“幻觉成就”。Hallucination Leaderboard

(网址:https://github.com/vectara/hallucination-leaderboard)给出了支流年夜模子的“幻觉率”供参照。

第四,翻译年夜模子取翻译办理体系的散成借存留隔膜。需要研收回二者之间的交心,让数据正在二者之间顺遂交流。咱们一般偏向于使用年夜模子批质翻译原文,启事正在于咱们之止截至了术语抽与,批质翻译更易保证术语分歧,更易完毕气势派头分歧。以Trados的AI Assistant插件为例,预翻译仍然不过按单句截至,那末高低文的逻辑毗连将被分裂。最幻想的情况是,既能完毕批质预翻译,又能正在翻译体系按句对于显现,便利目前编纂战量控。按照翻译经历,年夜范围文原的术语分歧掌握必需正在单语前提下截至,一朝天生单语一稿,再截至术语分歧掌握将艰难沉沉。

第五,年夜大都情况下,关于年夜模子的很多参数,用户没法按照具体需要截至改正战调解。那些参数只需正在当地布置截至锻炼战微调时才气截至界说战调解。上文中论述了怎样树立模子温度,但是关于模子的其余参数却不说起。启事正在于咱们使用API跟尾正在线年夜模子时,可调解的参数很少。

所有新手艺的呈现城市戴去机缘战挑战。野生智能的鼓起可以会对于许多止业构成推翻性作用。翻译止业中,低级、高易度的文原已经可由机械翻译某人工智能所翻译完毕。翻译机构的营业更集合于下易度文原翻译。但是不管野生智能到达何种水平,人的因素仍然起主宰感化。

翻译实践中,野生干预的代价正在于公道的语言气势派头判定、可靠的品质掌握、其实的可逃责性等。咱们该当主动接纳新手艺,充实观点手艺的现有范围性,不竭提出新的请求增进手艺完美,共时存眷人的因素,拥抱新变革,适应新变革。

申明:原公家号转载此文章是出于传布止业资讯、洞睹之目标,若有进犯到您的正当权力,请致疑:532541801@qq.com,咱们将实时调解处置。感谢撑持!
止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w17.jpg

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w18.jpg

止业手艺 | DeepSeek等年夜模子真战测评:专科舌人怎样用AI提拔翻译品质取服从?w19.jpg

【语言效劳止业】分享群
群内乱会按期拉收语言效劳止业最新静态、举动预报、比赛报告📝等外容~

欢送您的参加🥰!

-END-
原文转载自:译·天下转载编纂:蒋凯裕

存眷咱们,获得更多资讯!

朝期回忆
止业静态1. 严峻变动!2025年度CATTI1-3级测验移至上半年
2.止业静态 | 2024年语言效劳40人服装论坛t.vhao.net正在京浩荡举办
3. 止业静态 | 习远仄签订主席令!钻研死,迎年夜变化!4. 止业静态 | 2024年海内翻译止业十年夜往事5. 止业静态 | 2024年环球翻译止业十年夜往事
年夜咖博栏
    王华树传授博栏
    崔开明传授博栏
    曹达钦副传授博栏
    墨华西席博栏刘天下专士博栏

止业手艺
    手艺使用 | 盘点2024年最好狂言语模子
    手艺使用|用AI教英语赢麻了,语言AI东西年夜汇总
    手艺使用 | 那篇文章“很大要率”没有是GPT写的!
    手艺使用 |【Zotero 文件引用】处置中英文文件混排懊恼!
    手艺使用 |使用 Python截至数据阐发的入门者该当把握哪些根本常识?

佳构课程1. “手艺取您”根究营,让您的暑假更故意义
2. 古早停止 | 单11博场,翻译手艺课程、AI电力收不断
3. 经心出品 | 翻译智能体设想实践取实践
4. 新课预卖 | 鉴于Python的语言数据钻研:从数据处置到统计阐发

资本搞货
    手艺科普 | 掀启脚写文原识别“开始退”的秘密
    资本搞货 | 英语中刊获得路子、网站举荐
    ChatGPT | AI中语写做帮忙,帮力下效写做
    单语搞货 | 开锋年夜使背中好媒介揭晓发言
    资本宝库|译者用“典”,多多益擅——粗选31款正在线辞书

雇用赋闲
1. 北京/西安 | 专硕星睿贩卖岗亭,没有限经历,等您去投!【可线上】
2. 线上练习兼任 | 云译·专硕星睿招募产物体会星拉民啦
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )