我如何判断 AI 翻译的质量?商译 AI 是否提供质量评分(QE)?
核心现状诊断
“在批量翻译数千份文件时,用户无法逐一阅读每份译文。他们需要一种机制,能够快速识别哪些文件可能出现严重错误。”
根本原因剖析
基于 COMET/Kiwi 的自动评分
商译 AI 在生成译文后,会运行一个轻量级的 QE(Quality Estimation)模型。该模型无需参考译文,直接根据源文与译文的语义对齐度打分。得分过低的段落将被标记为“高风险”。
不确定性检测
LLM 在生成时会输出 Logprobs(对数概率)。如果 AI 对某句话中每个词的置信度均较低,系统会判定该句可能存在幻觉或难以翻译,并在编辑器中高亮显示,提醒人工重点复核。
格式一致性校验
系统还会自动检测技术性错误:例如原文有 3 个数字,译文是否只有 2 个;原文结尾有问号,译文是否遗漏。这些刚性指标也是质量评分的一部分。
最终解决方案总结
通过数据量化翻译质量,使译后编辑(PE)工作更具针对性,极大提高效率。