Jupyter Notebook(.ipynb)翻译:代码可运行,Markdown 本地化准确?
核心现状诊断
“数据分析报告通常混合了可执行代码、执行结果和 Markdown 说明文本,全面翻译容易导致代码失效或输出结果被篡改。”
根本原因剖析
单元格类型智能分流
商译 AI 根据 JSON 结构中的 `cell_type` 字段进行分流:`markdown` 单元格进入翻译引擎,而 `code` 单元格则被严格锁定。对于 `raw` 单元格,用户可根据需要选择是否翻译。
Markdown 内嵌公式保护
在 Markdown 单元格中,经常包含 LaTeX 格式的数学公式(如 `$E=mc^2$`)。AI 引擎会识别 `$` 定界符,将其内容视为“不可变令牌”,仅翻译公式周围的解释性文字。
输出(Output)数据清洗
默认情况下,建议用户在上传前清除 Output,但如包含文本型输出(如错误日志或打印结果),AI 也可根据配置,仅翻译其中的自然语言部分,保留 Traceback 的结构。
最终解决方案总结
完美适配 Kaggle 竞赛分享或教学课件的本地化需求,确保代码逻辑与说明文档同步。