Traduction de BD par IA : Ce n'est pas seulement du texte, c'est de la redessination et de la mise en page par IA
商译AI
Nov 04, 2025

Préface
Aujourd'hui, les bandes dessinées numériques (manga, webtoons, etc.) franchissent les frontières culturelles à une vitesse inédite. Cependant, pour les éditeurs de contenu et les équipes de localisation, la traduction de bandes dessinées reste un véritable « gouffre » d'efficacité. Elle va bien au-delà d'une simple traduction de texte.
Dès l’origine, Shangyi AI(商译 AI) a compris que pour résoudre ce problème de manière effective, il ne suffisait pas de développer un « traducteur » ; il fallait créer un moteur d'automatisation capable de remplacer le « retoucheur » et le « letteur ».
Notre démarche commence par l’analyse des véritables points de friction du secteur.
Défi 1 : un « champ de bataille » fragmenté — les formats de bande dessinée
Tout d’abord, nous ne sommes pas confrontés à une norme unifiée. Les supports de bande dessinée numérique sont extrêmement variés :
- Formats d’archives (CBZ/CBR) : Il s’agit du standard des amateurs. Il s’agit essentiellement d’archives d’images compressées (ZIP/RAR). Notre système doit pouvoir les décompresser et lire la séquence interne de fichiers JPEG/PNG dans le bon ordre.
- Format document (PDF) : C’est le standard pour de nombreuses publications officielles. Le traitement des PDF est plus complexe : ils peuvent contenir des images, des graphiques vectoriels ou du texte embarqué, notre parseur doit donc pouvoir gérer les deux cas.
- Format streaming (Webtoons) : C’est le plus important vecteur de croissance, mais aussi le principal défi. Le webtoon, pensé pour le mobile, consiste en un long flux d’images à défilement vertical. Il n’existe pas de notion de « page » ; la mise en page, les espaces blancs et la coupure des phrases font eux-mêmes partie intégrante du rythme narratif.
Notre pipeline d’IA doit pouvoir ingérer l’ensemble de ces formats et les normaliser en données visuelles et textuelles exploitables.
Défi n°2 : le véritable goulot d’étranglement — 20 % de traduction, 80 % de retouche d’image (« P图 »)
En étudiant les workflows des groupes de scantrad traditionnels ou des équipes professionnelles de localisation, nous avons mis en évidence un constat frappant : la traduction purement textuelle (Translation) ne constitue parfois que 20 % de la charge de travail. Le véritable goulot d’étranglement réside dans deux étapes de création artistique fortement dépendantes du travail manuel :
1. Point de douleur principal : la recomposition graphique (Redrawing)
- Problème : Les onomatopées (SFX, telles que « Boum ! », « Whoosh ») dans les bandes dessinées constituent un élément artistique à part entière ; elles sont profondément intégrées aux arrière-plans, aux tracés des personnages, voire aux effets spéciaux.
- Un véritable enfer manuel : on ne peut pas simplement les “recouvrir”. Le retoucheur (Redrawer) doit ouvrir Photoshop et, à la manière d’un restaurateur d’œuvre, utiliser le tampon de duplication et le pinceau pour recréer manuellement l’arrière-plan masqué. Un SFX complexe couvrant une double page peut exiger plusieurs heures de travail à un artiste chevronné.
2. Travail artistique fastidieux : lettrage (Typesetting)
- Problème : Le japonais ou le coréen sont généralement très concis, mais après traduction en chinois ou en anglais, la longueur du texte augmente considérablement.
- Enfer humain : Le lettreur (typesetter) doit réinsérer manuellement une traduction souvent plus longue dans les bulles de dialogue d’origine, à taille fixe. Cela implique des ajustements répétés de la taille de la police, des sauts de ligne et de l’espacement des caractères, afin d’assurer la lisibilité sans nuire à l’esthétique visuelle. Pour les webtoons, cela inclut aussi la redéfinition du rythme vertical de lecture.
Les outils de traduction automatique classiques sont totalement inopérants dans ce contexte. Les fichiers Word qu’ils génèrent sont pratiquement inutiles pour les graphistes et les lettreurs.
Notre solution : le moteur intégré « Shangyi AI »
La philosophie de conception de Shangyi AI (商译 AI) est la suivante : nous ne livrons pas une traduction, mais un « produit finalisé ».
Pour y parvenir, nous avons développé un moteur intelligent intégrant OCR, génération d’images par IA et restauration de la mise en page :
1. OCR « au niveau du pixel » et analyse de la mise en page
Notre première étape n’est pas la traduction, mais la « déconstruction ».
Notre technologie OCR ne se limite pas à la reconnaissance du texte : elle réalise avant tout une analyse de la mise en page (Layout Analysis). Elle distingue précisément :
- Texte de bulle (Balloon Text) : contenu à l’intérieur des bulles, à traduire et à remplacer.
- Lettrages artistiques/SFX : Superposés à l’image, ils nécessitent un “gommage” et une “reconstruction graphique”.
Parallèlement, il interprète l’ordre de lecture (de droite à gauche pour les mangas, de haut en bas pour les webtoons) et établit un index pour les étapes suivantes.
2. « Gomme intelligente » : Recréation IA et remplissage génératif
Il s'agit de notre technologie centrale. Lorsque l’OCR détecte des SFX et les supprime, le “vide” laissé est immédiatement pris en charge par notre modèle d’inpainting IA.
- Comment cela fonctionne-t-il ? Nous n’utilisons pas un modèle IA standard, mais un modèle dédié entraîné sur un large corpus de bandes dessinées, avec des traits en line art et des trames caractéristiques. L’outil est capable de « comprendre » le style artistique d’une bande dessinée (épaisseur des lignes, tramage des ombres, densité des points) et de compléter de façon générative les arrière-plans et les zones en lisière.
- Résultat : Pour les arrière-plans simples, l’opération est quasi-instantanée. Pour les cas où des lignes complexes obstruent les personnages, le résultat généré permet également de réduire de manière significative le recours à des corrections manuelles. Cela vient répondre directement au principal point de douleur du « redraw ».
3. « Maquettiste intelligent » : technologie de reconstitution de la mise en page
La traduction ne se limite pas à un simple collage du texte. Notre moteur de reconstitution de la mise en page (Document Reconstruction Engine) prend en charge le travail d’« embedding » du texte.
- Comment cela fonctionne-t-il ? Le moteur analyse la police d’origine, la taille des caractères et l’alignement du texte. Après avoir obtenu la traduction (le plus souvent plus longue), il calcule automatiquement la meilleure répartition des lignes et l’ajustement de l’échelle des caractères afin de s’adapter parfaitement à l’espace original du phylactère, tout en préservant une lisibilité optimale.
- Optimisation spécifique pour les webtoons : Pour les bandes dessinées à lecture verticale, notre moteur accorde une attention particulière à la “respiration” du flux vertical, assurant que la segmentation des phrases et les espaces blancs respectent le rythme de lecture sur mobile.
4. « Une traduction dotée d’âme » : sensibilisation au contexte
Ce n’est qu’à la traduction que l’intervention a lieu. Notre module de traduction est intimement lié à l’analyse visuelle décrite ci-dessus. Lors du traitement, il maîtrise les informations suivantes :
- « Ce texte provient d’une bulle d’explosion. »(La traduction doit utiliser un ton plus véhément)
- « Ce texte provient d’une bulle de pensée. »(À traduire sous forme de monologue intérieur)
- « L’ensemble des textes de ce personnage. »(Veiller à la cohérence du ton du personnage)
Conclusion
La mission de « Traduction Commerciale IA » est de tirer parti de l’IA pour faire passer la localisation de bandes dessinées d’un « atelier artisanal » à un « processus industriel automatisé » hautement efficace. Nous sommes pleinement conscients que l’IA ne saurait remplacer à 100 % l’appréciation artistique humaine, mais notre objectif est de libérer créateurs et traducteurs de 80 % des tâches répétitives et mécaniques afin qu’ils puissent se concentrer sur les 20 % les plus essentiels : la créativité et la transcréation culturelle.
Nous ne traitons pas uniquement des enjeux de traduction, mais plus généralement des problématiques de productivité artistique.