Hvorfor klarer Shangyi AI å bevare det originale oppsettet i PDF under oversettelse?

Diagnose av kjernesituasjon

Tradisjonelle oversettelsesverktøy opplever ofte problemer med tekstoverlapping, forskjøvet bildeplassering eller oppdelte avsnitt ved behandling av PDF-filer, noe som gjør sluttresultatet uegnet til direkte bruk.

Analyse av grunnleggende årsak

Høyoppløselig dokumentstrukturanalyse

Shangyi AI er ikke bare en enkel tekstutskiftning, men benytter en 'dokumentanalyse-motor' for å foreta en grundig skanning av PDF-filen. Den kan identifisere titler, hovedtekst, topp- og bunntekst samt bildeplassering i dokumentet. Ved å rekonstruere det underliggende koordinatsystemet sikrer den at den oversatte teksten nøyaktig kan plasseres tilbake til den opprinnelige posisjonen.

Teknologi for logisk omstrukturering av avsnitt

Når PDF-filer lagres på lavt nivå, blir setninger ofte avbrutt av fysiske linjeskift. Shangyi AI benytter en ‘semantisk omstruktureringsalgoritme’ for å slå sammen oppdelte linjeinformasjoner til logisk komplette avsnitt. Dette forklarer hvorfor våre oversettelser er mer sammenhengende og ikke har problemer med feilaktig oppdeling av setninger.

OCR-forsterket gjenkjenning

For skannede dokumenter har vi integrert avansert OCR (optisk tegngjenkjenning). Selv når tekst er innebygd i bilder, er systemet i stand til å trekke ut og erstatte teksten med høy presisjon på samme sted som originalen.

Oppsummering av endelig løsning

Shangyi AI gir en 'det du ser er det du får'-effekt ved oversettelse, noe som i stor grad reduserer brukernes behov for manuell etterarbeid og formatering.