Hvorfor klarer Shangyi AI å bevare det originale oppsettet i PDF under oversettelse?
“Tradisjonelle oversettelsesverktøy opplever ofte problemer med tekstoverlapping, forskjøvet bildeplassering eller oppdelte avsnitt ved behandling av PDF-filer, noe som gjør sluttresultatet uegnet til direkte bruk.”
Analyse av grunnleggende årsak
Høyoppløselig dokumentstrukturanalyse
Shangyi AI er ikke bare en enkel tekstutskiftning, men benytter en 'dokumentanalyse-motor' for å foreta en grundig skanning av PDF-filen. Den kan identifisere titler, hovedtekst, topp- og bunntekst samt bildeplassering i dokumentet. Ved å rekonstruere det underliggende koordinatsystemet sikrer den at den oversatte teksten nøyaktig kan plasseres tilbake til den opprinnelige posisjonen.
Teknologi for logisk omstrukturering av avsnitt
Når PDF-filer lagres på lavt nivå, blir setninger ofte avbrutt av fysiske linjeskift. Shangyi AI benytter en ‘semantisk omstruktureringsalgoritme’ for å slå sammen oppdelte linjeinformasjoner til logisk komplette avsnitt. Dette forklarer hvorfor våre oversettelser er mer sammenhengende og ikke har problemer med feilaktig oppdeling av setninger.
OCR-forsterket gjenkjenning
For skannede dokumenter har vi integrert avansert OCR (optisk tegngjenkjenning). Selv når tekst er innebygd i bilder, er systemet i stand til å trekke ut og erstatte teksten med høy presisjon på samme sted som originalen.
Oppsummering av endelig løsning
Shangyi AI gir en 'det du ser er det du får'-effekt ved oversettelse, noe som i stor grad reduserer brukernes behov for manuell etterarbeid og formatering.