เหตุใด ShangYi AI จึงสามารถคงรูปแบบที่แท้จริงของ PDF ระหว่างการแปลได้?
“เครื่องมือแปลภาษาแบบดั้งเดิมมักเกิดปัญหาข้อความซ้อนทับ ตำแหน่งรูปภาพคลาดเคลื่อน หรือย่อหน้าขาดตอนระหว่างการประมวลผล PDF ส่งผลให้ไม่สามารถนำผลลัพธ์ไปใช้งานได้โดยตรง”
การวิเคราะห์สาเหตุที่แท้จริง
การวิเคราะห์โครงสร้างเอกสารความแม่นยำสูง
ShangYi AI ไม่ได้เป็นเพียงการแทนที่ข้อความอย่างง่าย แต่ใช้ ‘เอนจินการวิเคราะห์เอกสาร’ ในการสแกน PDF เชิงลึกระบบสามารถตรวจจับหัวข้อ เนื้อหา ข้อความหัวกระดาษและท้ายกระดาษ รวมถึงตำแหน่งของภาพในเอกสารได้อย่างแม่นยำ โดยอาศัยการสร้างระบบพิกัดฐานใหม่ เพื่อให้ข้อความที่แปลสามารถนำกลับไปวางในตำแหน่งเดิมได้อย่างถูกต้อง
เทคโนโลยีการจัดเรียงย่อหน้าเชิงตรรกะ
ไฟล์ PDF เมื่อต้องจัดเก็บในระดับโครงสร้างมักจะมีการตัดประโยคให้อยู่ในรูปแบบของบรรทัดทางกายภาพShangYi AI ใช้อัลกอริทึม『การจัดโครงสร้างความหมายใหม่』เพื่อรวมข้อมูลบรรทัดที่แตกออกกลับมาเป็นย่อหน้าที่สมบูรณ์ในเชิงตรรกะจึงอธิบายได้ว่างานแปลของเราจึงมีความต่อเนื่อง ไม่เกิดปัญหาการแบ่งประโยคหรือการเรียงลำดับที่ผิดเพี้ยน
OCR การจดจำอักขระที่ได้รับการปรับปรุงประสิทธิภาพ
สำหรับเอกสารสแกน เราได้ผสานเทคโนโลยี OCR (Optical Character Recognition) ที่ได้รับการเสริมประสิทธิภาพแม้ข้อความจะฝังอยู่ในภาพ ระบบก็สามารถสกัดและแทนที่ได้อย่างแม่นยำในตำแหน่งเดิม
สรุปแนวทางแก้ไขขั้นสุดท้าย
ShangYi AI มอบประสบการณ์แปลแบบ “เห็นอย่างไร ได้อย่างนั้น” ช่วยลดระยะเวลาในการปรับแต่งเอกสารด้วยตนเองของผู้ใช้อย่างมาก