Typhoon Translate 1.5 โมเดลนักแปลภาษาอัปเกรดใหม่ล่าสุด สามารถทำตามคำสั่งและควบคุมโทนในการแปลได้ดั่งใจคุณเอง

Typhoon Translate 1.5 คือโมเดลแปลภาษาไทย–อังกฤษรุ่นใหม่ที่คุณสามารถเขียน Prompt เพื่อกำหนดคำสั่งได้ละเอียดว่าคุณต้องการให้ผลลัพธ์การแปลเป็นอย่างไร โมเดลนี้สร้างขึ้นจากรากฐานของ Typhoon Translate รุ่นดั้งเดิม โดยเวอร์ชัน 1.5 เพิ่มความสามารถด้านการทำตามคำสั่ง (Instruction-Following) พร้อมคงจุดแข็งเดิมในเรื่องของความเบา ความเป็นมิตรต่อระบบภายในประเทศ และความเป็นโอเพนซอร์ส

มีอะไรใหม่ในเวอร์ชัน 1.5: สร้างงานแปลได้อย่างยืดหยุ่นและตรงใจกว่าเดิม

Typhoon Translate 1.5 มาพร้อมความสามารถใหม่ในด้านการแปลที่เข้าใจคำสั่ง (Instruction-Aware Translation) ผู้ใช้จึงสามารถกำหนดสไตล์ภาษา การใช้คำศัพท์เฉพาะ รูปแบบตัวเลขและหน่วยวัด ไปจนถึงความยาวของข้อความได้อย่างอิสระ ทำให้ Typhoon Translate 1.5 ไม่เพียงแค่แปลได้ถูกต้อง แต่ยังปรับให้เข้ากับความต้องการในสถานการณ์จริงได้ดียิ่งกว่าเดิม

จากการทดสอบด้วยชุดประเมิน Instruction-Following Translation (IF-Translate) Typhoon Translate 1.5 ทำคะแนนได้สูงกว่ารุ่นก่อนถึง 3 เท่า แสดงให้เห็นถึงความก้าวหน้าครั้งใหญ่ในการแปลที่ควบคุมได้ละเอียดมากขึ้น

จุดแข็งที่ยังเหมือนเดิม

🚀 น้ำหนักเบา: พารามิเตอร์ 4B รันได้ด้วยแล็ปท็อปทั่วไป ไม่จำเป็นต้องใช้ฮาร์ดแวร์รุ่นใหญ่

🔒 ส่วนตัวและปลอดภัย: แปลโดยตรงบนอุปกรณ์ของคุณ ข้อมูลของคุณจะอยู่กับคุณ ไม่หลุดรั่วออกไป

🎯 การแปลที่เป็นธรรมชาติ: ให้การแปลที่เทียบเท่ากับโมเดลชั้นนำ สามารถเอาชนะโมเดล Gemini 2.5 Flash รวมถึง GPT-4o และ GPT 5 mini บนการทดสอบ

🔧 โอเพนซอร์ส: ใครๆ ก็โหลดและพร้อมใช้งานได้แล้วผ่าน HuggingFace และ Ollama

Typhoon Translate รุ่นแรกได้สร้างมาตรฐานใหม่ให้กับการแปลไทย–อังกฤษที่สามารถทำงานแบบส่วนตัวบนอุปกรณ์ภายในองค์กร โดยให้ผลลัพธ์ที่แม่นยำและเป็นธรรมชาติ เทียบเท่าหรือเหนือกว่าโมเดลขนาดใหญ่หลายตัว โดยไม่ต้องแลกกับความเป็นส่วนตัวของข้อมูล

อย่างไรก็ตาม จุดเด่นของรุ่นก่อนคือ “ความแม่นยำ” แต่ยังขาด “ความยืดหยุ่น” ในการปรับสไตล์หรือรูปแบบตามคำสั่ง Typhoon Translate 1.5 เข้ามาเติมเต็มช่องว่างนี้ด้วยการฝึกสอนให้เข้าใจคำสั่ง จึงสามารถแปลได้ถูกต้องพร้อมรักษากติกาที่ผู้ใช้กำหนด

วิธีการพัฒนา (Methodology)

การแปลภาษาไทย–อังกฤษไม่ใช่เรื่องใหม่ ชุดข้อมูลต่าง ๆ อย่าง SCB-MT และ OPUS ได้ถูกใช้ในการพัฒนาโมเดลแปลภาษามาหลายปีแล้ว แต่ชุดข้อมูลเหล่านี้ถูกสร้างขึ้นตั้งแต่ก่อนยุคของโมเดลภาษาใหญ่ (LLM) ซึ่งในเวลานั้น “ปริมาณ” ของข้อมูลมีความสำคัญมากกว่า “ความถูกต้องเชิงบริบท” ทว่าในยุคของ LLM มาตรฐานได้เปลี่ยนไป จากการเน้นจำนวนข้อมูล มาสู่การให้ความสำคัญกับคุณภาพ ความแม่นยำ และความสามารถในการปรับตามบริบทของภาษา

Typhoon Translate รุ่นแรกถูกพัฒนาขึ้นเพื่อตอบโจทย์ใหม่นี้ ผ่านกระบวนการสร้างข้อมูลและฝึกโมเดลแบบหลายขั้นตอน (multi-stage pipeline) ที่ออกแบบมาเพื่อความแม่นยำและสมดุล

เริ่มจาก การรวบรวมข้อมูล (Data Sourcing) ซึ่งดึงข้อความภาษาไทยและภาษาอังกฤษจากแหล่งสาธารณะที่หลากหลาย ครอบคลุมหลายโดเมน จากนั้นจึงเข้าสู่ขั้นตอน การแปลด้วยโมเดล LLM (LLM-Augmented Translation) โดยใช้โมเดลขนาดใหญ่หลายตัว เช่น Gemma-3 27B, Typhoon และ QwQ เพื่อสร้างคำแปลเบื้องต้น แล้วผ่านกระบวนการ การติดฉลากสองขั้นตอน (Two-Stage Labeling) เพื่อควบคุมทั้ง “ปริมาณ” และ “คุณภาพ”

ขั้นตอนที่ 1 มุ่งสร้างข้อมูลขนาดใหญ่ให้ครอบคลุมหลากหลายบริบท

ขั้นตอนที่ 2 เพิ่มการตรวจสอบคุณภาพโดยผู้เชี่ยวชาญ (Human-in-the-loop) ผ่านการสุ่มตรวจสอบด้านความลื่นไหล ความถูกต้อง และโทนภาษา

เมื่อได้ข้อมูลคุณภาพสูงแล้ว จึงเข้าสู่ขั้นตอน การคัดกรองและผสมข้อมูล (Data Mixture & Selection) เพื่อรวมข้อมูลจากหลายแหล่งเข้าด้วยกันอย่างสมดุล จากนั้นเทรนหลายจุดตรวจสอบ (checkpoints) และเปรียบเทียบผลด้วยทั้งเกณฑ์อัตโนมัติและการประเมินจากมนุษย์ โมเดลที่ทำผลงานดีที่สุดจึงกลายเป็น Typhoon Translate รุ่นแรก โมเดลแปลภาษาที่มีคุณภาพสูงและสามารถทำงานได้ดีบนเครื่องส่วนตัว (local deployment)

Typhoon Translate 1.5 ได้ต่อยอดจากรากฐานนี้ด้วยการเพิ่มขั้นตอนใหม่ ขั้นตอนที่ 3: Instruction Tuning เพื่อให้โมเดลไม่เพียงแค่ “แปลให้ถูกต้อง” แต่ยังสามารถ “แปลตามคำสั่งได้” เราได้เพิ่มชุดข้อมูลคู่คำสั่ง–คำแปล (instruction–translation pairs) ที่มีข้อกำหนดตรวจสอบได้จริง เช่น โทนภาษา คำศัพท์เฉพาะ รูปแบบการเขียน และโครงสร้างของผลลัพธ์ ขั้นตอนใหม่นี้ทำให้ Typhoon Translate 1.5 ก้าวข้ามจากการเป็นเพียงโมเดลแปลภาษาคุณภาพสูง ไปสู่การเป็นระบบแปลที่ควบคุมได้อย่างแท้จริงที่สามารถแปลได้อย่างแม่นยำ พร้อมปรับให้สอดคล้องกับสไตล์และความต้องการเฉพาะของผู้ใช้

การประเมินผล

เราได้ประเมิน Typhoon Translate 1.5 ทั้งในด้านคุณภาพการแปลพื้นฐานและความสามารถในการทำตามคำสั่ง โดยผสมผสานการทดสอบแบบมาตรฐานเข้ากับชุดทดสอบเฉพาะที่ออกแบบมาเพื่อตรวจสอบความสามารถในการรักษากติกาที่ซับซ้อน

1. การแปลมาตรฐาน (Standard Translation Quality)

ทดสอบความถูกต้อง ความลื่นไหล และความเป็นธรรมชาติของการแปล โดยใช้ชุดข้อมูลทดสอบภายในซึ่งประกอบด้วย

ข้อมูลการประเมินภาษาไทยเป็นภาษาอังกฤษ (128 ตัวอย่าง)

ตัวอย่างข้อความภาษาไทยเลือกมาให้สมดุลจาก

WangchanInstruct test set
thai_instruction_sft
ข้อมูลการประเมินภาษาอังกฤษเป็นภาษาไทย (177 ตัวอย่าง)

ตัวอย่างข้อความภาษาอังกฤษเลือกมาให้สมดุลจาก

2. การแปลที่เข้าใจคำสั่ง (Instruction-Aware Translation / IF-Translate)

เพื่อประเมินคุณสมบัติใหม่หลักของรุ่นนี้ เราได้พัฒนาชุดทดสอบเฉพาะกิจที่ท้าทายขึ้นเพื่อวัดความสามารถของโมเดลในการทำตามกติกาที่ตรวจสอบได้ระหว่างการแปล เช่น

การปรับโทนและสไตล์: แปลเป็นภาษาทางการหรือกันเองตามคำสั่ง
การใช้คำศัพท์เฉพาะ: แปลคำเทคนิคเฉพาะให้ตรงตามข้อกำหนดที่ต้องการ (เช่น ‘ไฮโดรเจนเหลว’ → ‘liquid hydrogen’)
การรักษารูปแบบตัวเลขและหน่วย: แปลหน่วยวัดและค่าตัวเลขตามรูปแบบ (เช่น ‘100 เท่า’ → ‘100×’)
การควบคุมผลลัพธ์: จำกัดจำนวนคำหรือโครงสร้างประโยคตามเงื่อนไข

ชุดทดสอบประกอบด้วย 150 ตัวอย่าง ไทย → อังกฤษ และอีก 150 ตัวอย่าง อังกฤษ → ไทย

ตัวอย่างคำสั่ง IF-Translation:

MARKDOWN

กรอบการประเมินผลและผลลัพธ์ (Evaluation Framework & Results)

เราใช้ AlpacaEvalHard 2.0 ซึ่งเป็นระบบประเมินแบบ “LLM-as-a-judge” (ใช้ AI เป็นกรรมการตัดสิน) เพื่อให้คะแนนผลลัพธ์ในทั้งสองประเภทการทดสอบ ระบบนี้เหมาะอย่างยิ่งสำหรับการประเมินงานที่มีคำสั่งซับซ้อนและให้การวัดผลที่เชื่อถือได้ทั้งในด้านคุณภาพและความถูกต้องตามกติกา

ภาพที่ 1: เปรียบเทียบคะแนนความสามารถการแปลมาตรฐานและการแปลแบบทำตามคำสั่ง

Typhoon Translate 1.5 ทำผลงานได้ดีขึ้นอย่างชัดเจนในด้านการทำตามคำสั่ง โดยมีคะแนนเฉลี่ยในชุดทดสอบ IF-Translate เพิ่มขึ้นจาก 17.65 เป็น 55.10 หรือประมาณ 3 เท่าของรุ่นเดิม ทำให้กลายเป็นโมเดลชั้นนำด้านการแปลที่ควบคุมได้ และมีศักยภาพเทียบเคียงกับโมเดลเชิงพาณิชย์ระดับบน

ภาพที่ 2: ตารางคะแนนการประเมินโดยละเอียด

สาธิตการแปล

เราได้นำเสนอการทดสอบด้วยพรอมต์ที่มีข้อกำหนดตรวจสอบได้อย่างชัดเจน พร้อมเปรียบเทียบผลลัพธ์ระหว่าง Typhoon Translate 1.5 กับ Typhoon Translate รุ่นดั้งเดิม

ตัวอย่างที่ 1: การแปลบทสนทนาในเวทีเสวนา (กำหนดการแปลชื่อ เพศ โทน และสไตล์)

Prompt:

JAVASCRIPT

Typhoon Translate 1.5 Result:

JAVASCRIPT

Earlier Typhoon Translate Result:

JAVASCRIPT

Example 2: Government-Related Translation (Terminology and formal register)

Prompt:

JAVASCRIPT

Typhoon Translate 1.5 Result:

TEXT

Earlier Typhoon Translate Result:

TEXT

Example 3: Game Context (Do-not-translate lists)

Prompt:

JAVASCRIPT

Typhoon Translate 1.5 Result:

TEXT

Earlier Typhoon Translate Result:

TEXT

สรุป

Typhoon Translate 1.5 ถือเป็นจุดเปลี่ยนสำคัญจากโมเดลแปลภาษาทั่วไป สู่ระบบแปลภาษาที่ควบคุมได้อย่างแท้จริง โดยสร้างขึ้นบนพื้นฐานเดียวกับ Typhoon Translate รุ่นแรกซึ่งมีคุณภาพสูงและเป็นโอเพนซอร์ส พร้อมเสริมความสามารถที่ช่วยให้ผู้ใช้สามารถปรับแต่งผลลัพธ์ได้ในทุกมิติ ตั้งแต่โทนภาษา คำศัพท์ ไปจนถึงรูปแบบและข้อจำกัดของข้อความ

ด้วยความแม่นยำในการทำตามคำสั่งที่ดีขึ้นกว่าเดิมถึง 3 เท่า และการออกแบบที่ยังคงมีขนาดเล็ก ใช้งานง่าย และเป็นมิตรต่อความเป็นส่วนตัว Typhoon Translate 1.5 พิสูจน์ให้เห็นว่าโมเดลขนาดเล็กที่มุ่งเน้นเฉพาะทางสามารถให้ประสิทธิภาพระดับโลกได้ โดยไม่ต้องแลกกับความยืดหยุ่นหรือการเข้าถึง

คุณสามารถใช้โมเดล Typhoon Translate 1.5 ได้แล้ววันนี้ ผ่านทาง Hugging Face หรือ Ollama

ข้อจำกัด

โมเดลนี้ได้รับการฝึกด้วยความยาวบริบทสูงสุด 8,192 โทเคน เพื่อให้ได้ประสิทธิภาพสูงสุด แนะนำให้จำกัดขนาดอินพุตไม่เกิน 8,192 โทเคนต่อครั้ง

Typhoon Translate 1.5 โมเดลนักแปลภาษาอัปเกรดใหม่ล่าสุด สามารถทำตามคำสั่งและควบคุมโทนในการแปลได้ดั่งใจคุณเอง

สารบัญ

มีอะไรใหม่ในเวอร์ชัน 1.5: สร้างงานแปลได้อย่างยืดหยุ่นและตรงใจกว่าเดิม

จุดแข็งที่ยังเหมือนเดิม

วิธีการพัฒนา (Methodology)

การประเมินผล

1. การแปลมาตรฐาน (Standard Translation Quality)

2. การแปลที่เข้าใจคำสั่ง (Instruction-Aware Translation / IF-Translate)

กรอบการประเมินผลและผลลัพธ์ (Evaluation Framework & Results)

สาธิตการแปล

ตัวอย่างที่ 1: การแปลบทสนทนาในเวทีเสวนา (กำหนดการแปลชื่อ เพศ โทน และสไตล์)

Example 2: Government-Related Translation (Terminology and formal register)

Example 3: Game Context (Do-not-translate lists)

สรุป

ข้อจำกัด

เปิดตัว Typhoon OCR 1.5: โมเดลโอเพนซอร์ส OCR ที่ฉลาดและใช้ง่ายขึ้น มาพร้อมกับขนาดที่เล็กลงและประมวลผลเร็วกว่าเดิม

Typhoon 2.5: โมเดลโอเพนซอร์สที่ยกระดับ Agentic AI ภาษาไทย พร้อมพลัง ความเร็ว และความคุ้มค่ากว่าเดิม