Typhoon Translate 1.5 คือโมเดลแปลภาษาไทย–อังกฤษรุ่นใหม่ที่คุณสามารถเขียน Prompt เพื่อกำหนดคำสั่งได้ละเอียดว่าคุณต้องการให้ผลลัพธ์การแปลเป็นอย่างไร โมเดลนี้สร้างขึ้นจากรากฐานของ Typhoon Translate รุ่นดั้งเดิม โดยเวอร์ชัน 1.5 เพิ่มความสามารถด้านการทำตามคำสั่ง (Instruction-Following) พร้อมคงจุดแข็งเดิมในเรื่องของความเบา ความเป็นมิตรต่อระบบภายในประเทศ และความเป็นโอเพนซอร์ส
มีอะไรใหม่ในเวอร์ชัน 1.5: สร้างงานแปลได้อย่างยืดหยุ่นและตรงใจกว่าเดิม
Typhoon Translate 1.5 มาพร้อมความสามารถใหม่ในด้านการแปลที่เข้าใจคำสั่ง (Instruction-Aware Translation) ผู้ใช้จึงสามารถกำหนดสไตล์ภาษา การใช้คำศัพท์เฉพาะ รูปแบบตัวเลขและหน่วยวัด ไปจนถึงความยาวของข้อความได้อย่างอิสระ ทำให้ Typhoon Translate 1.5 ไม่เพียงแค่แปลได้ถูกต้อง แต่ยังปรับให้เข้ากับความต้องการในสถานการณ์จริงได้ดียิ่งกว่าเดิม
จากการทดสอบด้วยชุดประเมิน Instruction-Following Translation (IF-Translate) Typhoon Translate 1.5 ทำคะแนนได้สูงกว่ารุ่นก่อนถึง 3 เท่า แสดงให้เห็นถึงความก้าวหน้าครั้งใหญ่ในการแปลที่ควบคุมได้ละเอียดมากขึ้น
จุดแข็งที่ยังเหมือนเดิม
🚀 น้ำหนักเบา: พารามิเตอร์ 4B รันได้ด้วยแล็ปท็อปทั่วไป ไม่จำเป็นต้องใช้ฮาร์ดแวร์รุ่นใหญ่
🔒 ส่วนตัวและปลอดภัย: แปลโดยตรงบนอุปกรณ์ของคุณ ข้อมูลของคุณจะอยู่กับคุณ ไม่หลุดรั่วออกไป
🎯 การแปลที่เป็นธรรมชาติ: ให้การแปลที่เทียบเท่ากับโมเดลชั้นนำ สามารถเอาชนะโมเดล Gemini 2.5 Flash รวมถึง GPT-4o และ GPT 5 mini บนการทดสอบ
🔧 โอเพนซอร์ส: ใครๆ ก็โหลดและพร้อมใช้งานได้แล้วผ่าน HuggingFace และ Ollama
Typhoon Translate รุ่นแรกได้สร้างมาตรฐานใหม่ให้กับการแปลไทย–อังกฤษที่สามารถทำงานแบบส่วนตัวบนอุปกรณ์ภายในองค์กร โดยให้ผลลัพธ์ที่แม่นยำและเป็นธรรมชาติ เทียบเท่าหรือเหนือกว่าโมเดลขนาดใหญ่หลายตัว โดยไม่ต้องแลกกับความเป็นส่วนตัวของข้อมูล
อย่างไรก็ตาม จุดเด่นของรุ่นก่อนคือ “ความแม่นยำ” แต่ยังขาด “ความยืดหยุ่น” ในการปรับสไตล์หรือรูปแบบตามคำสั่ง Typhoon Translate 1.5 เข้ามาเติมเต็มช่องว่างนี้ด้วยการฝึกสอนให้เข้าใจคำสั่ง จึงสามารถแปลได้ถูกต้องพร้อมรักษากติกาที่ผู้ใช้กำหนด
วิธีการพัฒนา (Methodology)
การแปลภาษาไทย–อังกฤษไม่ใช่เรื่องใหม่ ชุดข้อมูลต่าง ๆ อย่าง SCB-MT และ OPUS ได้ถูกใช้ในการพัฒนาโมเดลแปลภาษามาหลายปีแล้ว แต่ชุดข้อมูลเหล่านี้ถูกสร้างขึ้นตั้งแต่ก่อนยุคของโมเดลภาษาใหญ่ (LLM) ซึ่งในเวลานั้น “ปริมาณ” ของข้อมูลมีความสำคัญมากกว่า “ความถูกต้องเชิงบริบท” ทว่าในยุคของ LLM มาตรฐานได้เปลี่ยนไป จากการเน้นจำนวนข้อมูล มาสู่การให้ความสำคัญกับคุณภาพ ความแม่นยำ และความสามารถในการปรับตามบริบทของภาษา
Typhoon Translate รุ่นแรกถูกพัฒนาขึ้นเพื่อตอบโจทย์ใหม่นี้ ผ่านกระบวนการสร้างข้อมูลและฝึกโมเดลแบบหลายขั้นตอน (multi-stage pipeline) ที่ออกแบบมาเพื่อความแม่นยำและสมดุล
เริ่มจาก การรวบรวมข้อมูล (Data Sourcing) ซึ่งดึงข้อความภาษาไทยและภาษาอังกฤษจากแหล่งสาธารณะที่หลากหลาย ครอบคลุมหลายโดเมน จากนั้นจึงเข้าสู่ขั้นตอน การแปลด้วยโมเดล LLM (LLM-Augmented Translation) โดยใช้โมเดลขนาดใหญ่หลายตัว เช่น Gemma-3 27B, Typhoon และ QwQ เพื่อสร้างคำแปลเบื้องต้น แล้วผ่านกระบวนการ การติดฉลากสองขั้นตอน (Two-Stage Labeling) เพื่อควบคุมทั้ง “ปริมาณ” และ “คุณภาพ”
ขั้นตอนที่ 1 มุ่งสร้างข้อมูลขนาดใหญ่ให้ครอบคลุมหลากหลายบริบท
ขั้นตอนที่ 2 เพิ่มการตรวจสอบคุณภาพโดยผู้เชี่ยวชาญ (Human-in-the-loop) ผ่านการสุ่มตรวจสอบด้านความลื่นไหล ความถูกต้อง และโทนภาษา
เมื่อได้ข้อมูลคุณภาพสูงแล้ว จึงเข้าสู่ขั้นตอน การคัดกรองและผสมข้อมูล (Data Mixture & Selection) เพื่อรวมข้อมูลจากหลายแหล่งเข้าด้วยกันอย่างสมดุล จากนั้นเทรนหลายจุดตรวจสอบ (checkpoints) และเปรียบเทียบผลด้วยทั้งเกณฑ์อัตโนมัติและการประเมินจากมนุษย์ โมเดลที่ทำผลงานดีที่สุดจึงกลายเป็น Typhoon Translate รุ่นแรก โมเดลแปลภาษาที่มีคุณภาพสูงและสามารถทำงานได้ดีบนเครื่องส่วนตัว (local deployment)
Typhoon Translate 1.5 ได้ต่อยอดจากรากฐานนี้ด้วยการเพิ่มขั้นตอนใหม่ ขั้นตอนที่ 3: Instruction Tuning เพื่อให้โมเดลไม่เพียงแค่ “แปลให้ถูกต้อง” แต่ยังสามารถ “แปลตามคำสั่งได้” เราได้เพิ่มชุดข้อมูลคู่คำสั่ง–คำแปล (instruction–translation pairs) ที่มีข้อกำหนดตรวจสอบได้จริง เช่น โทนภาษา คำศัพท์เฉพาะ รูปแบบการเขียน และโครงสร้างของผลลัพธ์ ขั้นตอนใหม่นี้ทำให้ Typhoon Translate 1.5 ก้าวข้ามจากการเป็นเพียงโมเดลแปลภาษาคุณภาพสูง ไปสู่การเป็นระบบแปลที่ควบคุมได้อย่างแท้จริงที่สามารถแปลได้อย่างแม่นยำ พร้อมปรับให้สอดคล้องกับสไตล์และความต้องการเฉพาะของผู้ใช้
การประเมินผล
เราได้ประเมิน Typhoon Translate 1.5 ทั้งในด้านคุณภาพการแปลพื้นฐานและความสามารถในการทำตามคำสั่ง โดยผสมผสานการทดสอบแบบมาตรฐานเข้ากับชุดทดสอบเฉพาะที่ออกแบบมาเพื่อตรวจสอบความสามารถในการรักษากติกาที่ซับซ้อน
1. การแปลมาตรฐาน (Standard Translation Quality)
ทดสอบความถูกต้อง ความลื่นไหล และความเป็นธรรมชาติของการแปล โดยใช้ชุดข้อมูลทดสอบภายในซึ่งประกอบด้วย
- ข้อมูลการประเมินภาษาไทยเป็นภาษาอังกฤษ (128 ตัวอย่าง)
ตัวอย่างข้อความภาษาไทยเลือกมาให้สมดุลจาก
-
ข้อมูลการประเมินภาษาอังกฤษเป็นภาษาไทย (177 ตัวอย่าง)
ตัวอย่างข้อความภาษาอังกฤษเลือกมาให้สมดุลจาก
2. การแปลที่เข้าใจคำสั่ง (Instruction-Aware Translation / IF-Translate)
เพื่อประเมินคุณสมบัติใหม่หลักของรุ่นนี้ เราได้พัฒนาชุดทดสอบเฉพาะกิจที่ท้าทายขึ้นเพื่อวัดความสามารถของโมเดลในการทำตามกติกาที่ตรวจสอบได้ระหว่างการแปล เช่น
-
การปรับโทนและสไตล์: แปลเป็นภาษาทางการหรือกันเองตามคำสั่ง
-
การใช้คำศัพท์เฉพาะ: แปลคำเทคนิคเฉพาะให้ตรงตามข้อกำหนดที่ต้องการ (เช่น ‘ไฮโดรเจนเหลว’ → ‘liquid hydrogen’)
-
การรักษารูปแบบตัวเลขและหน่วย: แปลหน่วยวัดและค่าตัวเลขตามรูปแบบ (เช่น ‘100 เท่า’ → ‘100×’)
-
การควบคุมผลลัพธ์: จำกัดจำนวนคำหรือโครงสร้างประโยคตามเงื่อนไข
ชุดทดสอบประกอบด้วย 150 ตัวอย่าง ไทย → อังกฤษ และอีก 150 ตัวอย่าง อังกฤษ → ไทย
ตัวอย่างคำสั่ง IF-Translation:
กรอบการประเมินผลและผลลัพธ์ (Evaluation Framework & Results)
เราใช้ AlpacaEvalHard 2.0 ซึ่งเป็นระบบประเมินแบบ “LLM-as-a-judge” (ใช้ AI เป็นกรรมการตัดสิน) เพื่อให้คะแนนผลลัพธ์ในทั้งสองประเภทการทดสอบ ระบบนี้เหมาะอย่างยิ่งสำหรับการประเมินงานที่มีคำสั่งซับซ้อนและให้การวัดผลที่เชื่อถือได้ทั้งในด้านคุณภาพและความถูกต้องตามกติกา
ภาพที่ 1: เปรียบเทียบคะแนนความสามารถการแปลมาตรฐานและการแปลแบบทำตามคำสั่ง

Typhoon Translate 1.5 ทำผลงานได้ดีขึ้นอย่างชัดเจนในด้านการทำตามคำสั่ง โดยมีคะแนนเฉลี่ยในชุดทดสอบ IF-Translate เพิ่มขึ้นจาก 17.65 เป็น 55.10 หรือประมาณ 3 เท่าของรุ่นเดิม ทำให้กลายเป็นโมเดลชั้นนำด้านการแปลที่ควบคุมได้ และมีศักยภาพเทียบเคียงกับโมเดลเชิงพาณิชย์ระดับบน
ภาพที่ 2: ตารางคะแนนการประเมินโดยละเอียด

สาธิตการแปล
เราได้นำเสนอการทดสอบด้วยพรอมต์ที่มีข้อกำหนดตรวจสอบได้อย่างชัดเจน พร้อมเปรียบเทียบผลลัพธ์ระหว่าง Typhoon Translate 1.5 กับ Typhoon Translate รุ่นดั้งเดิม
ตัวอย่างที่ 1: การแปลบทสนทนาในเวทีเสวนา (กำหนดการแปลชื่อ เพศ โทน และสไตล์)
Prompt:
Typhoon Translate 1.5 Result:
Earlier Typhoon Translate Result:
Example 2: Government-Related Translation (Terminology and formal register)
Prompt:
Typhoon Translate 1.5 Result:
Earlier Typhoon Translate Result:
Example 3: Game Context (Do-not-translate lists)
Prompt:
Typhoon Translate 1.5 Result:
Earlier Typhoon Translate Result:
สรุป
Typhoon Translate 1.5 ถือเป็นจุดเปลี่ยนสำคัญจากโมเดลแปลภาษาทั่วไป สู่ระบบแปลภาษาที่ควบคุมได้อย่างแท้จริง โดยสร้างขึ้นบนพื้นฐานเดียวกับ Typhoon Translate รุ่นแรกซึ่งมีคุณภาพสูงและเป็นโอเพนซอร์ส พร้อมเสริมความสามารถที่ช่วยให้ผู้ใช้สามารถปรับแต่งผลลัพธ์ได้ในทุกมิติ ตั้งแต่โทนภาษา คำศัพท์ ไปจนถึงรูปแบบและข้อจำกัดของข้อความ
ด้วยความแม่นยำในการทำตามคำสั่งที่ดีขึ้นกว่าเดิมถึง 3 เท่า และการออกแบบที่ยังคงมีขนาดเล็ก ใช้งานง่าย และเป็นมิตรต่อความเป็นส่วนตัว Typhoon Translate 1.5 พิสูจน์ให้เห็นว่าโมเดลขนาดเล็กที่มุ่งเน้นเฉพาะทางสามารถให้ประสิทธิภาพระดับโลกได้ โดยไม่ต้องแลกกับความยืดหยุ่นหรือการเข้าถึง
คุณสามารถใช้โมเดล Typhoon Translate 1.5 ได้แล้ววันนี้ ผ่านทาง Hugging Face หรือ Ollama
ข้อจำกัด
โมเดลนี้ได้รับการฝึกด้วยความยาวบริบทสูงสุด 8,192 โทเคน เพื่อให้ได้ประสิทธิภาพสูงสุด แนะนำให้จำกัดขนาดอินพุตไม่เกิน 8,192 โทเคนต่อครั้ง



