Blog LogoTYPHOON
Home
Research
Join Text-to-Speech Research
DocumentationDemo AppsPlayground
Blog
About
Blog LogoTyphoon
  • Home
  • Research
    • Join Text-to-Speech Research
  • Get Started
    • Documentation
    • Demo Apps
    • Playground
  • Blog
  • About

© 2025 SCB 10X Co., Ltd.

เปิดตัว Typhoon Translate โมเดลนักแปลภาษาที่แปลไทยนำหน้าโมเดลชั้นนำ พร้อมปกป้องข้อมูลด้วยโมเดลขนาดเล็กรันบนเครื่องได้

เปิดตัว Typhoon Translate โมเดลนักแปลภาษาที่แปลไทยนำหน้าโมเดลชั้นนำ พร้อมปกป้องข้อมูลด้วยโมเดลขนาดเล็กรันบนเครื่องได้

New ReleaseTyphoon TranslateSmall ModelLocal LLMText Model
Teetouch Jaknamon
Teetouch Jaknamon
23 มิถุนายน 2025

Table of Contents

ที่มาที่ไปของ Typhoon Translateความท้าทายที่เป็นแรงบันดาลใจให้เราTyphoon Translate: ทำลายกำแพงภาษาด้วย Local LLMจุดเด่นวิธีการการประเมินผลข้อมูลที่ใช้ในการทดสอบประเมินผลผลการประเมินพบว่า Typhoon Translate เอาชนะทุกโมเดลอื่นในการทดสอบแปลจากภาษาอังกฤษเป็นภาษาไทย (EN→TH)แปลจากภาษาไทยเป็นภาษาอังกฤษ (TH→EN)การสาธิตการแปลสาธิตการแปลภาษาอังกฤษเป็นภาษาไทยสรุปข้อจำกัดและงานในอนาคตทดลองใช้งาน Typhoon Translate วันนี้ภาคผนวกตัวอย่างการแปลจากภาษาอังกฤษเป็นภาษาไทย (ข้อความเต็มจากตัวอย่างเดโมในเนื้อหาหลัก)ตัวอย่างการแปลจากภาษาไทยเป็นภาษาอังกฤษ

Blog นี้ได้รับการแปลเนื้อหาจากภาษาอังกฤษเป็นภาษาไทยโดยมี Typhoon Translate เป็นตัวช่วยและมีทีมงานตำแหน่ง Developer Relations Manager ของทีมเป็นผู้ดูแลปรับปรุงเนื้อหา


พวกเรามีความยินดีที่จะเปิดตัว Typhoon Translate โมเดลโอเพนซอร์สขนาดเล็กที่ถูกสร้างมาเพื่อให้เก่งงานแปลภาษาระหว่างภาษาไทยและภาษาอังกฤษโดยเฉพาะ พร้อมให้ใช้งานได้แล้วผ่าน Hugging Face และ Ollama.

ที่มาที่ไปของ Typhoon Translate

การใช้คอมพิวเตอร์แปลภาษาได้มีวิวัฒนาการมาเป็นอย่างมาก เริ่มแรกเป็นการแปลแบบประโยคต่อประโยคเหมือน Google Translate รุ่นแรกๆ แต่ตอนนี้เรามี LLM อย่าง GPT และ Claude เครื่องมือเหล่านี้แปลได้ดีขึ้นมากเพราะเข้าใจรายละเอียดเล็กๆ และบริบทของสิ่งที่กำลังแปล

ส่งผลให้งานแปลภาษาเป็นงานที่มีการนำ LLM มาใช้งานอยู่บ่อยครั้ง ไม่ว่าจะเป็นในโลกธุรกิจอย่างการแปลอีเมล บทความ หรือแม้กระทั่งเอกสารทางธุรกิจ หรือแม้แต่ในชีวิตประจำวันก็ตาม

แต่ถึงแม้ปัจจุบันจะมีเครื่องมือแปลภาษาอยู่อย่างมากมาย เครื่องมือส่วนใหญ่เหล่านี้ก็ยังไม่ค่อยตอบโจทย์นัก โดยเฉพาะอย่างยิ่งหากเราพูดถึงเรื่องความเป็นส่วนตัวและปลอดภัยของข้อมูล และรวมไปถึงเรื่องคุณภาพและความสอดคล้องของงานแปลเองก็ตาม

การที่เราจะรันการแปลบนอุปกรณ์ส่วนตัวนั้นยังคงหาตัวเลือกได้ยากเนื่องจากข้อจำกัดด้านคุณภาพ เราจึงสร้าง Typhoon Translate ขึ้นมาเพื่อแก้ไขปัญหานี้

ความท้าทายที่เป็นแรงบันดาลใจให้เรา

เชื่อว่าเราทุกคนต่างก็เคยใช้เครื่องมือแปลภาษาและเห็นผลการแปลที่ตลกหรือสับสน เช่น ข้อความภาษาไทยแปลกๆ บนป้ายร้านอาหาร หรือคู่มือการใช้งานที่เข้าใจยาก แต่การแปลที่แย่ไม่ได้เป็นเพียงเรื่องตลกขบขันเท่านั้น แต่ยังอาจก่อให้เกิดปัญหาในเรื่องการสื่อสารได้

ภาษาไทยจัดอยู่ในกลุ่มภาษาที่มีทรัพยากรน้อยถึงปานกลาง มีเนื้อหาออนไลน์เพียงประมาณ 0.5% ที่เป็นภาษาไทย ในขณะที่ภาษาอังกฤษมีเกือบ 50%—มากกว่าถึงร้อยเท่า การปลดล็อกเนื้อหาภาษาอังกฤษจำนวนมหาศาลนี้จำเป็นต้องใช้โมเดลการแปลที่มีประสิทธิภาพและแม่นยำ นอกจากนี้ยังมีกรณีการใช้งานสำคัญสำหรับโมเดลการแปลแบบ local โดยเฉพาะเมื่อต้องจัดการกับเอกสารส่วนตัวหรือข้อมูลที่ละเอียดอ่อนซึ่งไม่ควรถูกส่งออกจากองค์กร

โมเดลภาษาขนาดเล็กที่รันได้บน local มีการพัฒนาขึ้นทุกวัน แต่คุณภาพการแปลยังไม่ก้าวหน้าอย่างมีนัยสำคัญ การแปลยังคงเป็นความท้าทายเนื่องจากลักษณะของข้อมูลทางภาษาที่มีลักษณะ long-tail

Typhoon Translate: ทำลายกำแพงภาษาด้วย Local LLM

Typhoon Translate ถูกออกแบบมาเพื่อแก้ปัญหาการแปลระหว่างภาษาไทยและภาษาอังกฤษ โดยให้การแปลที่ชัดเจนและฟังดูเป็นธรรมชาติและเทียบเท่ากับโมเดลขนาดใหญ่ของต่างประเทศ แต่มีขนาดเล็กซึ่งทำให้คุณสามารถใช้งานโมเดลบนแล็ปท็อปได้

ภารกิจของเรานั้นเรียบง่าย: ช่วยให้ผู้คนชาวไทยเข้าถึงข้อมูลและโอกาสต่างๆ โดยการขจัดกำแพงภาษา และช่วยให้การแปลภาษาสามารถถูกนำมาใช้งานได้ง่ายๆ ในทุกอุปกรณ์โดยไม่จำเป็นต้องพึ่งพาแม้แต่อินเทอร์เน็ต

จุดเด่น

🚀 น้ำหนักเบา: พารามิเตอร์ 4B—รันบนแล็ปท็อปทั่วไป ไม่จำเป็นต้องใช้ฮาร์ดแวร์ที่ทรงพลัง

🔒 ส่วนตัวและปลอดภัย: แปลโดยตรงบนอุปกรณ์ของคุณ ข้อมูลของคุณจะอยู่กับคุณ ไม่หลุดรั่วออกไป

🎯 การแปลที่เป็นธรรมชาติ: ให้การแปลที่เทียบเท่ากับระบบชั้นนำ สามารถเอาชนะ GPT-4o และ Gemini 2.5 Flash บนการทดสอบ

🔧เปิดสาธารณะ: ใครๆ ก็โหลดและพร้อมใช้งานได้แล้วบน HuggingFace และ Ollama

วิธีการ

การแปลไม่ใช่งานใหม่ ดังที่แสดงโดยชุดข้อมูลอย่าง SCB-MT และ OPUS ที่เผยแพร่มาแล้วหลายปี อย่างไรก็ตาม ชุดข้อมูลส่วนใหญ่เหล่านี้ถูกสร้างขึ้นก่อนการเกิดขึ้นของ LLM (large language models) ในช่วงเวลาที่การแปลด้วยเครื่องเน้นปริมาณมากกว่าคุณภาพ ในยุค LLM กระบวนทัศน์นี้ได้เปลี่ยนไป โดยเน้นคุณภาพการแปลมากขึ้น

เพื่อให้ตอบโจทย์ความต้องการยุคใหม่ เราเริ่มต้นด้วยการรวบรวมข้อความภาษาอังกฤษและภาษาไทยที่หลากหลายจากแหล่งข้อมูลสาธารณะ จากนั้นเราใช้ LLM หลายตัว เช่น Gemma-3 27B, Typhoon, QwQ และอื่นๆ เพื่อสร้างการแปล

กระบวนการของเราประกอบด้วยการติดป้ายกำกับสองขั้นตอน ขั้นแรกเน้นปริมาณ ขณะที่ขั้นที่สองเน้นคุณภาพผ่านการตรวจสอบด้วยมนุษย์แบบสุ่ม เรายังทำการเลือกผสมข้อมูล (data mixture selection) โดยรวมและกรองแหล่งข้อมูลต่างๆ ตามด้วยการฝึกโมเดลเช็คพอยต์หลายตัว โมเดลที่มีประสิทธิภาพสูงสุดตามคะแนนการประเมินจะถูกปล่อยออกมา

Typhoon Translate Training Data ชุดข้อมูลการฝึกของเรา

การประเมินผล

ในการประเมิน Typhoon Translate เราใช้ GPT-4o-mini เป็น "AI judge" (ใช้ AI เป็นกรรมการตัดสิน) โดยเปรียบเทียบการแปลของตัวเองกับผลลัพธ์จาก Typhoon Translate โดยใช้วิธี AlpacaEval 2.0 เราทดสอบทั้งทิศทางภาษาอังกฤษเป็นภาษาไทย และภาษาไทยเป็นภาษาอังกฤษ

แทนที่จะใช้ตัวชี้วัดเก่า อย่าง BLEU ซึ่งพึ่งพาการจับคู่คำตรงกัน เราเลือกใช้แนวทางที่อิง AI ในการตัดสินผลลัพธ์ สาเหตุเพราะคุณภาพการแปลเกี่ยวข้องกับความหมาย น้ำเสียง และความละเอียดอ่อนทางวัฒนธรรม ไม่ใช่แค่การจับคู่คำ โดยเราใช้ GPT-4o-mini มาเป็นกรรมการตัดสินว่าการแปลไหนดีกว่าโดยพิจารณาจากความแม่นยำ ความคล่องแคล่ว และบริบท

คะแนนนี้สะท้อนถึงความถี่ที่ Typhoon Translate และระบบอื่นถูกเลือกมากกว่าการแปลของตัว GPT-4o-mini เอง

ข้อมูลที่ใช้ในการทดสอบประเมินผล

เราได้แหล่งข้อมูลสำหรับการประเมินจากหลายแหล่ง

ข้อมูลการประเมินภาษาไทยเป็นภาษาอังกฤษ (128 ตัวอย่าง)

ตัวอย่างข้อความภาษาไทยเลือกมาให้สมดุลจาก

  • WangchanInstruct test set
  • thai_instruction_sft

ข้อมูลการประเมินภาษาอังกฤษเป็นภาษาไทย (177 ตัวอย่าง)

ตัวอย่างข้อความภาษาอังกฤษเลือกมาให้สมดุลจาก

  • WMT24 en_th
  • Tulu
  • LIMA

เราประเมินโมเดลของเรากับ Google Translate และโมเดลภาษาที่ล้ำสมัย ไม่ว่าจะเป็น GPT-4, Gemini และ Claude

ผลการประเมินพบว่า Typhoon Translate เอาชนะทุกโมเดลอื่นในการทดสอบ

ผลการประเมินเป็นการเปรียบเทียบแบบจับคู่ระหว่างโมเดลที่ทดสอบกับโมเดล GPT-4o-mini และวัดอัตราความสำเร็จในการเอาชนะ

แปลจากภาษาอังกฤษเป็นภาษาไทย (EN→TH)

Typhoon Translate EN-TH Eval

Typhoon Translate นำหน้าทุกโมเดลด้วยคะแนนอัตราการชนะร้อยละ 63.8 ในขณะที่โมเดลอื่นๆ มีอัตราการเอาชนะดังนี้

  • Gemini 2.5 Flash Preview (61.6%)
  • GPT-4.1-2025 (59.3%)
  • Claude 3.7 (55.4%)
  • GPT-4o-2024 (54.8%)
  • Google Translate (44.1%)
  • GPT-4.1-mini (41.2%)

แปลจากภาษาไทยเป็นภาษาอังกฤษ (TH→EN)

Typhoon Translate TH-EN Eval

Typhoon Translate สามารถเอาชนะทุกโมเดลได้อีกครั้งด้วยคะแนนอัตราที่เพิ่มขึ้นเป็นร้อยละ 67.2% นำหน้าโมเดลอื่นๆ ได้แก่

  • GPT-4o-2024 (62.5%)
  • Gemini 2.5 Flash Preview (61.7%)
  • GPT-4.1-2025 (60.2%)
  • GPT-4.1-mini (55.5%)
  • Google Translate (44.1%)
  • Claude 3.7 (39.1%)

✅ ข้อสรุป: Typhoon Translate สามารถเอาชนะโมเดลชั้นนำของต่างประเทศ รวมไปถึงตัว GPT-4o-mini เอง

การสาธิตการแปล

สาธิตการแปลภาษาอังกฤษเป็นภาษาไทย

เราได้จัดเตรียมตัวอย่างการแปลของ Typhoon Translate กับ GPT-4o ในกรณีการใช้งานตัวอย่างดังนี้:

ตัวอย่าง 1: เนื้อหาวรรณกรรม

เป้าหมาย: แปลโดยรักษาความสวยงามของคำศัพท์เพื่ออรรถรสในการอ่าน

เนื้อหาต้นทาง: ข้อความแนวนวนิยายที่เขียนขึ้นโดย ChatGPT

ต้นฉบับ:

A fallen deity, Serai, cursed to walk as a mortal boy, fights against the Empire that slaughtered the skyborn.
He trains with humans, bonds with them, bleeds beside them. In secret, he regrows his wings through combat—but each feather only returns when he loses someone he loves.
At the climax, he ascends—glorious, radiant, unstoppable—only to find his friends gone, their memories etched into his wings.
As he watches the sun rise, his halo returns.
He whispers, “Was it worth it?”
And no one answers.
A fallen deity, Serai, cursed to walk as a mortal boy, fights against the Empire that slaughtered the skyborn.
He trains with humans, bonds with them, bleeds beside them. In secret, he regrows his wings through combat—but each feather only returns when he loses someone he loves.
At the climax, he ascends—glorious, radiant, unstoppable—only to find his friends gone, their memories etched into his wings.
As he watches the sun rise, his halo returns.
He whispers, “Was it worth it?”
And no one answers.
plaintext

ผลลัพธ์:

translate-EN-TH-demo1.png

ผลลัพธ์โดย GPT-4o:

เซไร เทพที่ล่มสลาย ถูกสาปให้เดินในร่างเด็กชายมนุษย์ ต่อสู้กับจักรวรรดิที่สังหารผู้เกิดบนฟ้า เขาฝึกฝนกับมนุษย์ สร้างสายสัมพันธ์ และร่วมต่อสู้เคียงข้างพวกเขา ในความลับ เขาฟื้นฟูปีกของเขาผ่านการต่อสู้—แต่ขนนกแต่ละเส้นจะกลับมาเมื่อเขาสูญเสียคนที่เขารัก

ในจุดสูงสุด เขาเหินขึ้น—งดงาม สว่างไสว หยุดไม่อยู่—แต่กลับพบว่าเพื่อนของเขาหายไป ความทรงจำของพวกเขาถูกจารึกลงในปีกของเขา ขณะที่เขามองดูพระอาทิตย์ขึ้น วงแหวนศักดิ์สิทธิ์ของเขาก็กลับมา

เขากระซิบว่า “มันคุ้มค่าหรือเปล่า?” และไม่มีใครตอบ
เซไร เทพที่ล่มสลาย ถูกสาปให้เดินในร่างเด็กชายมนุษย์ ต่อสู้กับจักรวรรดิที่สังหารผู้เกิดบนฟ้า เขาฝึกฝนกับมนุษย์ สร้างสายสัมพันธ์ และร่วมต่อสู้เคียงข้างพวกเขา ในความลับ เขาฟื้นฟูปีกของเขาผ่านการต่อสู้—แต่ขนนกแต่ละเส้นจะกลับมาเมื่อเขาสูญเสียคนที่เขารัก

ในจุดสูงสุด เขาเหินขึ้น—งดงาม สว่างไสว หยุดไม่อยู่—แต่กลับพบว่าเพื่อนของเขาหายไป ความทรงจำของพวกเขาถูกจารึกลงในปีกของเขา ขณะที่เขามองดูพระอาทิตย์ขึ้น วงแหวนศักดิ์สิทธิ์ของเขาก็กลับมา

เขากระซิบว่า “มันคุ้มค่าหรือเปล่า?” และไม่มีใครตอบ
plaintext

ผลลัพธ์โดย Typhoon Translate:

เทพเจ้าที่ร่วงหล่น เซไร ถูกสาปให้ต้องมาเกิดเป็นเด็กมนุษย์ กลับต่อสู้กับจักรวรรดิที่สังหารหมู่เหล่าทวยเทพผู้สถิตบนฟ้า เขาฝึกฝนร่วมกับมนุษย์ สร้างมิตรภาพ เลือดไหลเคียงข้างพวกเขา ในความลับ เขาปลูกปีกขึ้นใหม่ผ่านการต่อสู้ แต่ละขนนกจะกลับคืนมาได้ก็ต่อเมื่อเขาต้องสูญเสียคนที่เขารัก

ในฉากไคลแมกซ์ เขาทะยานขึ้นสู่ฟ้า—สง่างาม สว่างไสว ไร้ขีดจำกัด—แต่กลับพบว่าเพื่อนๆ ของเขาได้จากไปแล้ว ความทรงจำของพวกเขาถูกสลักไว้บนปีกของเขา

ขณะที่เขามองดูดวงอาทิตย์ขึ้น รัศมีรอบตัวเขาก็กลับคืนมาอีกครั้ง

เขาพึมพำว่า "มันคุ้มค่าหรือเปล่า?"

แต่ไม่มีใครตอบเขาเลย
เทพเจ้าที่ร่วงหล่น เซไร ถูกสาปให้ต้องมาเกิดเป็นเด็กมนุษย์ กลับต่อสู้กับจักรวรรดิที่สังหารหมู่เหล่าทวยเทพผู้สถิตบนฟ้า เขาฝึกฝนร่วมกับมนุษย์ สร้างมิตรภาพ เลือดไหลเคียงข้างพวกเขา ในความลับ เขาปลูกปีกขึ้นใหม่ผ่านการต่อสู้ แต่ละขนนกจะกลับคืนมาได้ก็ต่อเมื่อเขาต้องสูญเสียคนที่เขารัก

ในฉากไคลแมกซ์ เขาทะยานขึ้นสู่ฟ้า—สง่างาม สว่างไสว ไร้ขีดจำกัด—แต่กลับพบว่าเพื่อนๆ ของเขาได้จากไปแล้ว ความทรงจำของพวกเขาถูกสลักไว้บนปีกของเขา

ขณะที่เขามองดูดวงอาทิตย์ขึ้น รัศมีรอบตัวเขาก็กลับคืนมาอีกครั้ง

เขาพึมพำว่า "มันคุ้มค่าหรือเปล่า?"

แต่ไม่มีใครตอบเขาเลย
plaintext

ตัวอย่าง 2: เอกสารมืออาชีพที่มีคำศัพท์ภาษาอังกฤษปะปน

เป้าหมาย: แปลโดยรักษาคำศัพท์ทางเทคนิคไว้เพื่อรักษาความหมายของคำภาษาอังกฤษ

เนื้อหาต้นทาง: SCBX-AI-Outlook-2025_ENG_Final.pdf

ผลลัพธ์:

translate-EN-TH-demo2.png

ตัวอย่าง 3: รายงานเชิงเทคนิค

เป้าหมาย: แปลรายงานโดยรักษาคำศัพท์ทางเทคนิคไว้เพื่อหลีกเลี่ยงการแปลที่ทำให้เกิดความสับสน

เนื้อหาต้นทาง: Typhoon 2: A Family of Open Text and Multimodal Thai Large Language Models

ผลลัพธ์:

translate-EN-TH-demo3.png

นอกจากนี้เรายังมีตัวอย่างเดโมเพิ่มเติมสำหรับการแปลจากภาษาไทยเป็นภาษาอังกฤษในส่วนท้ายของบล็อก

สรุป

ผลลัพธ์เหล่านี้แสดงให่้เห็นว่าถึงแม้โมเดลจะมีขนาดเล็ก แต่เมื่อออกแบบมาให้ใช้สำหรับการทำงานบางอย่างที่เจาะจง ก็สามารถเอาชนะโมเดลขนาดใหญ่ที่ทำงานสารพัดประโยชน์ได้ อีกทั้งยังใช้ทรัพยากรน้อยกว่า

Typhoon Translate นับเป็นโมเดลที่จะเปิดประตูการใช้งานโมเดลขนาดเล็กที่รันเองบนเครื่องคอมส่วนบุคคลหรือในองค์กร โดยที่ไม่จำเป็นต้องมีทรัพยากรด้านการคำนวณที่มากมาย อีกทั้ง "การแปลภาษา" ยังเป็นงานที่มีโอกาสได้ใช้บ่อยในชีวิตประจำวันทั่วไป

ข้อจำกัดและงานในอนาคต

แน่นอนว่างานแปลเป็นเรื่องของคุณภาพและการเข้าถึงการสื่อสารอย่างแท้จริง หากเป็นงานที่สำคัญ เรายังคงแนะนำให้มีบุคคลที่คอยตรวจสอบคุณภาพ (เหมือนอย่างบทความนี้เองก็เช่นกัน) และเรายินดีรับ Feedback ในการปรับปรุงคุณภาพโมเดลนี้ต่อไป ติดต่อให้ Feedback กับเราได้ทาง Discord ของ Typhoon

Typhoon Translate ถูกฝึกด้วย context window ขนาด 8192 tokens สำหรับประสิทธิภาพที่ดีที่สุดและเพื่อให้คุณภาพการแปลสูงสุด เราแนะนำให้ข้อความอินพุตไม่เกินความยาวนี้ แม้ว่าความจุนี้จะเหมาะสมสำหรับเอกสารและกรณีการใช้งานทั่วไปจำนวนมาก แต่การแปลข้อความที่ยาวกว่า 8192 tokens ในการรันครั้งเดียวอาจไม่ให้ผลลัพธ์ที่ดีที่สุด เรากำลังค้นหาวิธีการปรับปรุงอย่างต่อเนื่อง รวมถึงรูปแบบการแปลและบริบทในรุ่นต่อไปของโมเดล

ทดลองใช้งาน Typhoon Translate วันนี้

โหลด Typhoon Translate มาใช้บนอุปกรณ์ของคุณได้เลย สามารถโหลดได้ที่:

  • Ollama

ไม่เคยใช้ Ollama มาก่อน? ลองอ่านคู่มือสอนการติดตั้งและใช้ Ollama รันโมเดลบนเครื่องของคุณเอง.

  • Hugging Face

คอลเลคชันของ Typhoon Translate บน Hugging Face รองรับหลากหลายฟอร์แมตและการนำไปใช้

  1. Transformers
  • เป็นรูปแบบ PyTorch มาตรฐาน เหมาะสำหรับการนำไปเทรนต่อ fine-tune หรือใช้ร่วมกับ Hugging Face pipelines
  1. GGUF
  • เป็นเวอร์ชัน Quantized ที่ใช้งานบน CPU/GPU ได้อย่างเต็มประสิทธิภาพ
  • ใช้งานได้กับเครื่องมืออย่างเช่น llama.cpp, llamafile และ text-generation-webui
  • เหมาะสำหรับใช้บนเครื่องโลคอลได้กับหลากหลายแพลตฟอร์ม
  1. MLX
  • เป็นเวอร์ชันที่ทำเพื่อให้ใช้กับ Apple Silicon (M1/M2/M3) ได้อย่างเต็มประสิทธิภาพ

ภาคผนวก

ตัวอย่างการแปลจากภาษาอังกฤษเป็นภาษาไทย (ข้อความเต็มจากตัวอย่างเดโมในเนื้อหาหลัก)

ตัวอย่าง 2: เอกสารมืออาชีพที่มีคำศัพท์ภาษาอังกฤษปะปน

Input:

At the end of 2022, OpenAI’s launch of ChatGPT marked a defining moment— the world was introduced to Generative AI (Gen AI), and everything changed. 

What once felt like a distant frontier suddenly became a present-day force.  AI rapidly embedded itself into both personal routines and enterprise strategies,  emerging as a powerful game-changer—streamlining lives, unlocking new efficiencies, and transforming how organizations operate. 

In pursuit of competitive advantage, businesses across sectors are now racing to understand, adopt, and innovate with AI. 

SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence is designed to be a lighthouse amid this accelerating wave—offering clarity and direction as leaders navigate the rising tides of technological disruption. This report explores the defining AI trends shaping the year ahead and provides a strategic lens for turning uncertainty into opportunity. 

The report is divided into four acts, each highlighting a major force reshaping  the AI landscape: 

ACT I: Two Philosophies, One Future. The Battle Between Open-Source and Closed-Source AI Intensifies 

ACT II: Tiny Titans - Small, but Mighty. More Versatile, Smaller, and Smarter: 3 Trends of the Next AI Evolution 

ACT III: AI at Your Fingertips. Agentic AI: Rise of the Agents ACT IV: Not Quite Human, But Almost There. Artificial General Intelligence (AGI) and the Unresolved Path to Human-Level AI 

The report concludes with an EPILOGUE: The AI Storm – Infinite Impact. Case Studies from Inside the Eye of the Typhoon—featuring real-world case studies from SCBX’s  use of the “Typhoon” the group’s AI Engine across various business units. 

As the AI currensurges forward, this report aims to serve not just as a forecast— but as a strategic beacon for those ready to ride the wave and lead
At the end of 2022, OpenAI’s launch of ChatGPT marked a defining moment— the world was introduced to Generative AI (Gen AI), and everything changed. 

What once felt like a distant frontier suddenly became a present-day force.  AI rapidly embedded itself into both personal routines and enterprise strategies,  emerging as a powerful game-changer—streamlining lives, unlocking new efficiencies, and transforming how organizations operate. 

In pursuit of competitive advantage, businesses across sectors are now racing to understand, adopt, and innovate with AI. 

SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence is designed to be a lighthouse amid this accelerating wave—offering clarity and direction as leaders navigate the rising tides of technological disruption. This report explores the defining AI trends shaping the year ahead and provides a strategic lens for turning uncertainty into opportunity. 

The report is divided into four acts, each highlighting a major force reshaping  the AI landscape: 

ACT I: Two Philosophies, One Future. The Battle Between Open-Source and Closed-Source AI Intensifies 

ACT II: Tiny Titans - Small, but Mighty. More Versatile, Smaller, and Smarter: 3 Trends of the Next AI Evolution 

ACT III: AI at Your Fingertips. Agentic AI: Rise of the Agents ACT IV: Not Quite Human, But Almost There. Artificial General Intelligence (AGI) and the Unresolved Path to Human-Level AI 

The report concludes with an EPILOGUE: The AI Storm – Infinite Impact. Case Studies from Inside the Eye of the Typhoon—featuring real-world case studies from SCBX’s  use of the “Typhoon” the group’s AI Engine across various business units. 

As the AI currensurges forward, this report aims to serve not just as a forecast— but as a strategic beacon for those ready to ride the wave and lead
plaintext

GPT4o:

เมื่อสิ้นปี 2022 การเปิดตัว ChatGPT ของ OpenAI ได้สร้างช่วงเวลาสำคัญ—โลกได้รู้จักกับ Generative AI (Gen AI) และทุกอย่างก็เปลี่ยนไป สิ่งที่เคยรู้สึกว่าเป็นขอบเขตที่ห่างไกลกลับกลายเป็นพลังที่มีอยู่ในปัจจุบัน AI ได้ฝังตัวอย่างรวดเร็วในทั้งกิจวัตรส่วนตัวและกลยุทธ์องค์กร กลายเป็นผู้เปลี่ยนเกมที่ทรงพลัง—ทำให้ชีวิตง่ายขึ้น ปลดล็อกประสิทธิภาพใหม่ ๆ และเปลี่ยนแปลงวิธีการดำเนินงานขององค์กร ในการแสวงหาความได้เปรียบทางการแข่งขัน ธุรกิจในทุกภาคส่วนกำลังเร่งทำความเข้าใจ นำไปใช้ และนวัตกรรมด้วย AI 

SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence ถูกออกแบบมาให้เป็นประภาคารท่ามกลางคลื่นที่เร่งตัวนี้—เสนอความชัดเจนและทิศทางเมื่อผู้นำต้องเผชิญกับกระแสการเปลี่ยนแปลงทางเทคโนโลยี รายงานนี้สำรวจแนวโน้ม AI ที่กำหนดทิศทางของปีข้างหน้าและให้มุมมองเชิงกลยุทธ์ในการเปลี่ยนความไม่แน่นอนให้เป็นโอกาส รายงานแบ่งออกเป็นสี่บท แต่ละบทเน้นพลังสำคัญที่กำลังเปลี่ยนแปลงภูมิทัศน์ AI: 

บทที่ 1: สองปรัชญา หนึ่งอนาคต การต่อสู้ระหว่าง AI แบบเปิดและปิดเข้มข้นขึ้น บทที่ 2: ไททันเล็ก ๆ - เล็กแต่ทรงพลัง อเนกประสงค์กว่า เล็กกว่า และฉลาดกว่า: 3 แนวโน้มของวิวัฒนาการ AI ถัดไป บทที่ 3: AI ที่ปลายนิ้วของคุณ Agentic AI: การขึ้นของตัวแทน บทที่ 4: ไม่ค่อยเป็นมนุษย์ แต่เกือบจะถึงแล้ว ปัญญาประดิษฐ์ทั่วไป (AGI) และเส้นทางที่ยังไม่ชัดเจนสู่ AI ระดับมนุษย์ 

รายงานสรุปด้วยบทส่งท้าย: พายุ AI – ผลกระทบไม่สิ้นสุด กรณีศึกษาจากภายในตาพายุ—นำเสนอกรณีศึกษาจริงจากการใช้ “Typhoon” เครื่องยนต์ AI ของกลุ่ม SCBX ในหน่วยธุรกิจต่าง ๆ เมื่อกระแส AI ก้าวไปข้างหน้า รายงานนี้มีเป้าหมายที่จะไม่เพียงแค่เป็นการพยากรณ์—แต่เป็นประภาคารเชิงกลยุทธ์สำหรับผู้ที่พร้อมจะขี่คลื่นและเป็นผู้นำ
เมื่อสิ้นปี 2022 การเปิดตัว ChatGPT ของ OpenAI ได้สร้างช่วงเวลาสำคัญ—โลกได้รู้จักกับ Generative AI (Gen AI) และทุกอย่างก็เปลี่ยนไป สิ่งที่เคยรู้สึกว่าเป็นขอบเขตที่ห่างไกลกลับกลายเป็นพลังที่มีอยู่ในปัจจุบัน AI ได้ฝังตัวอย่างรวดเร็วในทั้งกิจวัตรส่วนตัวและกลยุทธ์องค์กร กลายเป็นผู้เปลี่ยนเกมที่ทรงพลัง—ทำให้ชีวิตง่ายขึ้น ปลดล็อกประสิทธิภาพใหม่ ๆ และเปลี่ยนแปลงวิธีการดำเนินงานขององค์กร ในการแสวงหาความได้เปรียบทางการแข่งขัน ธุรกิจในทุกภาคส่วนกำลังเร่งทำความเข้าใจ นำไปใช้ และนวัตกรรมด้วย AI 

SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence ถูกออกแบบมาให้เป็นประภาคารท่ามกลางคลื่นที่เร่งตัวนี้—เสนอความชัดเจนและทิศทางเมื่อผู้นำต้องเผชิญกับกระแสการเปลี่ยนแปลงทางเทคโนโลยี รายงานนี้สำรวจแนวโน้ม AI ที่กำหนดทิศทางของปีข้างหน้าและให้มุมมองเชิงกลยุทธ์ในการเปลี่ยนความไม่แน่นอนให้เป็นโอกาส รายงานแบ่งออกเป็นสี่บท แต่ละบทเน้นพลังสำคัญที่กำลังเปลี่ยนแปลงภูมิทัศน์ AI: 

บทที่ 1: สองปรัชญา หนึ่งอนาคต การต่อสู้ระหว่าง AI แบบเปิดและปิดเข้มข้นขึ้น บทที่ 2: ไททันเล็ก ๆ - เล็กแต่ทรงพลัง อเนกประสงค์กว่า เล็กกว่า และฉลาดกว่า: 3 แนวโน้มของวิวัฒนาการ AI ถัดไป บทที่ 3: AI ที่ปลายนิ้วของคุณ Agentic AI: การขึ้นของตัวแทน บทที่ 4: ไม่ค่อยเป็นมนุษย์ แต่เกือบจะถึงแล้ว ปัญญาประดิษฐ์ทั่วไป (AGI) และเส้นทางที่ยังไม่ชัดเจนสู่ AI ระดับมนุษย์ 

รายงานสรุปด้วยบทส่งท้าย: พายุ AI – ผลกระทบไม่สิ้นสุด กรณีศึกษาจากภายในตาพายุ—นำเสนอกรณีศึกษาจริงจากการใช้ “Typhoon” เครื่องยนต์ AI ของกลุ่ม SCBX ในหน่วยธุรกิจต่าง ๆ เมื่อกระแส AI ก้าวไปข้างหน้า รายงานนี้มีเป้าหมายที่จะไม่เพียงแค่เป็นการพยากรณ์—แต่เป็นประภาคารเชิงกลยุทธ์สำหรับผู้ที่พร้อมจะขี่คลื่นและเป็นผู้นำ
plaintext

Typhoon Translate:

เมื่อสิ้นปี 2022 การเปิดตัว ChatGPT ของ OpenAI ถือเป็นจุดเปลี่ยนสำคัญ—โลกได้รู้จักกับ Generative AI (Gen AI) และทุกอย่างก็เปลี่ยนไป สิ่งที่เคยรู้สึกเหมือน frontier ไกลๆ กลายเป็นพลังในปัจจุบัน AI ถูกฝังตัวอย่างรวดเร็วทั้งในกิจวัตรส่วนตัวและกลยุทธ์องค์กร กลายเป็นตัวเปลี่ยนเกมอันทรงพลัง—ช่วยยกระดับชีวิต ปลดล็อกประสิทธิภาพใหม่ๆ และเปลี่ยนวิธีที่องค์กรดำเนินงาน ในการแสวงหาความได้เปรียบเชิงแข่งขัน ธุรกิจในหลากหลายภาคส่วนต่างเร่งทำความเข้าใจ นำไปใช้ และสร้างนวัตกรรมด้วย AI

SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence ถูกออกแบบมาเป็นประภาคารท่ามกลางคลื่นที่เร่งตัวขึ้นนี้—มอบความชัดเจนและทิศทางให้ผู้นำรับมือกับกระแสการเปลี่ยนแปลงทางเทคโนโลยี รายงานนี้สำรวจแนวโน้ม AI ที่กำลังกำหนดทิศทางในปีข้างหน้า และนำเสนอมุมมองเชิงกลยุทธ์ในการเปลี่ยนความไม่แน่นอนให้เป็นโอกาส รายงานแบ่งออกเป็นสี่ส่วน (Acts) แต่ละส่วนเน้นพลังสำคัญที่กำลังเปลี่ยนภูมิทัศน์ AI:

ACT I: Two Philosophies, One Future. The Battle Between Open-Source and Closed-Source AI Intensifies
ACT II: Tiny Titans - Small, but Mighty. More Versatile, Smaller, and Smarter: 3 Trends of the Next AI Evolution
ACT III: AI at Your Fingertips. Agentic AI: Rise of the Agents
ACT IV: Not Quite Human, But Almost There. Artificial General Intelligence (AGI) and the Unresolved Path to Human-Level AI

รายงานปิดท้ายด้วย EPILOGUE: The AI Storm – Infinite Impact พร้อม Case Studies จากภายในดวงตาของพายุไต้ฝุ่น—นำเสนอกรณีศึกษาจริงจาก SCBX ในการใช้ AI Engine “Typhoon” ของกลุ่มในหน่วยธุรกิจต่างๆ ขณะที่กระแส AI กำลังก้าวไปข้างหน้า รายงานนี้จึงไม่ได้เป็นเพียงการคาดการณ์ แต่เป็นประภาคารเชิงกลยุทธ์สำหรับผู้พร้อมจะก้าวขึ้นไปกับคลื่นและเป็นผู้นำในอนาคต
เมื่อสิ้นปี 2022 การเปิดตัว ChatGPT ของ OpenAI ถือเป็นจุดเปลี่ยนสำคัญ—โลกได้รู้จักกับ Generative AI (Gen AI) และทุกอย่างก็เปลี่ยนไป สิ่งที่เคยรู้สึกเหมือน frontier ไกลๆ กลายเป็นพลังในปัจจุบัน AI ถูกฝังตัวอย่างรวดเร็วทั้งในกิจวัตรส่วนตัวและกลยุทธ์องค์กร กลายเป็นตัวเปลี่ยนเกมอันทรงพลัง—ช่วยยกระดับชีวิต ปลดล็อกประสิทธิภาพใหม่ๆ และเปลี่ยนวิธีที่องค์กรดำเนินงาน ในการแสวงหาความได้เปรียบเชิงแข่งขัน ธุรกิจในหลากหลายภาคส่วนต่างเร่งทำความเข้าใจ นำไปใช้ และสร้างนวัตกรรมด้วย AI

SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence ถูกออกแบบมาเป็นประภาคารท่ามกลางคลื่นที่เร่งตัวขึ้นนี้—มอบความชัดเจนและทิศทางให้ผู้นำรับมือกับกระแสการเปลี่ยนแปลงทางเทคโนโลยี รายงานนี้สำรวจแนวโน้ม AI ที่กำลังกำหนดทิศทางในปีข้างหน้า และนำเสนอมุมมองเชิงกลยุทธ์ในการเปลี่ยนความไม่แน่นอนให้เป็นโอกาส รายงานแบ่งออกเป็นสี่ส่วน (Acts) แต่ละส่วนเน้นพลังสำคัญที่กำลังเปลี่ยนภูมิทัศน์ AI:

ACT I: Two Philosophies, One Future. The Battle Between Open-Source and Closed-Source AI Intensifies
ACT II: Tiny Titans - Small, but Mighty. More Versatile, Smaller, and Smarter: 3 Trends of the Next AI Evolution
ACT III: AI at Your Fingertips. Agentic AI: Rise of the Agents
ACT IV: Not Quite Human, But Almost There. Artificial General Intelligence (AGI) and the Unresolved Path to Human-Level AI

รายงานปิดท้ายด้วย EPILOGUE: The AI Storm – Infinite Impact พร้อม Case Studies จากภายในดวงตาของพายุไต้ฝุ่น—นำเสนอกรณีศึกษาจริงจาก SCBX ในการใช้ AI Engine “Typhoon” ของกลุ่มในหน่วยธุรกิจต่างๆ ขณะที่กระแส AI กำลังก้าวไปข้างหน้า รายงานนี้จึงไม่ได้เป็นเพียงการคาดการณ์ แต่เป็นประภาคารเชิงกลยุทธ์สำหรับผู้พร้อมจะก้าวขึ้นไปกับคลื่นและเป็นผู้นำในอนาคต
plaintext

ตัวอย่าง 3: รายงานเชิงเทคนิค

Input:

To continue our commitment in advancing Thai foundation models, this work introduces a new series of state-of-the-art Thai language and multimodal models, Typhoon2. Following our previous releases, these models are optimized for Thai and English, building on open-source models such as Llama 3 and Qwen2.5. 

The text models, Typhoon2-Text, are improved over Typhoon 1.5 in various aspects, including data filtering techniques for pretraining, complex instruction data development for improved post-training, long context, and function calling capabilities of the models. 

These text models are also now available in a range of sizes, consisting of 1B, 3B, 7B, 8B, and 70B parameters. We offer both pre-trained and instruction-tuned variants for each size. 

In addition, we introduce Typhoon2-Safety a safety text classifier designed to detect Thai-sensitive content and enhance the security of LM-integrated systems. Furthermore, the Typhoon2 series is multimodal. 

The vision model, Typhoon2-Vision, builds on the first Typhoon-Vision model by enhancing Thai document understanding capabilities, such as optical character recognition (OCR). 

The audio model, Typhoon2-Audio, extends the first Typhoon-Audio model, evolving into an end-to-end speech processing and generation model capable of understanding audio, speech, and text, while generating text and speech outputs in parallel. 

This report provides details and insights from our development. We make the weights of all models publicly available on Hugging Face Hub where the summary of our release is shown in Table 1.
To continue our commitment in advancing Thai foundation models, this work introduces a new series of state-of-the-art Thai language and multimodal models, Typhoon2. Following our previous releases, these models are optimized for Thai and English, building on open-source models such as Llama 3 and Qwen2.5. 

The text models, Typhoon2-Text, are improved over Typhoon 1.5 in various aspects, including data filtering techniques for pretraining, complex instruction data development for improved post-training, long context, and function calling capabilities of the models. 

These text models are also now available in a range of sizes, consisting of 1B, 3B, 7B, 8B, and 70B parameters. We offer both pre-trained and instruction-tuned variants for each size. 

In addition, we introduce Typhoon2-Safety a safety text classifier designed to detect Thai-sensitive content and enhance the security of LM-integrated systems. Furthermore, the Typhoon2 series is multimodal. 

The vision model, Typhoon2-Vision, builds on the first Typhoon-Vision model by enhancing Thai document understanding capabilities, such as optical character recognition (OCR). 

The audio model, Typhoon2-Audio, extends the first Typhoon-Audio model, evolving into an end-to-end speech processing and generation model capable of understanding audio, speech, and text, while generating text and speech outputs in parallel. 

This report provides details and insights from our development. We make the weights of all models publicly available on Hugging Face Hub where the summary of our release is shown in Table 1.
plaintext

GPT4o:

เพื่อสานต่อความมุ่งมั่นในการพัฒนารูปแบบพื้นฐานของภาษาไทย งานนี้ได้แนะนำซีรีส์ใหม่ของโมเดลภาษาไทยและมัลติโหมดที่ทันสมัยที่สุด Typhoon2 ตามการเปิดตัวก่อนหน้านี้ โมเดลเหล่านี้ได้รับการปรับให้เหมาะสมสำหรับภาษาไทยและอังกฤษ โดยสร้างขึ้นจากโมเดลโอเพนซอร์ส เช่น Llama 3 และ Qwen2.5 

โมเดลข้อความ Typhoon2-Text ได้รับการพัฒนาให้ดียิ่งขึ้นจาก Typhoon 1.5 ในหลายด้าน รวมถึงเทคนิคการกรองข้อมูลสำหรับการฝึกอบรมเบื้องต้น การพัฒนาข้อมูลคำสั่งที่ซับซ้อนเพื่อปรับปรุงการฝึกอบรมหลังการฝึก ความสามารถในการจัดการบริบทยาว และการเรียกใช้ฟังก์ชัน โมเดลข้อความเหล่านี้มีให้เลือกในหลายขนาด ประกอบด้วย 1B, 3B, 7B, 8B และ 70B พารามิเตอร์ เรามีทั้งเวอร์ชันที่ฝึกอบรมล่วงหน้าและปรับแต่งคำสั่งสำหรับแต่ละขนาด 

นอกจากนี้ เรายังแนะนำ Typhoon2-Safety ซึ่งเป็นตัวจำแนกข้อความเพื่อความปลอดภัยที่ออกแบบมาเพื่อตรวจจับเนื้อหาที่ละเอียดอ่อนของไทยและเพิ่มความปลอดภัยของระบบที่รวม LM เข้าด้วยกัน 

นอกจากนี้ ซีรีส์ Typhoon2 ยังเป็นมัลติโหมด โมเดลวิชั่น Typhoon2-Vision ได้พัฒนาจากโมเดล Typhoon-Vision รุ่นแรกโดยเพิ่มความสามารถในการเข้าใจเอกสารภาษาไทย เช่น การรู้จำอักขระด้วยแสง (OCR) 

โมเดลเสียง Typhoon2-Audio ได้ขยายจากโมเดล Typhoon-Audio รุ่นแรก พัฒนาเป็นโมเดลการประมวลผลและสร้างเสียงแบบครบวงจรที่สามารถเข้าใจเสียง คำพูด และข้อความ พร้อมสร้างผลลัพธ์ข้อความและคำพูดไปพร้อมกัน 

รายงานนี้ให้รายละเอียดและข้อมูลเชิงลึกจากการพัฒนาของเรา เราเปิดเผยน้ำหนักของโมเดลทั้งหมดบน Hugging Face Hub ซึ่งสรุปการเปิดตัวของเราแสดงในตารางที่ 1
เพื่อสานต่อความมุ่งมั่นในการพัฒนารูปแบบพื้นฐานของภาษาไทย งานนี้ได้แนะนำซีรีส์ใหม่ของโมเดลภาษาไทยและมัลติโหมดที่ทันสมัยที่สุด Typhoon2 ตามการเปิดตัวก่อนหน้านี้ โมเดลเหล่านี้ได้รับการปรับให้เหมาะสมสำหรับภาษาไทยและอังกฤษ โดยสร้างขึ้นจากโมเดลโอเพนซอร์ส เช่น Llama 3 และ Qwen2.5 

โมเดลข้อความ Typhoon2-Text ได้รับการพัฒนาให้ดียิ่งขึ้นจาก Typhoon 1.5 ในหลายด้าน รวมถึงเทคนิคการกรองข้อมูลสำหรับการฝึกอบรมเบื้องต้น การพัฒนาข้อมูลคำสั่งที่ซับซ้อนเพื่อปรับปรุงการฝึกอบรมหลังการฝึก ความสามารถในการจัดการบริบทยาว และการเรียกใช้ฟังก์ชัน โมเดลข้อความเหล่านี้มีให้เลือกในหลายขนาด ประกอบด้วย 1B, 3B, 7B, 8B และ 70B พารามิเตอร์ เรามีทั้งเวอร์ชันที่ฝึกอบรมล่วงหน้าและปรับแต่งคำสั่งสำหรับแต่ละขนาด 

นอกจากนี้ เรายังแนะนำ Typhoon2-Safety ซึ่งเป็นตัวจำแนกข้อความเพื่อความปลอดภัยที่ออกแบบมาเพื่อตรวจจับเนื้อหาที่ละเอียดอ่อนของไทยและเพิ่มความปลอดภัยของระบบที่รวม LM เข้าด้วยกัน 

นอกจากนี้ ซีรีส์ Typhoon2 ยังเป็นมัลติโหมด โมเดลวิชั่น Typhoon2-Vision ได้พัฒนาจากโมเดล Typhoon-Vision รุ่นแรกโดยเพิ่มความสามารถในการเข้าใจเอกสารภาษาไทย เช่น การรู้จำอักขระด้วยแสง (OCR) 

โมเดลเสียง Typhoon2-Audio ได้ขยายจากโมเดล Typhoon-Audio รุ่นแรก พัฒนาเป็นโมเดลการประมวลผลและสร้างเสียงแบบครบวงจรที่สามารถเข้าใจเสียง คำพูด และข้อความ พร้อมสร้างผลลัพธ์ข้อความและคำพูดไปพร้อมกัน 

รายงานนี้ให้รายละเอียดและข้อมูลเชิงลึกจากการพัฒนาของเรา เราเปิดเผยน้ำหนักของโมเดลทั้งหมดบน Hugging Face Hub ซึ่งสรุปการเปิดตัวของเราแสดงในตารางที่ 1
plaintext

Typhoon Translate:

เพื่อสานต่อความมุ่งมั่นในการพัฒนาโมเดลภาษาไทยขั้นสูง ผลงานชิ้นนี้จึงนำเสนอชุดโมเดลภาษาไทยและโมเดลมัลติโมดัลรุ่นใหม่ชื่อ Typhoon2 ซึ่งต่อยอดจากโมเดลก่อนหน้าของเรา โมเดลเหล่านี้ได้รับการปรับแต่งให้เหมาะสมกับภาษาไทยและภาษาอังกฤษ โดยพัฒนาบนพื้นฐานของโมเดลโอเพนซอร์สอย่าง Llama 3 และ Qwen2.5 

โมเดลข้อความ Typhoon2-Text มีการพัฒนาขึ้นจาก Typhoon 1.5 ในหลายด้าน เช่น เทคนิคการกรองข้อมูลสำหรับการ pretraining, การพัฒนาข้อมูลคำสั่งที่ซับซ้อนเพื่อปรับปรุงประสิทธิภาพหลังการฝึกอบรม (post-training), ความสามารถในการจัดการ context ที่ยาวขึ้น และฟังก์ชัน calling ของโมเดล โมเดลข้อความเหล่านี้ยังมีให้เลือกในหลากหลายขนาด ได้แก่ 1B, 3B, 7B, 8B และ 70B พารามิเตอร์ เรามีทั้งเวอร์ชัน pre-trained และ instruction-tuned สำหรับแต่ละขนาด 

นอกจากนี้ เรายังแนะนำ Typhoon2-Safety ซึ่งเป็น safety text classifier ออกแบบมาเพื่อตรวจจับเนื้อหาที่ละเอียดอ่อนในภาษาไทย และเพิ่มความปลอดภัยให้กับระบบที่ผสานรวม LM 

นอกจากนี้ Typhoon2 ยังเป็นมัลติโมดัล โมเดลด้านภาพ Typhoon2-Vision ต่อยอดจากโมเดล Typhoon-Vision รุ่นแรก โดยเพิ่มความสามารถในการทำความเข้าใจเอกสารภาษาไทย เช่น optical character recognition (OCR) 

โมเดลด้านเสียง Typhoon2-Audio ขยายจากโมเดล Typhoon-Audio รุ่นแรก กลายเป็นโมเดล end-to-end speech processing และ speech generation ที่สามารถเข้าใจเสียง คำพูด และข้อความ พร้อมทั้งสร้างข้อความและเสียงเอาต์พุตแบบ parallel 

รายงานฉบับนี้ให้รายละเอียดและข้อมูลเชิงลึกจากการพัฒนาของเรา โดยเราได้เปิดเผย weights ของโมเดลทั้งหมดให้สาธารณชนเข้าถึงได้บน Hugging Face Hub ซึ่งสรุปข้อมูลการ release ของเราแสดงไว้ใน Table 1
เพื่อสานต่อความมุ่งมั่นในการพัฒนาโมเดลภาษาไทยขั้นสูง ผลงานชิ้นนี้จึงนำเสนอชุดโมเดลภาษาไทยและโมเดลมัลติโมดัลรุ่นใหม่ชื่อ Typhoon2 ซึ่งต่อยอดจากโมเดลก่อนหน้าของเรา โมเดลเหล่านี้ได้รับการปรับแต่งให้เหมาะสมกับภาษาไทยและภาษาอังกฤษ โดยพัฒนาบนพื้นฐานของโมเดลโอเพนซอร์สอย่าง Llama 3 และ Qwen2.5 

โมเดลข้อความ Typhoon2-Text มีการพัฒนาขึ้นจาก Typhoon 1.5 ในหลายด้าน เช่น เทคนิคการกรองข้อมูลสำหรับการ pretraining, การพัฒนาข้อมูลคำสั่งที่ซับซ้อนเพื่อปรับปรุงประสิทธิภาพหลังการฝึกอบรม (post-training), ความสามารถในการจัดการ context ที่ยาวขึ้น และฟังก์ชัน calling ของโมเดล โมเดลข้อความเหล่านี้ยังมีให้เลือกในหลากหลายขนาด ได้แก่ 1B, 3B, 7B, 8B และ 70B พารามิเตอร์ เรามีทั้งเวอร์ชัน pre-trained และ instruction-tuned สำหรับแต่ละขนาด 

นอกจากนี้ เรายังแนะนำ Typhoon2-Safety ซึ่งเป็น safety text classifier ออกแบบมาเพื่อตรวจจับเนื้อหาที่ละเอียดอ่อนในภาษาไทย และเพิ่มความปลอดภัยให้กับระบบที่ผสานรวม LM 

นอกจากนี้ Typhoon2 ยังเป็นมัลติโมดัล โมเดลด้านภาพ Typhoon2-Vision ต่อยอดจากโมเดล Typhoon-Vision รุ่นแรก โดยเพิ่มความสามารถในการทำความเข้าใจเอกสารภาษาไทย เช่น optical character recognition (OCR) 

โมเดลด้านเสียง Typhoon2-Audio ขยายจากโมเดล Typhoon-Audio รุ่นแรก กลายเป็นโมเดล end-to-end speech processing และ speech generation ที่สามารถเข้าใจเสียง คำพูด และข้อความ พร้อมทั้งสร้างข้อความและเสียงเอาต์พุตแบบ parallel 

รายงานฉบับนี้ให้รายละเอียดและข้อมูลเชิงลึกจากการพัฒนาของเรา โดยเราได้เปิดเผย weights ของโมเดลทั้งหมดให้สาธารณชนเข้าถึงได้บน Hugging Face Hub ซึ่งสรุปข้อมูลการ release ของเราแสดงไว้ใน Table 1
plaintext

ตัวอย่างการแปลจากภาษาไทยเป็นภาษาอังกฤษ

ตัวอย่าง 1: เนื้อหาวรรณกรรม

The result from Typhoon Translate and GPT-4o are similar in this example.

translate-TH-EN-demo1

ตัวอย่าง 2: เอกสารมืออาชีพที่มีคำศัพท์ภาษาอังกฤษปะปน

translate-TH-EN-demo2

ตัวอย่าง 3: รายงานเชิงเทคนิค

translate-TH-EN-demo3

Previous
งานวิจัยของ Typhoon ได้รับการตอบรับจาก Interspeech 2025: ยกระดับโมเดลภาษาเสียงสำหรับภาษาทรัพยากรต่ำและความสามารถในการทำตามคำสั่งเสียง

งานวิจัยของ Typhoon ได้รับการตอบรับจาก Interspeech 2025: ยกระดับโมเดลภาษาเสียงสำหรับภาษาทรัพยากรต่ำและความสามารถในการทำตามคำสั่งเสียง

© 2025 SCB 10X Co., Ltd.. All rights reserved