Typhoon Logo
TYPHOON
2025 ปีแห่งการเติบโตของ Typhoon

2025 ปีแห่งการเติบโตของ Typhoon

Typhoon

สรุปเส้นทางการพัฒนาของ Typhoon ตลอดทั้งปี ทั้งโมเดล งานวิจัย แพลตฟอร์ม คอนเทนต์และคอมมูนิตี้

Oravee (Orn) Smithiphol

Oravee (Orn) Smithiphol

24 ธันวาคม 2568

2025 ปีแห่งการเติบโตของ Typhoon

ปีนี้ทีมของเราได้ลงมือทำกันมาหลากหลายเรื่อง ตั้งแต่การพัฒนาและนำเสนอโมเดลใหม่ๆ การเผยแพร่งานวิจัยในงานประชุมชั้นแนวหน้าที่ได้รับการยอมรับในสากล การฟูมฟักคอมมูนิตี้โอเพนซอร์ส รวมไปถึงการเผยแพร่ความรู้และพัฒนาความร่วมมือต่างๆ เพื่อให้ผู้ใช้เข้าถึง Typhoon ได้ง่ายขึ้น

เผลอแปบเดียวก็เดินทางกันมาจนถึงสิ้นปีแล้ว พวกเราทีม Typhoon มีโอกาสได้มองย้อนกลับไปถึงเส้นทางตลอดทั้งปีนี้และพูดได้ว่าเป็นปีที่พิเศษมากของเรา แน่นอนว่าหลายสิ่งเหล่านี้เราไม่สามารถทำได้เพียงลำพังหากปราศจากความร่วมมือจากพาร์ทเนอร์และแรงสนับสนุนจากผู้ใช้งาน

เราจึงอยากเขียนและนำเสนอบทความนี้เพื่อให้ทั้งทีมและผู้สนับสนุนทุกคนได้ร่วมกันมองย้อนถึงผลงานตลอดทั้งปีที่ผ่านมา หวังว่าปีนี้จะเป็นอีกปีที่ทุกคนภาคภูมิใจและเตรียมพร้อมต่อการเริ่มต้นปีใหม่อย่างสดใส

ไฮไลต์ภาพรวมในปี 2025

ปีนี้เป็นปีที่เราทำหลายเรื่องอย่างจริงจังมากขึ้น เรายังจริงจังกับการทำงานวิจัยซึ่งเป็นจุดยืดตั้งต้นและเป็นจุดยืนเสมอมาในฐานะทีม R&D เราได้มีการปล่อยโมเดลออกมาหลายตัว รวมถึงสนับสนุนให้เกิดการนำมาใช้จริงที่มีความหลากหลายมากขึ้น สิ่งที่เราทำมาทั้งหมดในปีนี้สามารถสรุปเป็นตัวเลขภาพใหญ่ได้ดังนี้

  • ปล่อยโมเดลใหม่ ทั้งหมด 14 ผลงาน

    ประกอบไปด้วยโมเดลใหม่ 12 โมเดล ครอบคลุมตั้งแต่โมเดลข้อความ โมเดลการให้เหตุผล โมเดลเสียง โมเดลที่ทำงานกับภาพและเอกสาร โดยมีสองโมเดลที่ได้รับการอัปเดตใหญ่ไป 2 ครั้ง รวมเป็นการอัปเดตทั้งหมด 14 ครั้งหรือผลงาน

  • เปเปอร์ผลงานวิจัยที่ได้รับการตอบรับให้นำเสนอที่งานประชุม ทั้งหมด 14 ผลงาน

    เปเปอร์ที่ได้รับการตอบรับในงานประชุมสาย AI ระดับโลก ไม่ว่าจะเป็น ICLR, ACL, EMNLP, Interspeech และ IJCNLP–AACL ทั้งหมด 14 ผลงานโดยที่มีทั้งอันที่เราเป็นผู้เขียนหลักหรือผู้เขียนร่วม ยังไม่นับผลงานที่เป็น Technical Reports ที่ยังไม่ได้ส่งไปงานประชุมอีกจำนวนหนึ่ง

  • อีเวนต์เพื่อสนับสนุนระบบนิเวศ AI ไทย ทั้งหมด 7 งาน

    ปีนี้ Typhoon เราเป็นเจ้าภาพจัดงานหรือร่วมจัดงานทั้งหมด 7 งาน (ไม่นับงานอื่นๆ ของ SCB 10X และ SCBX Group) โดยงานที่ Typhoon จัดจะเน้นที่นักพัฒนาและวงโอเพนซอร์สมากกว่า

    นอกจากนี้เรายังได้เข้าร่วมบรรยายในงานต่างๆ มากกว่า 20 งาน ตั้งแต่งานด้านการศึกษา งานในวงการธุรกิจและอุตสาหกรรม และงานสำหรับนักพัฒนาต่างๆ ทั้งในไทยและต่างประเทศ

  • เผยแพร่คอนเทนต์ความรู้และกรณีศึกษาต่างๆ มากกว่า 30 หัวข้อ

    ปีนี้เราปรับปรุงเว็บไซต์และจัดทำบล็อกสองภาษา ซึ่งมีการเผยแพร่คอนเทนต์ใหม่ๆ มากกว่า 30 หัวข้อและหากไม่นับเรื่องข่าวสารด้านโมเดลใหม่ ก็นับรวมได้มากกว่า 20 หัวข้อที่เป็นหัวข้อความรู้แบบเจาะลึก ตั้งแต่ Tutorials แบบลงมือทำ คำแนะนำ (Best Practices) และกรณีศึกษาจากทีมต่างๆ ที่ใช้ Typhoon จริง

  • การเข้าถึงแพลตฟอร์มและคอนเทนต์ของเว็บไซต์

    ในปีนี้เรามียอดผู้เข้าชมเว็บไซต์ใหม่ราว 60,000 คนที่ได้เข้ามาอ่านบล็อกความรู้ อ่านรายละเอียดเกี่ยวกับโมเดล คู่มือการพัฒนา หรืองานวิจัยที่เรามี

  • คอมมูนิตี้

    สมาชิกในกลุ่ม Discord ซึ่งเป็นกลุ่มคอมมูนิตี้หลักของเรา เติบโตขึ้นสามเท่า จากราว 400 คนสะสมในช่วงปี 2023-2024 สู่สมาชิกกว่า 1,300 คนในสิ้นปี 2025

  • ยอดการใช้งาน API (ฟรี)

    ตลอดทั้งปีที่เรามีการเปิดให้บริการ API ในการเข้าถึงโมเดลของเราได้ฟรี มียอดการเรียกใช้งานทั้งหมดราว 14 ล้านการใช้งาน คิดเป็นปริมาณราว 320 ล้านโทเคน

  • ยอดดาวน์โหลดโมเดล

    ยอดดาวน์โหลดโมเดลผ่านแพลตฟอร์ม Hugging Face เติบโตขึ้นจากตัวเลขสะสมที่ 330,000 ดาวน์โหลด สู่ 6,000,000 ดาวน์โหลด ทำให้ Typhoon เป็นโมเดล Open-Source ภาษาไทยที่มียอดดาวน์โหลดสูงที่สุด


ย้อนดูผลงานต่างๆ ในปี 2025 กันอีกครั้ง

ปีแห่งการทดลองโมเดลใหม่ๆ

ปีนี้เราพัฒนาโมเดลทั้งหมด 12 โมเดล หรือหากนับจำนวนครั้งที่อัปเดตคือคิดเป็น 14 ครั้ง ครอบคลุมตั้งแต่โมเดลข้อความ โมเดลการให้เหตุผล โมเดลที่ทำงานกับภาพและเอกสาร โมเดลเสียงที่รองรับภาษาไทยกลางและภาษาถิ่น ทั้งหมดนี้คือรายชื่อโมเดลในปีนี้เรียงตามลำดับการเปิดตัว

  1. Typhoon 2

    เปิดตัวในเดือนมกราคม Typhoon 2 เป็นโมเดลข้อความที่อัปเกรดความสามารถให้สูงขึ้นกว่า Typhoon 1 และ Typhoon 1.5 ที่เปิดตัวในปีก่อนหน้า รวมทั้งยังมีหลายขนาดให้เลือกใช้ ตั้งแต่ 1B, 3B, 8B ไปจนถึง 70B
    อ่านเพิ่มเติม

  2. Typhoon 2 Audio (Research Preview)

    เปิดตัวในเดือนมกราคมและถือเป็นการเปิดตัวโมเดลแบบ Multimodal ครั้งแรก โมเดล Typhoon 2 Audio นี้เป็นโมเดลที่ประมวลผลเสียงและข้อความแบบ End-to-End สำหรับใช้ทำงานที่เกี่ยวข้องกับเสียงแบบสารพัดประโยชน์ ไม่ว่าจะเป็น การถอดเสียงเป็นข้อความ การแปลงข้อความเป็นเสียง การแปลภาษา การถามตอบเกี่ยวกับไฟล์เสียง โดยเป็นโมเดลแบบ Research Preview ที่ยังไม่ได้เน้นให้ใช้งานจริงแต่ไว้ศึกษาความเป็นไปได้ในการพัฒนาต่อ
    อ่านเพิ่มเติม

  3. Typhoon 2 Vision (Research Preview)

    เปิดตัวในเดือนมกราคมและถือเป็นการเปิดตัวโมเดลแบบ Multimodal ครั้งแรกโดยเปิดตัวพร้อมกันกับโมเดล Typhoon 2 Audio
    โมเดล Typhoon 2 Vision เป็นโมเดลที่ทำงานกับไฟล์รูปภาพ สามารถใช้งานได้แบบหลากหลาย เช่น ถอดข้อความจากไฟล์ภาพเอกสาร (OCR) และถามตอบเกี่ยวกับไฟล์รูป เป็นต้น โดยเป็นโมเดลแบบ Research Preview ที่ยังไม่ได้เน้นให้ใช้งานจริงแต่ไว้ศึกษาความเป็นไปได้ในการพัฒนาต่อ
    อ่านเพิ่มเติม

  4. Typhoon T1 (Research Preview)

    เปิดตัวในเดือนมกราคม Typhoon T1 เป็นโมเดลการให้เหตุผล (Reasoning) โมเดลแรกของ Typhoon รวมถึงยังเป็นโมเดลด้านการให้เหตุผลแบบโอเพนซอร์สโมเดลแรกของภูมิภาคเอเชียตะวันออกเฉียงใต้
    อ่านเพิ่มเติม

  5. Typhoon 2 R1

    โมเดลการให้เหตุผลขนาด 70B ที่มาการทำ Model Merging ระหว่าง Typhoon 2 70B และ DeepSeek R1 เปิดตัวในเดือนมีนาคม
    อ่านเพิ่มเติม

  6. Typhoon 2.1 Gemma

    โมเดลข้อความรุ่นใหม่ที่ความสามารถใกล้เคียง Typhoon 2 70B ในขนาดที่เล็กกว่าเพียง 12B และออปชันเล็กอย่าง 4B ให้เลือกใช้ มาพร้อมกับ Thinking mode ที่เลือกเปิดปิดได้ เปิดตัวในเดือนพฤษภาคม
    อ่านเพิ่มเติม

  7. Typhoon OCR 1.0 (เปิดตัวในเดือนพฤษภาคม) และรุ่น 1.5 (อัปเดตใหม่ในเดือนพฤศจิกายน)

    หลังจากที่ได้ทดลองทำ Typhoon 2 Vision โมเดลทำงานกับรูปภาพไป ทีมมองเห็นโอกาสในการทำโมเดลที่มีหน้าที่เจาะจงชัดเจนไปเลยและมีความต้องการในการใช้งานสูง นั่นคือการทำ OCR
    ด้วยความต้องการที่มีอยู่มากและจุดอ่อนด้านเอกสารภาษาไทยที่หลายโมเดลยังมี โมเดลนี้เป็นโมเดลที่ได้รับผลการตอบรับเป็นอย่างดีตั้งแต่วันแรกที่เปิดตัวทั้งในด้านความแม่นยำและจุดเด่นเรื่องโอเพนซอร์ส นำมาสู่การพัฒนารุ่นต่อยอดที่มีขนาดที่เล็กลงและส่งเสริมให้ทุกคนสามารถโฮสต์และใช้งานกันเองได้ง่ายยิ่งขึ้น
    อ่านเพิ่มเติม

  8. Typhoon Translate 1.0 (เปิดตัวในเดือนมิถุนายน) และรุ่น 1.5 (อัปเดตใหม่ในเดือนพฤศจิกายน)

    โมเดลสำหรับทำหน้าที่แปลภาษาไทย-อังกฤษ โดยเฉพาะ เป็นโอเพนซอร์สขนาดเล็กจิ๋วรันบนเครื่องคอมพิวเตอร์ได้ รุ่น 1.5 อัปเกรดให้สามารถปรับแต่งคำสั่งได้
    อ่านเพิ่มเติม

  9. Typhoon ASR Real-time

    โมเดล Automatic Speech Recognition ที่ออกแบบมาให้เร็วและเบา ทำงานเรียลไทม์ได้และด้วยคุณภาพและต้นทุนการประมวลผลที่ออกแบบมาให้เหมาะกับงานโปรดักชันเป็นอย่างดี เปิดตัวในเดือนกันยายนที่ผ่านมา
    อ่านเพิ่มเติม

  10. Typhoon 2.5

    โมเดลข้อความรุ่นใหม่ที่เปิดตัวในเดือนตุลาคม มาพร้อมกับความสามารถที่ทำงานร่วมกับ Agentic workflow ได้ดีขึ้น ภาษาไทยเป็นธรรมชาติขึ้น และมีประสิทธิภาพที่คุ้มค่าต้นทุนในการรันยิ่งกว่าเดิม
    อ่านเพิ่มเติม

  11. Typhoon Isan ASR Real-time
    โมเดลถอดเสียงเป็นข้อความแบบเรียลไทม์ที่เป็นการนำโมเดล Typhoon ASR Real-time มาเทรนข้อมูลอีสานเพิ่มเติม ทำให้สามารถรองรับทั้งภาษาไทยกลางและภาษาอีสาน เปิดตัวในเดือนพฤศจิกายน
    อ่านเพิ่มเติม

  12. Typhoon Isan ASR Whisper

    โมเดล ASR ที่ใช้สถาปัตยกรรมแบบ Whisper เหมาะกับงานถอดเสียงแบบไม่เรียลไทม์และเน้นความแม่นยำที่สูงขึ้น สามารถรองรับทั้งภาษาไทยกลาง ภาษาอีสาน รวมถึงภาษาอังกฤษและภาษาอื่นๆ จากรากฐานความรู้เดิมของโมเดล Whisper
    อ่านเพิ่มเติม

ทั้ง 12 โมเดลนี้เปิดแบบโอเพนซอร์สทั้งหมดให้ทุกคนสามารถเข้าถึงได้ มีใครทันโมเดลไหนบ้าง? ได้ลองใช้กันครบแล้วหรือยังคะ :)


ชุดข้อมูล เกณฑ์มาตรฐาน ซอร์สโค้ด และทรัพยากรต่างๆ แบบโอเพนซอร์ส

นอกจากการปล่อยโมเดลแบบโอเพนซอร์สแล้ว เรายังได้เปิดชุดข้อมูลและคลังทรัพยากรต่างๆ อีกมากมายในปีนี้ เพื่อช่วยให้นักวิจัยและนักพัฒนาสามารถนำทรัพยากรเหล่านี้ไปใช้งานและพัฒนาต่อยอดกันได้ในหลากหลายรูปแบบ

  1. Typhoon Application Week

    รวบรวมตัวอย่าง 7 แอปพลิเคชันที่นำความสามารถของ Typhoon LLM มาใช้ มีตั้งแต่แอปเพื่อการวางแผนท่องเที่ยว แอปเกม และอื่นๆ อีกมากมาย พร้อมเปิดซอร์สโค้ดทั้งหมดใน GitHub ให้คุณสามารถนำไปใช้สร้างแอปจริงกันต่อได้ ฟรี ไม่มีลิขสิทธิ์

    ดูผลงานทั้งหมดได้ที่ apps.opentyphoon.ai

  2. Thai Social Values Dataset

    พัฒนาร่วมกันกับมหาวิทยาลัยสแตนฟอร์ด ชุดข้อมูลนี้ประกอบด้วยคำถามแบบสำรวจและคำตอบที่ออกแบบขึ้นเพื่อศึกษาทัศนคติและค่านิยมทางสังคมของประชาชนในประเทศไทยในปี 2025 เพื่อสนับสนุนการวิจัยด้านมุมมองทางสังคม ค่านิยม ทัศนคติทางวัฒนธรรม ตลอดจนการวิจัยด้านอัลกอริทึมผ่านการระดมข้อมูลจากผู้ใช้ (crowdsourcing)
    เข้าถึงชุดข้อมูล

  3. SeaCrowd-VL

    ชุดข้อมูลด้านภาพที่มุ่งเน้นบริบทของเอเชียตะวันออกเฉียงใต้ โดยมีเป้าหมายเพื่อยกระดับความสามารถในการทำความเข้าใจข้อมูลแบบมัลติโหมด (multimodal) ในบริบทของภูมิภาค
    ดูรายละเอียดเพิ่มเติม

  4. ThaiOCRBench

    ชุดเกณฑ์มาตรฐาน (benchmark) สำหรับการประเมินผล Tasks ด้าน VLLM ภาษาไทยครั้งแรก ออกแบบมาเพื่อสนับสนุนการประเมินผล OCR และการทำความเข้าใจเอกสารภาษาไทยในหลากหลายด้านให้มีความน่าเชื่อถือมากยิ่งขึ้น
    ดูรายละเอียดเพิ่มเติม

  5. n8n Template

    เทมเพลตพร้อมใช้งาน เพื่อช่วยให้ธุรกิจที่ต้องการสร้างเวิร์กโฟลว์มีตัวอย่างไว้ใช้อ้างอิงและต่อยอดได้ในบริบทของตัวเอง
    ลิงก์เทมเพลต, บล็อกโพสต์

  6. Typhoon Isan Speech Corpus

    ชุดข้อมูลเสียงและข้อความถอดเสียงภาษาอีสาน พร้อมงานวิจัยด้านภาษาศาสตร์สำหรับวงการ NLP ภาษาอีสาน
    ดูรายละเอียดเพิ่มเติม


การพัฒนาแพลตฟอร์มและพันธมิตรด้านโครงสร้างพื้นฐาน

แม้เราจะมีโมเดลแบบโอเพนซอร์สผ่าน Hugging Face แต่ผู้ใช้บริการส่วนมากก็ต้องการแพลตฟอร์มอื่นๆ หรือโครงสร้างพื้นฐานที่ช่วยให้การเข้าถึงและใช้งานโมเดลทำได้ง่ายมากยิ่งขึ้น ไม่ว่าจะเป็นตั้งแต่การทดลองในระดับ POC ไปจนถึงการใช้งานจริงในระดับโปรดักชัน

ปีนี้เราได้ยกระดับแพลตฟอร์มของเราเองรวมถึงการร่วมมือกับพันธมิตรรายต่างๆ เพื่อให้เข้าถึงและใช้งานโมเดลของเราได้ ไม่ว่าจะเป็น

  1. การปรับปรุงเว็บ Opentyphoon.ai

    เรารีเฟรชเว็บไซต์ Typhoon ให้นำเสนอข้อมูลได้มากขึ้น ปรับปรุง Playground สำหรับคนที่อยากทดลองใช้ผ่านเพลย์กราวน์ก่อน รองรับโมเดลหลากหลายขึ้นของเรา เราจัดทำบล็อกสองภาษา (จากเดิมที่มีแต่ภาษาอังกฤษ) และจัดทำและอัปเดตเอกสารสำหรับนักพัฒนา (Documentation) สองภาษา เพื่อให้นักพัฒนาทั้งในประเทศไทยและทั่วโลกสามารถเริ่มต้นและพัฒนาบน Typhoon ได้ง่ายยิ่งขึ้น

  2. Typhoon API Pro ผ่าน Together AI

    ให้บริการ Typhoon API ระดับโปรดักชันผ่านพาร์ทเนอร์ Together AI ตั้งแต่เดือนมีนาคมจนถึงสิ้นปี 2025 เพื่อรองรับการใช้งานปริมาณงานสูงที่ต้องการความเสถียรและความปลอดภัย

  3. เปิดให้ใช้งานผ่าน Ollama และ OpenRouter

    เราทำให้โมเดล Typhoon เข้าถึงได้ง่ายผ่านแพลตฟอร์มนักพัฒนายอดนิยมอย่าง Ollama ที่รองรับการใช้งานแบบโลคอลได้อย่างรวดเร็ว หรือ API ตัวกลางยอดนิยมอย่าง OpenRouter (ผ่าน Together AI อีกที)

  4. ความร่วมมือกับ NVIDIA NIM

    โมเดล Typhoon เข้าร่วมกับ NVIDIA NIM เพื่อรองรับการนำไปใช้งานในระดับโปรดักชัน และเวิร์กโฟลว์การทำอินเฟอเรนซ์ที่พร้อมใช้งานในระดับองค์กร

  5. เปิดใช้งานได้ผ่าน Float16

    เราร่วมมือกับ Float16 บริษัทในไทยเพื่อนำเสนอทางเลือกในการโฮสต์หรือใช้งานโมเดลในระดับโปรดักชันได้สะดวกยิ่งขึ้น

  6. ความร่วมมือกับ AWS ผ่านโครงการ AWS GAIA

    เข้าร่วมโครงการ Generative AI Accelerator (GAIA) ของ AWS พร้อมแผนความร่วมมือในการนำเสนอโครงสร้างพื้นฐานในการทำโปรดักชันรุ่นถัดไปของ Typhoon ในไตรมาสที่ 1 ของปี 2026

    Fun Fact: Typhoon เป็นหนึ่งใน 40 ทีมทั่วโลกที่ได้รับคัดเลือก และเป็นทีมเดียวในเอเชียตะวันออกเฉียงใต้ที่ได้รับคัดเลือกเข้าโปรแกรมนี้


ผลงานที่เผยแพร่ร่วมจากความร่วมมือกับสถาบันต่าง ๆ

นอกเหนือจากงานวิจัยในงานประชุมวิชาการ (ที่จะเล่าในหัวข้อถัดไป) เรายังได้ทำงานอย่างใกล้ชิดกับสถาบันวิจัย พันธมิตรภาคอุตสาหกรรม และผู้นำในระบบนิเวศเพื่อร่วมกันเผยแพร่ผลงานวิจัยและรายงานด้านต่างๆ เช่น

  1. ความร่วมมือกับ SIData+ โรงพยาบาลศิริราช

    เราได้ร่วมกันวิจัยโมเดลด้านการให้เหตุผลทางการแพทย์โดยมีกำหนดเผยแพร่ผลงานวิจัยสู่สาธารณะในช่วงต้นปี 2026 นี้

  2. มหาวิทยาลัยสแตนฟอร์ด (Stanford University)

    ร่วมในงานวิจัย TalkArena แพลตฟอร์มวิจัยแบบเปิดที่ออกแบบมาเพื่อการประเมินและเปรียบเทียบ Large Audio Models โดยอาศัยการตัดสินของมนุษย์ (human judgment) ในลักษณะที่เป็นระบบ โปร่งใส และทำซ้ำได้
    ดูผลงาน

  3. VISTEC

    ผลงานวิจัยหลากหลายรายการ ได้แก่

    • งานวิจัยภาษาถิ่นภาษาไทย (ACL Workshop)
    • การให้เหตุผลทางคณิตศาสตร์แบบหลายภาษา (ACL)
    • ความทนทานของโมเดลด้านความปลอดภัย (ACL Workshop)
  4. AI Singapore

    SEALION Audio ผลงานที่วิจัยร่วมกันเพื่อขยายขีดความสามารถด้านเสียงสำหรับภาษาในเอเชียตะวันออกเฉียงใต้
    ดูรายละเอียดเพิ่มเติม

  5. รายงาน AI Developer Report ร่วมกับ Agoda

    Typhoon มีส่วนร่วมในการให้ข้อมูลการทำงานและการใช้ AI ภายในของทีม ให้กับรายงานนักพัฒนา AI ระดับภูมิภาคของ Agoda
    ดาวน์โหลดรายงาน

  6. Gemmaverse

    โมเดลของ Typhoon อย่าง Typhoon 2.1 Gemma ที่พัฒนาต่อยอดมาจาก Gemma ได้รับการนำเสนอในระบบนิเวศ Gemmaverse ของ Google DeepMind
    อ่านเรื่องราวเพิ่มเติม


งานวิจัยที่ได้รับการตีพิมพ์ในงานประชุมวิชาการ

งานวิจัยถือเป็นหัวใจสำคัญของ Typhoon มาโดยตลอด ในปี 2025 ผลงานของเราได้รับการตีพิมพ์ในเวทีการประชุมด้าน AI ชั้นนำ ครอบคลุมหัวข้อด้านภาษา การให้เหตุผล เสียง การประเมินมัลติโหมด ความปลอดภัย และชุดข้อมูลที่มุ่งเน้นบริบทของเอเชียตะวันออกเฉียงใต้

ปีนี้เรามีผลงานวิจัยที่ได้รับการตอบรับให้ตีพิมพ์และนำเสนอในงานประชุมระดับนานาชาติมากถึง 14 ฉบับที่ได้รับเลือกเข้าสู่งานประชุม 5 งาน ได้แก่ ICLR, Interspeech, ACL, EMNLP และ IJCNLP–AACL

ด้านล่างคือรายชื่อทั้งหมด

  1. Adapting Language-Specific LLMs to a Reasoning Model in One Day via Model Merging — An Open Recipe

    ICLR 2025

    นำเสนอแนวทางเชิงปฏิบัติสำหรับการแปลงโมเดล LLM ที่เฉพาะเจาะจงด้านภาษา (เช่น ภาษาไทย) ให้กลายเป็นโมเดลที่มีความสามารถด้านการให้เหตุผลได้อย่างรวดเร็วภายในหนึ่งวัน ด้วยเทคนิคการผสานโมเดล (model merging)

    [Paper]

  • Typhoon T1: An Open Thai Reasoning Model

    ICLR 2025

    แนะนำแนวทางการพัฒนา Typhoon T1 โมเดลการให้เหตุผลแบบเปิดที่ออกแบบมาเฉพาะสำหรับภาษาไทย โดยคำนึงถึงทั้งความท้าทายทางภาษาและบริบททางวัฒนธรรม

    [Paper]

  • Enhancing Low-Resource Language and Instruction-Following Capabilities of Audio Language Models

    Interspeech 2025

    ศึกษาวิธีการยกระดับความสามารถของโมเดลเสียงสำหรับภาษาทรัพยากรต่ำ โดยเน้นการทำตามคำสั่งและการใช้งานจริง

    [Paper]

  • SkillAggregation: Reference-Free LLM-Dependent Aggregation

    ACL 2025

    เสนอกรอบการประเมินผลแบบไม่ต้องอาศัยคำตอบอ้างอิง (ground truth) โดยใช้ LLM ในการรวมและประเมินทักษะที่ซับซ้อน

    [Paper]

  • Mind the Gap! Static and Interactive Evaluations of Large Audio Models

    ACL 2025

    วิเคราะห์ความแตกต่างระหว่างการประเมินแบบ static benchmark และการประเมินเชิงโต้ตอบ สำหรับโมเดลเสียงขนาดใหญ่ พร้อมชี้ให้เห็นช่องว่างของแนวปฏิบัติการประเมินในปัจจุบัน

    [Paper]

  • Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast Asia

    ACL 2025

    แนะนำ SEA-VL ชุดข้อมูลภาพ–ภาษาขนาดใหญ่ที่สะท้อนความหลากหลายทางวัฒนธรรมของเอเชียตะวันออกเฉียงใต้ พร้อมการวิเคราะห์ข้อแลกเปลี่ยนของวิธีการเก็บข้อมูล

    [Paper]

  • Towards Better Understanding of Program-of-Thought Reasoning in Cross-Lingual and Multilingual Environments

    ACL 2025

    ศึกษาการถ่ายทอดความสามารถด้าน program-of-thought reasoning ข้ามภาษา พร้อมชี้ให้เห็นความท้าทายในบริบทหลายภาษา

    [Paper]

  • Shortcut Learning in Safety: The Impact of Keyword Bias in Safeguards

    ACL 2025

    วิเคราะห์ผลกระทบของอคติจากคีย์เวิร์ดที่อาจบั่นทอนกลไกด้านความปลอดภัย และเผยให้เห็นช่องโหว่ที่ซ่อนอยู่ในระบบ safeguard

    [Paper]

  • ThaiInstruct: An Instruction-Following Dataset for Culturally-Aware, Multitask, and Multi-Domain Evaluation in Thai

    EMNLP 2025

    นำเสนอชุดข้อมูล instruction-following ขนาดใหญ่สำหรับภาษาไทย เพื่อประเมินความตระหนักด้านวัฒนธรรม ความหลากหลายของงาน และขอบเขตโดเมน

    [Paper]

  • Prior Prompt Engineering for Reinforcement Fine-Tuning

    EMNLP 2025

    ศึกษาผลของการออกแบบ prompt ก่อนกระบวนการ reinforcement fine-tuning ต่อประสิทธิภาพการเรียนรู้และผลลัพธ์การใช้งาน

    [Paper]

  • Unlearning vs. Obfuscation: Are We Truly Removing Knowledge?

    EMNLP 2025

    ตรวจสอบว่าวิธีการ unlearning ในปัจจุบันสามารถลบความรู้ได้จริง หรือเป็นเพียงการบดบังข้อมูล พร้อมผลกระทบต่อความปลอดภัยและการปฏิบัติตามข้อกำหนด

    [Paper]

  • FinCoT: Grounding Chain-of-Thought in Expert Financial Reasoning

    EMNLP 2025

    แนะนำ FinCoT กรอบการทำงานที่เชื่อมโยง chain-of-thought reasoning เข้ากับความรู้ทางการเงินระดับผู้เชี่ยวชาญ

    [Paper]

  • Talk Less, Call Right: Enhancing Role-Play LLM Agents with Automatic Prompt Optimization and Role Prompting

    EMNLP 2025

    เสนอเทคนิคในการปรับปรุงเอเจนต์แบบ role-play ด้วยการปรับ prompt และบทบาทโดยอัตโนมัติ เพื่อการใช้เครื่องมือและการตัดสินใจที่มีประสิทธิภาพยิ่งขึ้น

    [Paper]

  • ThaiOCRBench: A Task-Diverse Benchmark for Vision-Language Understanding in Thai

    IJCNLP–AACL 2025

    แนะนำ ThaiOCRBench ชุด benchmark เพื่อการประเมินงานผล VLLM ในงานต่างๆ ที่เกี่ยวข้องกับเอกสารภาษาไทย พร้อมบทวิเคราะห์การปรับปรุงพัฒนาโมเดล VLLM แบบโอเพนซอร์ส

    [Paper]


อีเวนต์และงานบรรยาย

กิจกรรมที่เราเป็นเจ้าภาพหรือร่วมจัด

ในปี 2025 เรามุ่งมั่นอย่างจริงจังในการมีส่วนร่วมกับชุมชน โดยจัดหลากหลายอีเวนต์เพื่อนักวิจัย นักพัฒนา และผู้ใช้งานจริงมารวมตัวกันเพื่อเรียนรู้ แบ่งปัน และร่วมกันสร้างสรรค์สิ่งใหม่ ๆ

  1. งานเปิดตัว Typhoon 2
    งานเปิดตัวอย่างเป็นทางการของ Typhoon 2 พร้อมการเจาะลึกตัวโมเดล การแลกเปลี่ยนกรณีใช้งานจริง และทิศทางงานวิจัยในอนาคต

  2. ML Research Meetup
    มีตอัปที่เน้นด้านงานวิจัย โดยรวบรวมนักศึกษา อาจารย์ นักวิจัย เพื่อแลกเปลี่ยนแนวคิดเกี่ยวกับงานวิจัย ML และ LLM สมัยใหม่

  3. Cursor Meetup Bangkok
    มีตอัปแรกของ Cursor ในกรุงเทพ เราร่วมมือจัดงานนี้เพื่อสนับสนุนให้ผู้ใช้ Cursor ได้พบปะ แลกเปลี่ยน รวมถึงยังรวมเป็นสปีกเกอร์แชร์กรณีศึกษาการใช้ Cursor ในโปรเจกต์ Typhoon Application Week

  4. SEA AI Developer Meetup ร่วมกับ AI Singapore
    ร่วมจัดกับ AI Singapore เพื่อเชื่อมโยงนักพัฒนา AI ในไทยเข้ากับเครือข่ายของ AI Singapore ที่จัดงานทั่วเอเชียตะวันออกเฉียงใต้ แบ่งปันมุมมองเกี่ยวกับโมเดล AI ระดับท้องถิ่นและภูมิภาค พร้อมทั้งการบรรยายเทคโนโลยี AI และการเปิดตัวแฮกกาธอนระดับภูมิภาค

  5. LLM Fine-Tuning and Deployment Bootcamp ร่วมกับ Float16
    บูตแคมป์เต็มวันแบบเข้มข้น มุ่งเน้นการ fine-tune และการนำ Large Language Models ไปใช้งานจริงในสภาพแวดล้อมระดับโปรดักชัน

  6. Typhoon Community Meetup
    กิจกรรมแบบเป็นกันเอง เน้นชุมชนเป็นศูนย์กลาง ให้ผู้ใช้ Typhoon ได้แชร์โปรเจกต์ ให้ข้อเสนอแนะ และเชื่อมต่อกับทีมหลักโดยตรง

  7. Typhoon เฮ็ดให้ AI ใจอีสาน
    กิจกรรมการเปิดตัวผลงาน AI สำหรับภาษาอีสาน ภายในงานมีทั้งการบรรยายเชิงเทคนิคและการแลกเปลี่ยนบริบททางวัฒนธรรมและกรณีใช้งานในพื้นที่จริง

การบรรยายและการร่วมเวทีเสวนา (Speaking Engagements)

ความสนใจใน AI ที่เพิ่มขึ้นอย่างต่อเนื่อง ทำให้ทีม Typhoon ได้รับคำเชิญให้ไปแบ่งปันผลงานและประสบการณ์มากขึ้น ในปี 2025 เพียงปีเดียว เราได้รับเชิญเกือบ 30 เวที และได้ขึ้นบรรยายจริงมากกว่า 20 งาน

ตลอดทั้งปีนี้เราได้ไปบรรยายและให้ความรู้กับกลุ่มคนที่หลากหลาย ไม่ว่าจะเป็น

  • กลุ่มวิชาการและนักศึกษา จากสถาบันต่าง ๆ เช่น KMITL, CMKL, KMUTT และ MU (มหาวิทยาลัยมหิดล) โดยเน้นการแบ่งปันงานวิจัยและแนวทางเชิงปฏิบัติในการพัฒนา LLM
  • กลุ่มธุรกิจและผู้ปฏิบัติงานจริง เช่น โครงการ NIA ACC, งาน AI Brainstorm ของ Fortune Magazine และ Techsauce Global Summit
  • การประชุมเฉพาะอุตสาหกรรม เช่น Bangkok Digital Finance Conference
  • ชุมชนนักพัฒนาและเทคโนโลยี เช่น FOSSASIA Summit และ SuperAI Engineer ซึ่งเราได้แลกเปลี่ยนกับนักพัฒนาเกี่ยวกับโอเพนซอร์ส เครื่องมือ และความท้าทายในการนำไปใช้งานจริง

การแบ่งปันองค์ความรู้ แนวปฏิบัติที่ดี และเรื่องราวจากชุมชน

ในปี 2025 เราเดินหน้าสานต่อหนึ่งในพันธกิจหลักของเราอย่างจริงจัง คือการทำให้ความรู้ด้าน AI เข้าถึงได้ ใช้งานได้จริง และเปิดกว้างสำหรับทุกคน

เราเปิดตัว บล็อกสองภาษาอย่างเต็มรูปแบบ (ไทย / อังกฤษ) เพื่อให้ข้อมูลเชิงลึก แนวปฏิบัติที่ดี และประสบการณ์จากการใช้งานจริงที่เข้าถึงได้ง่ายสำหรับนักพัฒนา นักวิจัย และผู้ปฏิบัติงาน ตลอดทั้งปีเราเผยแพร่บล็อกมากกว่า 30 บทความต่อภาษา หากตัดเรื่องข่าวสารด้านโมเดลออก ก็ยังมีบทความอื่นๆ อีกถึง 20 บทความ ครอบคลุมแนวปฏิบัติ บทเรียนเชิงเทคนิค มุมมองเชิงกลยุทธ์ และเรื่องราวจากผู้ใช้จริง

เราจัดทำบทความเชิงลึกที่ผ่านการค้นคว้าอย่างรอบด้าน เพื่อช่วยให้ผู้ใช้งานสามารถสร้างระบบ AI ที่ดีได้จริงในทางปฏิบัติ ตัวอย่างบทความสำคัญ ได้แก่:

  • Mastering Agentic Workflows: 20 Principles to Build Smarter AI Systems
    บทความเชิงลึกเกือบ 10,000 คำ ว่าด้วย evaluation-driven development, context engineering, การใช้เครื่องมือ และการออกแบบ agentic workflows
    อ่านเพิ่มเติม

  • A Practical Guide to Agentic Self-Reflection and Other Methods to Improve LLM Inference on Complex Questions
    คู่มือเชิงปฏิบัติสำหรับการยกระดับความสามารถด้านการให้เหตุผล ด้วยเทคนิค self-reflection และ prompting รูปแบบต่าง ๆ
    อ่านเพิ่มเติม

  • The Current Landscape of Reasoning Model Development
    ภาพรวมการพัฒนา reasoning models ทั้งแนวทางหลัก ข้อแลกเปลี่ยน และโจทย์ที่ยังเปิดอยู่
    อ่านเพิ่มเติม

เรายังเผยแพร่บทเรียนเชิงปฏิบัติ เพื่อช่วยลดอุปสรรคในการเริ่มต้นใช้งาน Typhoon ครอบคลุมหัวข้อ เช่น

  • การ deploy แบบโลคอลด้วย Ollama และ LM Studio
  • เวิร์กโฟลว์แบบ agentic ด้วย n8n
  • การเชื่อมต่อกับมาตรฐานใหม่อย่าง MCP

คู่มือเหล่านี้ออกแบบมาเพื่อช่วยให้นักพัฒนาก้าวจากการทดลองไปสู่ระบบที่ใช้งานได้จริงอย่างรวดเร็ว

นอกเหนือจากบทความเชิงเทคนิค เราได้แบ่งปันมุมมองต่อแนวโน้มและคำถามเชิงกลยุทธ์ในวงการ AI เช่น เสวนาข้อได้เปรียบของโมเดลภาษาเฉพาะถิ่น ทั้งด้านความแม่นยำ วัฒนธรรม และการนำไปใช้จริง
อ่านเพิ่มเติม

สุดท้าย เราได้ถ่ายทอดเรื่องราวการใช้งาน Typhoon ในโลกจริง ผ่านประสบการณ์ของชุมชนและพันธมิตร เช่น:

  • SIData+ โรงพยาบาลศิริราช — แชตบอตงานธุรการ
  • VISAI — แชตบอตด้านกฎหมาย
  • สถาบันวิจัยเพื่อการพัฒนาประเทศไทย (TDRI) — Big Data Text Analytics
  • RISA — AI ติวเตอร์เตรียมสอบ
  • Typhoon Community Meetup — โปรเจกต์ใช้งานจริงหลากหลายจากชุมชน

เรื่องราวเหล่านี้สะท้อนสิ่งที่เราให้ความสำคัญที่สุด คือการช่วยให้ผู้คนสามารถนำ AI ไปใช้ได้อย่างมีความหมายในบริบทจริง


สรุปปี 2025 และก้าวต่อไปข้างหน้า

เมื่อมองย้อนกลับไปในปี 2025 สิ่งที่โดดเด่นที่สุดไม่ใช่แค่จำนวนโมเดลที่เปิดตัวหรือผลงานวิจัยที่ได้รับการตีพิมพ์ แต่คือ “แรงสนับสนุน"

แรงสนับสนุนของชุมชนที่เติบโตขึ้นอย่างต่อเนื่อง แรงผลักดันของงานวิจัยที่ถูกแปลงไปสู่ระบบที่ใช้งานได้จริง และแรงลงมือทำจริงของการเริ่มจากต้นแบบไปสู่การใช้งานระดับโปรดักชัน

เรากำลังก้าวเข้าสู่ปี 2026 บนรากฐานที่แข็งแรงยิ่งขึ้น ทั้งงานวิจัยที่ลึกและหลากหลายขึ้น การเข้าถึงโครงสร้างพื้นฐานที่กว้างขึ้น และสัญญาณที่ชัดเจนขึ้นจากผู้ใช้งาน Typhoon ในชีวิตจริง ยังมีอีกมากให้สำรวจ ปรับปรุง และพัฒนาต่อไป

ขอบคุณที่ร่วมเป็นส่วนหนึ่งของการเดินทางครั้งนี้ เราตื่นเต้นที่จะได้สร้างสรรค์สิ่งใหม่ ๆ ไปพร้อมกับคุณในปีถัดไป