เมื่อวันที่ 18 กันยายนที่ผ่านมา เราได้จัดงาน Typhoon Community Meetup ครั้งแรก! 🎉 นับเป็นโอกาสดีที่เหล่าผู้ใช้งาน Typhoon จริง ๆ ได้มาพบกัน พูดคุย แลกเปลี่ยน และแชร์ประสบการณ์กันแบบใกล้ชิด
สำหรับใครที่พลาดงานไป ไม่ต้องเสียดายไปค่ะ บล็อกนี้เราได้รวม Recap สั้น ๆ มาให้อ่านกันแบบไม่พลาด โดยงานนี้มีไฮไลต์หลัก ๆ 3 ส่วน คือ
-
อัปเดตความคืบหน้าและทิศทางของโมเดล Typhoon จากทีมผู้พัฒนาโดยตรง
-
แชร์เคสจริงจากคอมมูนิตี้ ที่นำ Typhoon ไปใช้ในธุรกิจได้อย่างน่าสนใจ
-
Networking ชิล ๆ สำหรับผู้ที่มาร่วมงานออนไซต์ ได้ทำความรู้จักและต่อยอดไอเดียกันเต็มที่
เรื่องน่ารู้เกี่ยวกับโมเดล Typhoon
ทิศทางโมเดล
ปี 2025 ทีม Typhoon เดินหน้าพัฒนาและปล่อยโมเดลมากขึ้นกว่าเดิม โดยมีความแตกต่างชัดเจนจากปี 2024 ในหลายด้าน ได้แก่
โฟกัสที่การใช้งานจริง
โมเดลปีนี้ถูกออกแบบให้ตอบโจทย์ Use Case ได้ชัดเจนขึ้น และพร้อมใช้งานจริงผ่าน API หรือการ deploy ที่ทำได้ง่าย
Multimodality
เราเริ่มปล่อยโมเดลที่รองรับภาพและเสียงตั้งแต่ปลายปี 2024 แต่ในตอนนั้นยังอยู่ในระดับ Research Preview เพื่อใช้ในการศึกษาวิจัย ปี 2025 จึงเป็นการต่อยอดไปสู่การใช้งานจริง ที่ทั้งแม่นยำ คล่องตัว และคุ้มค่า
ทำมาเพื่อใช้จริงใน Use Case เจาะจง ขนาดเล็ก แม่นยำ ประหยัด ว่องไว
จุดแข็งของ Typhoon คือความแม่นยำในภาษาไทยที่ทัดเทียมหรือพยายามเหนือกว่าโมเดลชั้นนำในบาง metric โดดเด่นด้วยขนาดเล็ก ทำให้ประมวลผลได้รวดเร็วและประหยัดค่าใช้จ่ายกว่ามาก
ความ “ไว” ไม่ได้อยู่แค่การรันโมเดล แต่ยังรวมถึงการทำงานของทีมที่ใกล้ชิดกับคอมมูนิตี้ ทำให้สามารถรับฟีดแบ็กและพัฒนาได้อย่างรวดเร็ว ตัวอย่างล่าสุดคือ Typhoon OCR v2 ที่กำลังจะปล่อยในเร็ว ๆ นี้ ซึ่งพัฒนาต่อยอดจากรุ่นแรกจากฟีดแบ็กต่างๆ ที่ได้รับ
นอกจากนี้ ปี 2025 เรายังเน้นย้ำเรื่อง open source และ permissible license ที่เปิดกว้างให้นำไปใช้งานจริงในธุรกิจ ไม่ว่าจะ deploy เอง ทำ self-hosting หรือใช้งานผ่านผู้ให้บริการ GPU infrastructure ก็ทำได้ทั้งหมด ตัวอย่างจากงาน Meetup ก็มีการโชว์ Use Case หลากหลายรูปแบบเช่นกัน
รีวิวผลงานในปี 2025
โมเดลหลักที่เราเปิดตัวในปีนี้สะท้อนทิศทางชัดเจน ทั้งในมุมของ Use Case, ขนาด, Multimodality และการลดต้นทุน
Adoption และ Community Engagement เติบโตขึ้นมากเมื่อเทียบกับปีก่อน:
- มียอด unique users เกือบ 20,000 คน ที่ใช้งาน API
- ทำ API calls รวมกว่า 35 ล้านครั้ง
- มียอดดาวน์โหลดโมเดลบน Hugging Face ถึง 6.5 ล้านครั้ง
ด้านงานวิจัย ทีม Typhoon ก็ไม่ละเลย โดยมีผลงานตีพิมพ์ในเวทีระดับโลก อาทิ ACL, Interspeech, NeurIPS, ICLR และ EMNLP
โมเดลใหม่ ๆ ที่รอให้ติดตาม
จากทิศทางข้างต้น ทีม Typhoon กำลังพัฒนาโมเดลใหม่ ๆ ที่น่าจับตา ได้แก่
-
Typhoon OCR v2
-
Typhoon 2.5 – text model ที่ต่อยอดจาก 2.1 Gemma และเพิ่มความสามารถด้าน Agentic
-
Typhoon Isan ASR & TTS – โมเดลถอดเสียงและสังเคราะห์เสียงภาษาอีสาน
-
Typhoon Embedding – embedding model สำหรับการทำ RAG
Community Lightning Talks
หนึ่งในไฮไลต์ของงานคือการฟัง Lightning Talks จากผู้ใช้งานจริง ที่มาแชร์ประสบการณ์ตรงว่าแต่ละทีมนำ Typhoon ไปประยุกต์ใช้ในงานจริงอย่างไรทั้งหมด 5 กรณีศึกษา ครอบคลุมตั้งแต่ Enterprise สตาร์ทอัพ ไปจนถึงภาครัฐและงานวิจัย
1. Document Classification for Enterprise with Typhoon OCR

ทีม Toyota Leasing (Thailand) – โดยคุณ Seehapong Seeharod, Pantheb Tachajarrupan และ Atiwat Tanapongworapa
ธุรกิจสินเชื่อเช่าซื้อรถยนต์ต้องจัดการกับเอกสารจำนวนมหาศาล ทั้งสัญญา เอกสารบันทึกข้อตกลง ไปจนถึงแบบฟอร์มจากสาขาทั่วประเทศ ซึ่งเดิมทีเอกสารเหล่านี้ถูกรวมเข้ามาโดยไม่ถูกจัดประเภท ทำให้ทีมงานต้องเสียเวลาในการจำแนกด้วยตนเอง
ทีม Toyota Leasing จึงนำ Typhoon OCR มาใช้เป็นหัวใจของ Document Processing Pipeline โดยมีขั้นตอนหลายส่วนตามรูปนี้

ทั้งนี้ขั้นตอนสำคัญที่มีการแลกเปลี่ยน ถาม-ตอบกันเยอะ คือ:
-
Pre-Processing: จัดการคุณภาพเอกสาร เช่น หมุนภาพเอียง หรือปรับความคมชัดก่อน OCR ซึ่งสำคัญมากต่อความแม่นยำของ OCR
-
OCR ด้วย Typhoon: โมเดลนี้ทำการดึงข้อความออกมาโดยไม่เลือกข้อมูล (อ่านทุกอย่าง)
-
Post-Processing: กรองและเลือกเฉพาะข้อมูลที่ต้องการ พร้อมแก้ไขคำผิดด้วย LLM หรือ Rule-based script
ผลลัพธ์คือสามารถประมวลผลเอกสารปริมาณ หลายหมื่นหน้า/เดือน ได้อย่างมีประสิทธิภาพ ลดภาระงานของทีมลงอย่างมาก คุณ Pantheb ยังเน้นย้ำว่า Pre-process และ Post-process คือปัจจัยสำคัญที่ทำให้ OCR ใช้งานได้จริงในระดับองค์กร
ด้วยความที่เอกสารต้องการการรักษาความเป็นส่วนตัว ทาง Toyota Leasing จึงได้เลือกใช้บริการ Private GPU ส่วนตัว ซึ่งพาร์ทเนอร์อย่าง Float16 มีให้บริการในส่วนนี้ และเหมาะสมสำหรับปริมาณเอกสารที่ค่อนข้างมาก
นอกจากนี้ทางทีมยังได้แชร์ถึงแผนการนำมาต่อยอดการธุรกิจอื่นๆ ในเครือ

2. Automatic Social Comment Responder

Pawarit Piamprecha จาก Tobtan.ai
ทีมนี้เป็นหนึ่งในทีมที่ได้เข้าร่วมโครงการ Typhoon Hackathon 2024 ที่ต่อมาได้สร้างโปรเจกต์ต่อยอดมาเป็นสตาร์ทอัพ Tobtan.ai ช่วยครีเอเตอร์บริหารชุมชนบนโซเชียล โดยเริ่มจากฟีเจอร์ตอบคอมเมนต์อัตโนมัติ
ทีมเลือกใช้ Typhoon LLM เพราะเข้าใจภาษาไทยได้ลึก และสามารถ Fine-tune บุคลิก/โทนเสียง ให้เข้ากับแต่ละครีเอเตอร์ได้ เช่น สนุกสนาน สุภาพ หรือจริงจัง ต่างจากการใช้เทมเพลตที่ดูเหมือนคำตอบตามเทมเพลตหรือดูหุ่นยนต์เกินไป

ภาพตัวอย่างการปรับสไตล์ภาษาในการตอบคอมเมนต์
ผลลัพธ์คือครีเอเตอร์สามารถ “ตอบกลับอย่างเป็นธรรมชาติ” ในสเกลที่มากขึ้น โดยไม่เสียความเป็นตัวเอง
ปัจจุบันโปรเจกต์นี้กำลังอยู่ในระหว่างการพัฒนาและมีการ Pilot ใช้งานกับครีเอเตอร์ที่สนใจกลุ่มแรกๆ สำหรับผู้ที่สนใจเพิ่มเติมสามารถติดต่อทางทีมงานได้เลย
3. Typhoon LLM: Modernizing Government Workflows for Enhanced Efficiency

คุณ Pattrawut Kunwipusit และคุณนีโน่ ทีม จาก VAP Solutions
อีกหนึ่ง Use Case ที่น่าสนใจคือการทำงานร่วมกับหน่วยงานภาครัฐ โดยใช้ทั้ง Typhoon OCR และ Typhoon 2.1 Gemma
เดิมทีโซลูชัน OCR ที่ใช้ อย่าง Tesseract.js นั้นมีความแม่นยำเพียง 30–60% และไม่รองรับเลขไทย ทีมต้อง Fine-tune เอง
หลังจากเปลี่ยนมาใช้ Typhoon OCR ความแม่นยำเพิ่มขึ้นเกือบเท่าตัว และรองรับเลขไทยโดยตรง
ด้าน Typhoon Text Model ถูกนำมาใช้สรุปและจัดประเภทเนื้อหา ซึ่งช่วยแก้ปัญหาความไม่สม่ำเสมอจากการทำงานของคน เพราะคนแต่ละคนมีวิธีการอ่านและสรุปข้อมูลรายงานที่ต่างกัน ทีมได้เทรนต่อด้วยข้อมูล Annotated + Human eval ทำให้ได้คุณภาพที่เชื่อถือได้มากขึ้น
ที่สำคัญคือโครงการนี้ยังต้องการ On-premise Deployment ซึ่ง Typhoon ก็ตอบโจทย์ในด้านความยืดหยุ่นและการควบคุมข้อมูล
4. Typhoon OCR: Extracting & Tagging for Smarter HRM & KMS Chatbot

คุณ Natdhanai Praneenatthavee จาก Inteltion
Inteltion ทดลองสร้าง HRM Chatbot ที่ตอบคำถามด้วยข้อมูลจาก Knowledge Base ภายในองค์กร โดยใช้ Typhoon OCR ผ่าน API เพื่อทำ Proof of Concept (POC) จุดที่น่าสนใจคือ Typhoon OCR สามารถทำงานได้แม้กับ ภาพที่ซับซ้อนอย่าง Charts/Graphs
สถาปัตยกรรม AWS กับ Typhoon OCR Service Landscape (KMS & Chatbot Solution)
ในงานนี้ Inteltion ได้นำเสนอ สถาปัตยกรรมการใช้งาน Typhoon OCR บน AWS ในระดับโปรดักชันเพื่อสร้างโซลูชัน Chatbot และ Knowledge Management System (KMS) โดยมีองค์ประกอบหลักดังนี้:
AWS EKS (Elastic Kubernetes Service)
ทำหน้าที่เป็นโครงสร้างหลักในการ รันบริการแบบ Containerized ได้แก่ Chatbot Web UI, เว็บไซต์ KMS และ Typhoon OCR service
จุดเด่นคือสามารถทำ Rolling Update ได้อัตโนมัติผ่าน CI/CD pipeline โดยที่ทีมงานไม่จำเป็นต้องดูแล Kubernetes control-plane ด้วยตัวเอง ช่วยให้การปรับปรุงระบบเป็นเรื่องง่ายและต่อเนื่อง
AWS ECR (Elastic Container Registry)
ใช้เก็บ Container Images ของ KMS Website, Chatbot UI และ Typhoon OCR worker
ผูกเข้ากับ CI/CD Pipeline อย่างแนบสนิท ทำให้สามารถ promote image ระหว่าง Dev → Test → Prod ได้อย่างเป็นระบบและปลอดภัย
Inteltion ยังได้แชร์สถาปัตยกรรมฝั่ง Backend ที่ออกแบบอย่างละเอียดในระดับ Component-Level Design โดยมี Workflow สำคัญคือ KMS Ingestion Pipeline
KMS Ingestion Pipeline
-
Trigger: ใช้ S3 เป็นตัวกระตุ้น เมื่อมีการอัปโหลดไฟล์เอกสารเข้ามา
-
Workflow: ประมวลผลผ่าน AWS Lambda / Step Functions ที่จะเรียกใช้ Typhoon OCR เพื่อถอดข้อความจากไฟล์
-
Text Processing: ข้อความที่ได้จะถูก Split ออกเป็นชิ้นเล็ก ๆ (chunks)
-
Embedding: ส่งต่อไปที่ Bedrock เพื่อสร้าง Embedding
-
Storage: เก็บ Embedding ลงใน Vector Database (OpenSearch) เพื่อให้สามารถทำ Semantic Search ได้
-
Reliability: Pipeline นี้ถูกออกแบบมาให้มีระบบ Error Handling ทั้งการ Retry อัตโนมัติ และการแจ้งเตือนเมื่อเกิดความล้มเหลว
Workflow ในการทำงานของ HRM Chatbot
-
HRM อัปโหลดไฟล์ → OCR
-
ระบบ Tag ข้อมูลเอกสาร → อัปเดต Knowledge Base
-
Chatbot ตอบคำถามอ้างอิงข้อมูลที่จัดระเบียบแล้ว
นอกจากนี้ Inteltion ยังวางแผน Fine-tune โมเดล เพิ่มเติม และขยายไปสู่ Use Case อื่น ๆ ต่อไป
5. NitiBench: Benchmarking Thai Legal AI

คุณ Chompakorn Chaksangchaichot จาก VISAI.AI
ทีม VISAI มาเล่าเบื้องหลังงานวิจัย NitiBench ซึ่งเป็น Benchmark สำหรับประเมินความสามารถด้านกฎหมายไทยของ LLMs และการใช้ Reinforcement Learning (RL) เพื่อปรับปรุง
NitiBench เป็นฐานข้อมูลสำคัญที่ใช้ทดสอบโมเดลสำหรับงาน Legal RAG และอยู่เบื้องหลัง “สี่มุมเมือง” เครื่องมือค้นหา/วิเคราะห์กฎหมายไทย โดย Typhoon เป็นหนึ่งในโมเดลที่ถูกนำไป Benchmark เพราะในเวลานั้น Typhoon มี Context Window ใหญ่ที่สุดในภาษาไทย
ผลการทดสอบพบว่า Typhoon มีคะแนน ทัดเทียมกับโมเดลชั้นนำ บนชุดทดสอบ NitiBench-CCL และทำผลงานได้ดีโดยเฉพาะกับ NitiBench-Tax
ผู้สนใจสามารถดาวน์โหลดสไลด์งานวิจัยเพื่อดูรายละเอียดเชิงเทคนิคเพิ่มเติมได้ที่นี่
ปิดท้าย
นอกจากเนื้อหาจากทีมที่มาพูดแล้ว งานนี้ยังเปิดพื้นที่ Networking สำหรับผู้เข้าร่วมออนไซต์ และเชิญชวนผู้ที่อยากเล่าถึง Open Source Project ของตัวเองขึ้นมาแชร์ แม้จะไม่เกี่ยวกับ Typhoon โดยตรงก็ตาม จุดประสงค์คือการส่งเสริมการแลกเปลี่ยนความรู้ และสร้างพลังร่วมให้คอมมูนิตี้ AI ไทยเติบโตไปด้วยกัน
เราหวังว่าจะได้จัดงานที่เต็มไปด้วยการเรียนรู้และแรงบันดาลใจแบบนี้อีกในครั้งหน้า 🚀

