
Meet Typhoon Translate: A Small, Fast, High-Performance Model Purpose-Built for Thai-English Translation
New ReleaseTyphoon TranslateSmall ModelLocal LLMText Model

Table of Contents
We’re excited to introduce Typhoon Translate—a lightweight, open-source model specialized for Thai-English translation—now available on Hugging Face and Ollama.
Why Typhoon Translate
Translation is one of the most common and valuable uses of language models—whether you're reading an English article, drafting an email to international colleagues, or translating business documents. Our research confirms this trend: people rely on AI-powered translation in both everyday life and professional settings.
But while translation tools are everywhere, they’re not always the right fit—especially when it comes to quality, privacy, and local relevance.
-
Many translations still sound awkward or miss key context—requiring tedious human cleanup.
-
Cloud-based models often raise concerns when dealing with confidential or sensitive information.
At Typhoon, we saw a clear gap: Thai users need a translation model that’s accurate, secure, and runs locally—especially in a world where Thai is still underrepresented online.
So we built Typhoon Translate.
It’s a lightweight, high-performance Thai-to-English and English-to-Thai translation model designed to run on your own device—giving you full control over your data while delivering natural, human-like translations that rival the best.
The Challenge That Inspired Us
We've all seen funny or confusing translations—like strange Thai on restaurant signs or puzzling instruction manuals. But bad translations are more than just amusing; they can cause real problems.
Thai is classified as a medium-low-resource language. Only about 0.5% of online content is in Thai, while English makes up nearly 50%—a hundred times more. Unlocking this vast amount of English content requires efficient and accurate translation models.
Now, we have LLMs like GPT and Claude. These tools are much better at translating because they understand the small details and context of what's being said. While using LLMs for translation has become more common, running translations locally on personal devices is still rare due to quality limitations. There are also important use cases for local translation models, especially when dealing with private documents or sensitive information that shouldn't leave an organization's environment.
Small language models are improving every day, but their translation quality has not advanced significantly. Translation remains a challenge due to the long-tail nature of linguistic data.
Introducing Typhoon Translate: Bridging the Gap with Local LLM
Typhoon Translate is designed to solve translation challenges for Thai users by offering clear, natural-sounding translations where you can run on your laptop.
Typhoon Translate provides high-quality English to Thai / Thai to English translations that feel natural which rival large proprietary models.
Our mission is simple: to help Thai people access information and opportunities by removing language barriers.
Key Highlight
🚀 Lightweight: 4B parameters—runs on a regular laptop, no powerful hardware needed.
🔒 Private & Secure: Translates directly on your device; your data stays with you.
🎯 Natural Translation: Delivers fluid, human-like translations on par with leading proprietary models.
📊 Proven Performance: Outperforms GPT-4o and Gemini 2.5 Flash on the AI-as-a-judge benchmark for Thai-English tasks.
🔧 Open Weight: Available now on Hugging Face and Ollama. Easy to try, fine-tune, or integrate into your own workflow.
Methodology
Translation isn’t a new problem—datasets like SCB-MT and OPUS have supported Thai-English translation for years. However, most were created before the rise of large language models (LLMs), at a time when scale mattered more than fidelity. In the LLM era, the focus has shifted decisively toward quality over quantity.
To meet this new standard, we curated a high-quality Thai-English dataset using a modern, multi-step pipeline:
-
Data Sourcing: We collected diverse, publicly available English and Thai texts across multiple domains.
-
LLM-Augmented Translation: Multiple LLMs—including Gemma-3 27B, Typhoon, QwQ, and others—were used to generate initial translations. We use two-stage Labeling:
-
Stage 1 emphasized throughput, generating large volumes of synthetic data.
-
Stage 2 applied human-in-the-loop validation, randomly sampling for fluency, accuracy, and tone to ensure quality control.
- Data Mixture & Selection: We filtered and blended sources based on quality signals, then trained multiple checkpoints to benchmark translation performance.
The best-performing checkpoint, based on both automatic metrics and human judgment, is what we release as Typhoon Translate.
Domain proportion of our training dataset
Evaluation Framework
To assess Typhoon Translate, we adopted a modern evaluation method using GPT-4o-mini as an “AI judge,” following the AlpacaEval 2.0 framework. This approach compares translations generated by Typhoon Translate against those from other systems—including GPT-4o-mini itself—across both English-to-Thai and Thai-to-English directions.
Instead of traditional metrics like BLEU—which rely on exact word matches—we used this AI-based approach because translation quality involves meaning, tone, and cultural nuance, not just matching words. GPT-4o-mini judged which translation was better based on accuracy, fluency, and context.
The score reflects how often Typhoon Translate and another system was preferred over GPT-4o-mini's own translations.
Evaluation Dataset
We compiled a balanced and diverse test set covering both directions, sourcing content from high-quality, publicly available datasets:
Thai-to-English Evaluation data (128 samples)
Balanced Thai text samples sourced from:
English-to-Thai Evaluation data (177 samples)
Balanced English samples from:
We benchmarked our model against Google Translate and state-of-the-art language models including GPT-4, Gemini, and Claude.
Evaluation Results: Typhoon Translate Outperforms Leading Models in Both Directions
Recap: We evaluated translation quality using the “LLM as a Judge” method, where GPT-4o-mini compares translations and chooses the better one based on accuracy, fluency, and context. The win rate (%) reflects how often each system’s translation was preferred over GPT-4o-mini’s own output.
English-to-Thai (EN→TH)
Typhoon Translate leads the pack with a 63.8% win rate—outperforming all other evaluated systems, including:
- Gemini 2.5 Flash Preview (61.6%)
- GPT-4.1-2025 (59.3%)
- Claude 3.7 (55.4%)
- GPT-4o-2024 (54.8%)
- Google Translate (44.1%)
- GPT-4.1-mini (41.2%)
Thai-to-English (TH→EN)
Typhoon Translate again takes the lead with a 67.2% win rate, significantly ahead of top-tier models:
- GPT-4o-2024 (62.5%)
- Gemini 2.5 Flash Preview (61.7%)
- GPT-4.1-2025 (60.2%)
- GPT-4.1-mini (55.5%)
- Google Translate (44.1%)
- Claude 3.7 (39.1%)
Translation Demos
English-to-Thai Translation Demos
Below are sample translations from Typhoon Translate for English-to-Thai tasks. Each example is shown alongside GPT-4o’s output, highlighting real-world use cases where translation quality and nuance matter.
1. Fiction
Goal: Preserve the elegance and tone of narrative writing to enhance the reader's experience.
Source: Fictional text generated via ChatGPT.
Input:
A fallen deity, Serai, cursed to walk as a mortal boy, fights against the Empire that slaughtered the skyborn.
He trains with humans, bonds with them, bleeds beside them. In secret, he regrows his wings through combat—but each feather only returns when he loses someone he loves.
At the climax, he ascends—glorious, radiant, unstoppable—only to find his friends gone, their memories etched into his wings.
As he watches the sun rise, his halo returns.
He whispers, “Was it worth it?”
And no one answers.
A fallen deity, Serai, cursed to walk as a mortal boy, fights against the Empire that slaughtered the skyborn.
He trains with humans, bonds with them, bleeds beside them. In secret, he regrows his wings through combat—but each feather only returns when he loses someone he loves.
At the climax, he ascends—glorious, radiant, unstoppable—only to find his friends gone, their memories etched into his wings.
As he watches the sun rise, his halo returns.
He whispers, “Was it worth it?”
And no one answers.
plaintext
Result:
GPT-4o Output:
เซไร เทพที่ล่มสลาย ถูกสาปให้เดินในร่างเด็กชายมนุษย์ ต่อสู้กับจักรวรรดิที่สังหารผู้เกิดบนฟ้า เขาฝึกฝนกับมนุษย์ สร้างสายสัมพันธ์ และร่วมต่อสู้เคียงข้างพวกเขา ในความลับ เขาฟื้นฟูปีกของเขาผ่านการต่อสู้—แต่ขนนกแต่ละเส้นจะกลับมาเมื่อเขาสูญเสียคนที่เขารัก
ในจุดสูงสุด เขาเหินขึ้น—งดงาม สว่างไสว หยุดไม่อยู่—แต่กลับพบว่าเพื่อนของเขาหายไป ความทรงจำของพวกเขาถูกจารึกลงในปีกของเขา ขณะที่เขามองดูพระอาทิตย์ขึ้น วงแหวนศักดิ์สิทธิ์ของเขาก็กลับมา
เขากระซิบว่า “มันคุ้มค่าหรือเปล่า?” และไม่มีใครตอบ
เซไร เทพที่ล่มสลาย ถูกสาปให้เดินในร่างเด็กชายมนุษย์ ต่อสู้กับจักรวรรดิที่สังหารผู้เกิดบนฟ้า เขาฝึกฝนกับมนุษย์ สร้างสายสัมพันธ์ และร่วมต่อสู้เคียงข้างพวกเขา ในความลับ เขาฟื้นฟูปีกของเขาผ่านการต่อสู้—แต่ขนนกแต่ละเส้นจะกลับมาเมื่อเขาสูญเสียคนที่เขารัก
ในจุดสูงสุด เขาเหินขึ้น—งดงาม สว่างไสว หยุดไม่อยู่—แต่กลับพบว่าเพื่อนของเขาหายไป ความทรงจำของพวกเขาถูกจารึกลงในปีกของเขา ขณะที่เขามองดูพระอาทิตย์ขึ้น วงแหวนศักดิ์สิทธิ์ของเขาก็กลับมา
เขากระซิบว่า “มันคุ้มค่าหรือเปล่า?” และไม่มีใครตอบ
plaintext
Typhoon Translate Output:
เทพเจ้าที่ร่วงหล่น เซไร ถูกสาปให้ต้องมาเกิดเป็นเด็กมนุษย์ กลับต่อสู้กับจักรวรรดิที่สังหารหมู่เหล่าทวยเทพผู้สถิตบนฟ้า เขาฝึกฝนร่วมกับมนุษย์ สร้างมิตรภาพ เลือดไหลเคียงข้างพวกเขา ในความลับ เขาปลูกปีกขึ้นใหม่ผ่านการต่อสู้ แต่ละขนนกจะกลับคืนมาได้ก็ต่อเมื่อเขาต้องสูญเสียคนที่เขารัก
ในฉากไคลแมกซ์ เขาทะยานขึ้นสู่ฟ้า—สง่างาม สว่างไสว ไร้ขีดจำกัด—แต่กลับพบว่าเพื่อนๆ ของเขาได้จากไปแล้ว ความทรงจำของพวกเขาถูกสลักไว้บนปีกของเขา
ขณะที่เขามองดูดวงอาทิตย์ขึ้น รัศมีรอบตัวเขาก็กลับคืนมาอีกครั้ง
เขาพึมพำว่า "มันคุ้มค่าหรือเปล่า?"
แต่ไม่มีใครตอบเขาเลย
เทพเจ้าที่ร่วงหล่น เซไร ถูกสาปให้ต้องมาเกิดเป็นเด็กมนุษย์ กลับต่อสู้กับจักรวรรดิที่สังหารหมู่เหล่าทวยเทพผู้สถิตบนฟ้า เขาฝึกฝนร่วมกับมนุษย์ สร้างมิตรภาพ เลือดไหลเคียงข้างพวกเขา ในความลับ เขาปลูกปีกขึ้นใหม่ผ่านการต่อสู้ แต่ละขนนกจะกลับคืนมาได้ก็ต่อเมื่อเขาต้องสูญเสียคนที่เขารัก
ในฉากไคลแมกซ์ เขาทะยานขึ้นสู่ฟ้า—สง่างาม สว่างไสว ไร้ขีดจำกัด—แต่กลับพบว่าเพื่อนๆ ของเขาได้จากไปแล้ว ความทรงจำของพวกเขาถูกสลักไว้บนปีกของเขา
ขณะที่เขามองดูดวงอาทิตย์ขึ้น รัศมีรอบตัวเขาก็กลับคืนมาอีกครั้ง
เขาพึมพำว่า "มันคุ้มค่าหรือเปล่า?"
แต่ไม่มีใครตอบเขาเลย
plaintext
2. Professional Reports
Goal: Accurately translate professional and business content while preserving technical terminology.
Source: SCBX-AI-Outlook-2025_ENG_Final.pdf
Result:
3. Technical Reports
Goal: Deliver precise translations of technical content with correct use of domain-specific terms.
Source: Typhoon 2: A Family of Open Text and Multimodal Thai Large Language Models
Result:
Additionally, the Thai-English translation demo is provided in the appendix.
Conclusion
These results confirm that smaller, specialized models can outperform larger general-purpose systems when trained with the right data and approach. Typhoon Translate delivers enterprise-grade translation—without the need for cloud APIs or massive compute.
It proves that local, lightweight AI can rival and even surpass the best, especially for Thai-English translation tasks where nuance matters.
Limitations & Future Work
Of course, translation is ultimately about quality and true communication. For important work, we still recommend having a human in the loop for quality assurance (as is the case with this very article). We also welcome feedback to help us improve the model further—feel free to reach out and share your thoughts via the Typhoon Discord.
it's important to note that Typhoon Translate was trained with a context window of 8192 tokens. For optimal performance and to ensure the highest translation quality, we recommend that input texts do not exceed this length. While this capacity is suitable for a wide range of documents and common use cases, translating texts significantly longer than 8192 tokens in a single pass might not yield the best results. We are continuously exploring avenues for improvement, including translation styles and context in future iterations of the model.
Try Typhoon Translate Today
Get started with Typhoon Translate by running it locally on your machine. The model is available on:
New to Ollama? Check out our quick-start tutorial here.
What’s in the Hugging Face Collection? We provide Typhoon Translate in multiple formats to support different platforms and use cases:
- Transformers
- Standard PyTorch format, ideal for training, fine-tuning, or using with Hugging Face pipelines
- GGUF
- Quantized versions for efficient CPU/GPU performance
- Works with tools like llama.cpp, llamafile, and text-generation-webui
- Great for lightweight, local deployment across platforms
- MLX
- Optimized for Apple Silicon (M1/M2/M3)
- Runs natively via Apple’s MLX runtime
Appendix
English-to-Thai Translation Demos (Full Text)
Example 2: Professional Reports
Input:
At the end of 2022, OpenAI’s launch of ChatGPT marked a defining moment— the world was introduced to Generative AI (Gen AI), and everything changed.
What once felt like a distant frontier suddenly became a present-day force. AI rapidly embedded itself into both personal routines and enterprise strategies, emerging as a powerful game-changer—streamlining lives, unlocking new efficiencies, and transforming how organizations operate.
In pursuit of competitive advantage, businesses across sectors are now racing to understand, adopt, and innovate with AI.
SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence is designed to be a lighthouse amid this accelerating wave—offering clarity and direction as leaders navigate the rising tides of technological disruption. This report explores the defining AI trends shaping the year ahead and provides a strategic lens for turning uncertainty into opportunity.
The report is divided into four acts, each highlighting a major force reshaping the AI landscape:
ACT I: Two Philosophies, One Future. The Battle Between Open-Source and Closed-Source AI Intensifies
ACT II: Tiny Titans - Small, but Mighty. More Versatile, Smaller, and Smarter: 3 Trends of the Next AI Evolution
ACT III: AI at Your Fingertips. Agentic AI: Rise of the Agents ACT IV: Not Quite Human, But Almost There. Artificial General Intelligence (AGI) and the Unresolved Path to Human-Level AI
The report concludes with an EPILOGUE: The AI Storm – Infinite Impact. Case Studies from Inside the Eye of the Typhoon—featuring real-world case studies from SCBX’s use of the “Typhoon” the group’s AI Engine across various business units.
As the AI currensurges forward, this report aims to serve not just as a forecast— but as a strategic beacon for those ready to ride the wave and lead
At the end of 2022, OpenAI’s launch of ChatGPT marked a defining moment— the world was introduced to Generative AI (Gen AI), and everything changed.
What once felt like a distant frontier suddenly became a present-day force. AI rapidly embedded itself into both personal routines and enterprise strategies, emerging as a powerful game-changer—streamlining lives, unlocking new efficiencies, and transforming how organizations operate.
In pursuit of competitive advantage, businesses across sectors are now racing to understand, adopt, and innovate with AI.
SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence is designed to be a lighthouse amid this accelerating wave—offering clarity and direction as leaders navigate the rising tides of technological disruption. This report explores the defining AI trends shaping the year ahead and provides a strategic lens for turning uncertainty into opportunity.
The report is divided into four acts, each highlighting a major force reshaping the AI landscape:
ACT I: Two Philosophies, One Future. The Battle Between Open-Source and Closed-Source AI Intensifies
ACT II: Tiny Titans - Small, but Mighty. More Versatile, Smaller, and Smarter: 3 Trends of the Next AI Evolution
ACT III: AI at Your Fingertips. Agentic AI: Rise of the Agents ACT IV: Not Quite Human, But Almost There. Artificial General Intelligence (AGI) and the Unresolved Path to Human-Level AI
The report concludes with an EPILOGUE: The AI Storm – Infinite Impact. Case Studies from Inside the Eye of the Typhoon—featuring real-world case studies from SCBX’s use of the “Typhoon” the group’s AI Engine across various business units.
As the AI currensurges forward, this report aims to serve not just as a forecast— but as a strategic beacon for those ready to ride the wave and lead
plaintext
GPT4o:
เมื่อสิ้นปี 2022 การเปิดตัว ChatGPT ของ OpenAI ได้สร้างช่วงเวลาสำคัญ—โลกได้รู้จักกับ Generative AI (Gen AI) และทุกอย่างก็เปลี่ยนไป สิ่งที่เคยรู้สึกว่าเป็นขอบเขตที่ห่างไกลกลับกลายเป็นพลังที่มีอยู่ในปัจจุบัน AI ได้ฝังตัวอย่างรวดเร็วในทั้งกิจวัตรส่วนตัวและกลยุทธ์องค์กร กลายเป็นผู้เปลี่ยนเกมที่ทรงพลัง—ทำให้ชีวิตง่ายขึ้น ปลดล็อกประสิทธิภาพใหม่ ๆ และเปลี่ยนแปลงวิธีการดำเนินงานขององค์กร ในการแสวงหาความได้เปรียบทางการแข่งขัน ธุรกิจในทุกภาคส่วนกำลังเร่งทำความเข้าใจ นำไปใช้ และนวัตกรรมด้วย AI
SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence ถูกออกแบบมาให้เป็นประภาคารท่ามกลางคลื่นที่เร่งตัวนี้—เสนอความชัดเจนและทิศทางเมื่อผู้นำต้องเผชิญกับกระแสการเปลี่ยนแปลงทางเทคโนโลยี รายงานนี้สำรวจแนวโน้ม AI ที่กำหนดทิศทางของปีข้างหน้าและให้มุมมองเชิงกลยุทธ์ในการเปลี่ยนความไม่แน่นอนให้เป็นโอกาส รายงานแบ่งออกเป็นสี่บท แต่ละบทเน้นพลังสำคัญที่กำลังเปลี่ยนแปลงภูมิทัศน์ AI:
บทที่ 1: สองปรัชญา หนึ่งอนาคต การต่อสู้ระหว่าง AI แบบเปิดและปิดเข้มข้นขึ้น บทที่ 2: ไททันเล็ก ๆ - เล็กแต่ทรงพลัง อเนกประสงค์กว่า เล็กกว่า และฉลาดกว่า: 3 แนวโน้มของวิวัฒนาการ AI ถัดไป บทที่ 3: AI ที่ปลายนิ้วของคุณ Agentic AI: การขึ้นของตัวแทน บทที่ 4: ไม่ค่อยเป็นมนุษย์ แต่เกือบจะถึงแล้ว ปัญญาประดิษฐ์ทั่วไป (AGI) และเส้นทางที่ยังไม่ชัดเจนสู่ AI ระดับมนุษย์
รายงานสรุปด้วยบทส่งท้าย: พายุ AI – ผลกระทบไม่สิ้นสุด กรณีศึกษาจากภายในตาพายุ—นำเสนอกรณีศึกษาจริงจากการใช้ “Typhoon” เครื่องยนต์ AI ของกลุ่ม SCBX ในหน่วยธุรกิจต่าง ๆ เมื่อกระแส AI ก้าวไปข้างหน้า รายงานนี้มีเป้าหมายที่จะไม่เพียงแค่เป็นการพยากรณ์—แต่เป็นประภาคารเชิงกลยุทธ์สำหรับผู้ที่พร้อมจะขี่คลื่นและเป็นผู้นำ
เมื่อสิ้นปี 2022 การเปิดตัว ChatGPT ของ OpenAI ได้สร้างช่วงเวลาสำคัญ—โลกได้รู้จักกับ Generative AI (Gen AI) และทุกอย่างก็เปลี่ยนไป สิ่งที่เคยรู้สึกว่าเป็นขอบเขตที่ห่างไกลกลับกลายเป็นพลังที่มีอยู่ในปัจจุบัน AI ได้ฝังตัวอย่างรวดเร็วในทั้งกิจวัตรส่วนตัวและกลยุทธ์องค์กร กลายเป็นผู้เปลี่ยนเกมที่ทรงพลัง—ทำให้ชีวิตง่ายขึ้น ปลดล็อกประสิทธิภาพใหม่ ๆ และเปลี่ยนแปลงวิธีการดำเนินงานขององค์กร ในการแสวงหาความได้เปรียบทางการแข่งขัน ธุรกิจในทุกภาคส่วนกำลังเร่งทำความเข้าใจ นำไปใช้ และนวัตกรรมด้วย AI
SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence ถูกออกแบบมาให้เป็นประภาคารท่ามกลางคลื่นที่เร่งตัวนี้—เสนอความชัดเจนและทิศทางเมื่อผู้นำต้องเผชิญกับกระแสการเปลี่ยนแปลงทางเทคโนโลยี รายงานนี้สำรวจแนวโน้ม AI ที่กำหนดทิศทางของปีข้างหน้าและให้มุมมองเชิงกลยุทธ์ในการเปลี่ยนความไม่แน่นอนให้เป็นโอกาส รายงานแบ่งออกเป็นสี่บท แต่ละบทเน้นพลังสำคัญที่กำลังเปลี่ยนแปลงภูมิทัศน์ AI:
บทที่ 1: สองปรัชญา หนึ่งอนาคต การต่อสู้ระหว่าง AI แบบเปิดและปิดเข้มข้นขึ้น บทที่ 2: ไททันเล็ก ๆ - เล็กแต่ทรงพลัง อเนกประสงค์กว่า เล็กกว่า และฉลาดกว่า: 3 แนวโน้มของวิวัฒนาการ AI ถัดไป บทที่ 3: AI ที่ปลายนิ้วของคุณ Agentic AI: การขึ้นของตัวแทน บทที่ 4: ไม่ค่อยเป็นมนุษย์ แต่เกือบจะถึงแล้ว ปัญญาประดิษฐ์ทั่วไป (AGI) และเส้นทางที่ยังไม่ชัดเจนสู่ AI ระดับมนุษย์
รายงานสรุปด้วยบทส่งท้าย: พายุ AI – ผลกระทบไม่สิ้นสุด กรณีศึกษาจากภายในตาพายุ—นำเสนอกรณีศึกษาจริงจากการใช้ “Typhoon” เครื่องยนต์ AI ของกลุ่ม SCBX ในหน่วยธุรกิจต่าง ๆ เมื่อกระแส AI ก้าวไปข้างหน้า รายงานนี้มีเป้าหมายที่จะไม่เพียงแค่เป็นการพยากรณ์—แต่เป็นประภาคารเชิงกลยุทธ์สำหรับผู้ที่พร้อมจะขี่คลื่นและเป็นผู้นำ
plaintext
Typhoon Translate:
เมื่อสิ้นปี 2022 การเปิดตัว ChatGPT ของ OpenAI ถือเป็นจุดเปลี่ยนสำคัญ—โลกได้รู้จักกับ Generative AI (Gen AI) และทุกอย่างก็เปลี่ยนไป สิ่งที่เคยรู้สึกเหมือน frontier ไกลๆ กลายเป็นพลังในปัจจุบัน AI ถูกฝังตัวอย่างรวดเร็วทั้งในกิจวัตรส่วนตัวและกลยุทธ์องค์กร กลายเป็นตัวเปลี่ยนเกมอันทรงพลัง—ช่วยยกระดับชีวิต ปลดล็อกประสิทธิภาพใหม่ๆ และเปลี่ยนวิธีที่องค์กรดำเนินงาน ในการแสวงหาความได้เปรียบเชิงแข่งขัน ธุรกิจในหลากหลายภาคส่วนต่างเร่งทำความเข้าใจ นำไปใช้ และสร้างนวัตกรรมด้วย AI
SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence ถูกออกแบบมาเป็นประภาคารท่ามกลางคลื่นที่เร่งตัวขึ้นนี้—มอบความชัดเจนและทิศทางให้ผู้นำรับมือกับกระแสการเปลี่ยนแปลงทางเทคโนโลยี รายงานนี้สำรวจแนวโน้ม AI ที่กำลังกำหนดทิศทางในปีข้างหน้า และนำเสนอมุมมองเชิงกลยุทธ์ในการเปลี่ยนความไม่แน่นอนให้เป็นโอกาส รายงานแบ่งออกเป็นสี่ส่วน (Acts) แต่ละส่วนเน้นพลังสำคัญที่กำลังเปลี่ยนภูมิทัศน์ AI:
ACT I: Two Philosophies, One Future. The Battle Between Open-Source and Closed-Source AI Intensifies
ACT II: Tiny Titans - Small, but Mighty. More Versatile, Smaller, and Smarter: 3 Trends of the Next AI Evolution
ACT III: AI at Your Fingertips. Agentic AI: Rise of the Agents
ACT IV: Not Quite Human, But Almost There. Artificial General Intelligence (AGI) and the Unresolved Path to Human-Level AI
รายงานปิดท้ายด้วย EPILOGUE: The AI Storm – Infinite Impact พร้อม Case Studies จากภายในดวงตาของพายุไต้ฝุ่น—นำเสนอกรณีศึกษาจริงจาก SCBX ในการใช้ AI Engine “Typhoon” ของกลุ่มในหน่วยธุรกิจต่างๆ ขณะที่กระแส AI กำลังก้าวไปข้างหน้า รายงานนี้จึงไม่ได้เป็นเพียงการคาดการณ์ แต่เป็นประภาคารเชิงกลยุทธ์สำหรับผู้พร้อมจะก้าวขึ้นไปกับคลื่นและเป็นผู้นำในอนาคต
เมื่อสิ้นปี 2022 การเปิดตัว ChatGPT ของ OpenAI ถือเป็นจุดเปลี่ยนสำคัญ—โลกได้รู้จักกับ Generative AI (Gen AI) และทุกอย่างก็เปลี่ยนไป สิ่งที่เคยรู้สึกเหมือน frontier ไกลๆ กลายเป็นพลังในปัจจุบัน AI ถูกฝังตัวอย่างรวดเร็วทั้งในกิจวัตรส่วนตัวและกลยุทธ์องค์กร กลายเป็นตัวเปลี่ยนเกมอันทรงพลัง—ช่วยยกระดับชีวิต ปลดล็อกประสิทธิภาพใหม่ๆ และเปลี่ยนวิธีที่องค์กรดำเนินงาน ในการแสวงหาความได้เปรียบเชิงแข่งขัน ธุรกิจในหลากหลายภาคส่วนต่างเร่งทำความเข้าใจ นำไปใช้ และสร้างนวัตกรรมด้วย AI
SCBX AI Outlook 2025: Beaconing the Future of Artificial Intelligence ถูกออกแบบมาเป็นประภาคารท่ามกลางคลื่นที่เร่งตัวขึ้นนี้—มอบความชัดเจนและทิศทางให้ผู้นำรับมือกับกระแสการเปลี่ยนแปลงทางเทคโนโลยี รายงานนี้สำรวจแนวโน้ม AI ที่กำลังกำหนดทิศทางในปีข้างหน้า และนำเสนอมุมมองเชิงกลยุทธ์ในการเปลี่ยนความไม่แน่นอนให้เป็นโอกาส รายงานแบ่งออกเป็นสี่ส่วน (Acts) แต่ละส่วนเน้นพลังสำคัญที่กำลังเปลี่ยนภูมิทัศน์ AI:
ACT I: Two Philosophies, One Future. The Battle Between Open-Source and Closed-Source AI Intensifies
ACT II: Tiny Titans - Small, but Mighty. More Versatile, Smaller, and Smarter: 3 Trends of the Next AI Evolution
ACT III: AI at Your Fingertips. Agentic AI: Rise of the Agents
ACT IV: Not Quite Human, But Almost There. Artificial General Intelligence (AGI) and the Unresolved Path to Human-Level AI
รายงานปิดท้ายด้วย EPILOGUE: The AI Storm – Infinite Impact พร้อม Case Studies จากภายในดวงตาของพายุไต้ฝุ่น—นำเสนอกรณีศึกษาจริงจาก SCBX ในการใช้ AI Engine “Typhoon” ของกลุ่มในหน่วยธุรกิจต่างๆ ขณะที่กระแส AI กำลังก้าวไปข้างหน้า รายงานนี้จึงไม่ได้เป็นเพียงการคาดการณ์ แต่เป็นประภาคารเชิงกลยุทธ์สำหรับผู้พร้อมจะก้าวขึ้นไปกับคลื่นและเป็นผู้นำในอนาคต
plaintext
Example 3: Technical Reports
Input:
To continue our commitment in advancing Thai foundation models, this work introduces a new series of state-of-the-art Thai language and multimodal models, Typhoon2. Following our previous releases, these models are optimized for Thai and English, building on open-source models such as Llama 3 and Qwen2.5.
The text models, Typhoon2-Text, are improved over Typhoon 1.5 in various aspects, including data filtering techniques for pretraining, complex instruction data development for improved post-training, long context, and function calling capabilities of the models.
These text models are also now available in a range of sizes, consisting of 1B, 3B, 7B, 8B, and 70B parameters. We offer both pre-trained and instruction-tuned variants for each size.
In addition, we introduce Typhoon2-Safety a safety text classifier designed to detect Thai-sensitive content and enhance the security of LM-integrated systems. Furthermore, the Typhoon2 series is multimodal.
The vision model, Typhoon2-Vision, builds on the first Typhoon-Vision model by enhancing Thai document understanding capabilities, such as optical character recognition (OCR).
The audio model, Typhoon2-Audio, extends the first Typhoon-Audio model, evolving into an end-to-end speech processing and generation model capable of understanding audio, speech, and text, while generating text and speech outputs in parallel.
This report provides details and insights from our development. We make the weights of all models publicly available on Hugging Face Hub where the summary of our release is shown in Table 1.
To continue our commitment in advancing Thai foundation models, this work introduces a new series of state-of-the-art Thai language and multimodal models, Typhoon2. Following our previous releases, these models are optimized for Thai and English, building on open-source models such as Llama 3 and Qwen2.5.
The text models, Typhoon2-Text, are improved over Typhoon 1.5 in various aspects, including data filtering techniques for pretraining, complex instruction data development for improved post-training, long context, and function calling capabilities of the models.
These text models are also now available in a range of sizes, consisting of 1B, 3B, 7B, 8B, and 70B parameters. We offer both pre-trained and instruction-tuned variants for each size.
In addition, we introduce Typhoon2-Safety a safety text classifier designed to detect Thai-sensitive content and enhance the security of LM-integrated systems. Furthermore, the Typhoon2 series is multimodal.
The vision model, Typhoon2-Vision, builds on the first Typhoon-Vision model by enhancing Thai document understanding capabilities, such as optical character recognition (OCR).
The audio model, Typhoon2-Audio, extends the first Typhoon-Audio model, evolving into an end-to-end speech processing and generation model capable of understanding audio, speech, and text, while generating text and speech outputs in parallel.
This report provides details and insights from our development. We make the weights of all models publicly available on Hugging Face Hub where the summary of our release is shown in Table 1.
plaintext
GPT4o:
เพื่อสานต่อความมุ่งมั่นในการพัฒนารูปแบบพื้นฐานของภาษาไทย งานนี้ได้แนะนำซีรีส์ใหม่ของโมเดลภาษาไทยและมัลติโหมดที่ทันสมัยที่สุด Typhoon2 ตามการเปิดตัวก่อนหน้านี้ โมเดลเหล่านี้ได้รับการปรับให้เหมาะสมสำหรับภาษาไทยและอังกฤษ โดยสร้างขึ้นจากโมเดลโอเพนซอร์ส เช่น Llama 3 และ Qwen2.5
โมเดลข้อความ Typhoon2-Text ได้รับการพัฒนาให้ดียิ่งขึ้นจาก Typhoon 1.5 ในหลายด้าน รวมถึงเทคนิคการกรองข้อมูลสำหรับการฝึกอบรมเบื้องต้น การพัฒนาข้อมูลคำสั่งที่ซับซ้อนเพื่อปรับปรุงการฝึกอบรมหลังการฝึก ความสามารถในการจัดการบริบทยาว และการเรียกใช้ฟังก์ชัน โมเดลข้อความเหล่านี้มีให้เลือกในหลายขนาด ประกอบด้วย 1B, 3B, 7B, 8B และ 70B พารามิเตอร์ เรามีทั้งเวอร์ชันที่ฝึกอบรมล่วงหน้าและปรับแต่งคำสั่งสำหรับแต่ละขนาด
นอกจากนี้ เรายังแนะนำ Typhoon2-Safety ซึ่งเป็นตัวจำแนกข้อความเพื่อความปลอดภัยที่ออกแบบมาเพื่อตรวจจับเนื้อหาที่ละเอียดอ่อนของไทยและเพิ่มความปลอดภัยของระบบที่รวม LM เข้าด้วยกัน
นอกจากนี้ ซีรีส์ Typhoon2 ยังเป็นมัลติโหมด โมเดลวิชั่น Typhoon2-Vision ได้พัฒนาจากโมเดล Typhoon-Vision รุ่นแรกโดยเพิ่มความสามารถในการเข้าใจเอกสารภาษาไทย เช่น การรู้จำอักขระด้วยแสง (OCR)
โมเดลเสียง Typhoon2-Audio ได้ขยายจากโมเดล Typhoon-Audio รุ่นแรก พัฒนาเป็นโมเดลการประมวลผลและสร้างเสียงแบบครบวงจรที่สามารถเข้าใจเสียง คำพูด และข้อความ พร้อมสร้างผลลัพธ์ข้อความและคำพูดไปพร้อมกัน
รายงานนี้ให้รายละเอียดและข้อมูลเชิงลึกจากการพัฒนาของเรา เราเปิดเผยน้ำหนักของโมเดลทั้งหมดบน Hugging Face Hub ซึ่งสรุปการเปิดตัวของเราแสดงในตารางที่ 1
เพื่อสานต่อความมุ่งมั่นในการพัฒนารูปแบบพื้นฐานของภาษาไทย งานนี้ได้แนะนำซีรีส์ใหม่ของโมเดลภาษาไทยและมัลติโหมดที่ทันสมัยที่สุด Typhoon2 ตามการเปิดตัวก่อนหน้านี้ โมเดลเหล่านี้ได้รับการปรับให้เหมาะสมสำหรับภาษาไทยและอังกฤษ โดยสร้างขึ้นจากโมเดลโอเพนซอร์ส เช่น Llama 3 และ Qwen2.5
โมเดลข้อความ Typhoon2-Text ได้รับการพัฒนาให้ดียิ่งขึ้นจาก Typhoon 1.5 ในหลายด้าน รวมถึงเทคนิคการกรองข้อมูลสำหรับการฝึกอบรมเบื้องต้น การพัฒนาข้อมูลคำสั่งที่ซับซ้อนเพื่อปรับปรุงการฝึกอบรมหลังการฝึก ความสามารถในการจัดการบริบทยาว และการเรียกใช้ฟังก์ชัน โมเดลข้อความเหล่านี้มีให้เลือกในหลายขนาด ประกอบด้วย 1B, 3B, 7B, 8B และ 70B พารามิเตอร์ เรามีทั้งเวอร์ชันที่ฝึกอบรมล่วงหน้าและปรับแต่งคำสั่งสำหรับแต่ละขนาด
นอกจากนี้ เรายังแนะนำ Typhoon2-Safety ซึ่งเป็นตัวจำแนกข้อความเพื่อความปลอดภัยที่ออกแบบมาเพื่อตรวจจับเนื้อหาที่ละเอียดอ่อนของไทยและเพิ่มความปลอดภัยของระบบที่รวม LM เข้าด้วยกัน
นอกจากนี้ ซีรีส์ Typhoon2 ยังเป็นมัลติโหมด โมเดลวิชั่น Typhoon2-Vision ได้พัฒนาจากโมเดล Typhoon-Vision รุ่นแรกโดยเพิ่มความสามารถในการเข้าใจเอกสารภาษาไทย เช่น การรู้จำอักขระด้วยแสง (OCR)
โมเดลเสียง Typhoon2-Audio ได้ขยายจากโมเดล Typhoon-Audio รุ่นแรก พัฒนาเป็นโมเดลการประมวลผลและสร้างเสียงแบบครบวงจรที่สามารถเข้าใจเสียง คำพูด และข้อความ พร้อมสร้างผลลัพธ์ข้อความและคำพูดไปพร้อมกัน
รายงานนี้ให้รายละเอียดและข้อมูลเชิงลึกจากการพัฒนาของเรา เราเปิดเผยน้ำหนักของโมเดลทั้งหมดบน Hugging Face Hub ซึ่งสรุปการเปิดตัวของเราแสดงในตารางที่ 1
plaintext
Typhoon Translate:
เพื่อสานต่อความมุ่งมั่นในการพัฒนาโมเดลภาษาไทยขั้นสูง ผลงานชิ้นนี้จึงนำเสนอชุดโมเดลภาษาไทยและโมเดลมัลติโมดัลรุ่นใหม่ชื่อ Typhoon2 ซึ่งต่อยอดจากโมเดลก่อนหน้าของเรา โมเดลเหล่านี้ได้รับการปรับแต่งให้เหมาะสมกับภาษาไทยและภาษาอังกฤษ โดยพัฒนาบนพื้นฐานของโมเดลโอเพนซอร์สอย่าง Llama 3 และ Qwen2.5
โมเดลข้อความ Typhoon2-Text มีการพัฒนาขึ้นจาก Typhoon 1.5 ในหลายด้าน เช่น เทคนิคการกรองข้อมูลสำหรับการ pretraining, การพัฒนาข้อมูลคำสั่งที่ซับซ้อนเพื่อปรับปรุงประสิทธิภาพหลังการฝึกอบรม (post-training), ความสามารถในการจัดการ context ที่ยาวขึ้น และฟังก์ชัน calling ของโมเดล โมเดลข้อความเหล่านี้ยังมีให้เลือกในหลากหลายขนาด ได้แก่ 1B, 3B, 7B, 8B และ 70B พารามิเตอร์ เรามีทั้งเวอร์ชัน pre-trained และ instruction-tuned สำหรับแต่ละขนาด
นอกจากนี้ เรายังแนะนำ Typhoon2-Safety ซึ่งเป็น safety text classifier ออกแบบมาเพื่อตรวจจับเนื้อหาที่ละเอียดอ่อนในภาษาไทย และเพิ่มความปลอดภัยให้กับระบบที่ผสานรวม LM
นอกจากนี้ Typhoon2 ยังเป็นมัลติโมดัล โมเดลด้านภาพ Typhoon2-Vision ต่อยอดจากโมเดล Typhoon-Vision รุ่นแรก โดยเพิ่มความสามารถในการทำความเข้าใจเอกสารภาษาไทย เช่น optical character recognition (OCR)
โมเดลด้านเสียง Typhoon2-Audio ขยายจากโมเดล Typhoon-Audio รุ่นแรก กลายเป็นโมเดล end-to-end speech processing และ speech generation ที่สามารถเข้าใจเสียง คำพูด และข้อความ พร้อมทั้งสร้างข้อความและเสียงเอาต์พุตแบบ parallel
รายงานฉบับนี้ให้รายละเอียดและข้อมูลเชิงลึกจากการพัฒนาของเรา โดยเราได้เปิดเผย weights ของโมเดลทั้งหมดให้สาธารณชนเข้าถึงได้บน Hugging Face Hub ซึ่งสรุปข้อมูลการ release ของเราแสดงไว้ใน Table 1
เพื่อสานต่อความมุ่งมั่นในการพัฒนาโมเดลภาษาไทยขั้นสูง ผลงานชิ้นนี้จึงนำเสนอชุดโมเดลภาษาไทยและโมเดลมัลติโมดัลรุ่นใหม่ชื่อ Typhoon2 ซึ่งต่อยอดจากโมเดลก่อนหน้าของเรา โมเดลเหล่านี้ได้รับการปรับแต่งให้เหมาะสมกับภาษาไทยและภาษาอังกฤษ โดยพัฒนาบนพื้นฐานของโมเดลโอเพนซอร์สอย่าง Llama 3 และ Qwen2.5
โมเดลข้อความ Typhoon2-Text มีการพัฒนาขึ้นจาก Typhoon 1.5 ในหลายด้าน เช่น เทคนิคการกรองข้อมูลสำหรับการ pretraining, การพัฒนาข้อมูลคำสั่งที่ซับซ้อนเพื่อปรับปรุงประสิทธิภาพหลังการฝึกอบรม (post-training), ความสามารถในการจัดการ context ที่ยาวขึ้น และฟังก์ชัน calling ของโมเดล โมเดลข้อความเหล่านี้ยังมีให้เลือกในหลากหลายขนาด ได้แก่ 1B, 3B, 7B, 8B และ 70B พารามิเตอร์ เรามีทั้งเวอร์ชัน pre-trained และ instruction-tuned สำหรับแต่ละขนาด
นอกจากนี้ เรายังแนะนำ Typhoon2-Safety ซึ่งเป็น safety text classifier ออกแบบมาเพื่อตรวจจับเนื้อหาที่ละเอียดอ่อนในภาษาไทย และเพิ่มความปลอดภัยให้กับระบบที่ผสานรวม LM
นอกจากนี้ Typhoon2 ยังเป็นมัลติโมดัล โมเดลด้านภาพ Typhoon2-Vision ต่อยอดจากโมเดล Typhoon-Vision รุ่นแรก โดยเพิ่มความสามารถในการทำความเข้าใจเอกสารภาษาไทย เช่น optical character recognition (OCR)
โมเดลด้านเสียง Typhoon2-Audio ขยายจากโมเดล Typhoon-Audio รุ่นแรก กลายเป็นโมเดล end-to-end speech processing และ speech generation ที่สามารถเข้าใจเสียง คำพูด และข้อความ พร้อมทั้งสร้างข้อความและเสียงเอาต์พุตแบบ parallel
รายงานฉบับนี้ให้รายละเอียดและข้อมูลเชิงลึกจากการพัฒนาของเรา โดยเราได้เปิดเผย weights ของโมเดลทั้งหมดให้สาธารณชนเข้าถึงได้บน Hugging Face Hub ซึ่งสรุปข้อมูลการ release ของเราแสดงไว้ใน Table 1
plaintext
Thai-to-English Translation Demos
Example 1: Fiction
The result from Typhoon Translate and GPT-4o are similar in this example.
Example 2: Professional Reports
Example 3: Technical Reports