โปรดอัพเดตเบราว์เซอร์

เบราว์เซอร์ที่คุณใช้เป็นเวอร์ชันเก่าซึ่งไม่สามารถใช้บริการของเราได้ เราขอแนะนำให้อัพเดตเบราว์เซอร์เพื่อการใช้งานที่ดีที่สุด

ธุรกิจ-เศรษฐกิจ

SCB10X เปิดตัว "Typhoon" โมเดลGenAI ภาษาไทยโดยเฉพาะ คนไทยใช้งานได้ไม่ติดขัดเรื่องภาษาอีกต่อไป

Thairath Money

อัพเดต 30 ม.ค. 2567 เวลา 04.58 น. • เผยแพร่ 30 ม.ค. 2567 เวลา 04.58 น.
ภาพไฮไลต์

SCB 10X บริษัทภายใต้กลุ่มเอสซีบี เอกซ์ (SCBX Group) เปิดตัว "ไต้ฝุ่น” (Typhoon) โมเดลประมวลภาษาขนาดใหญ่ที่พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะ (Large Language Model optimized for Thai) ซึ่งถูกออกแบบมาเพื่อแก้ไขปัญหาช่องว่างทางภาษาที่โมเดล GenAI ในปัจจุบันถูกเทรนด์ด้วยภาษาอังกฤษ ทำให้การใช้งานให้ได้ประสิทธิภาพมากที่สุดจำเป็นต้องใช้เพียงภาษาอังกฤษเท่านั้น

ทั้งนี้ "Typhoon" ถูกออกแบบมาเป็นโมเดลโอเพนซอร์ส และเปิดให้ได้ทดลองใช้ Typhoon-7B ในเวอร์ชัน Pretrained model และเวอร์ชัน Instruction-tuned model ผ่าน API service อย่างไม่มีค่าใช้จ่าย

  • Pretrained Model ซึ่งเปรียบเสมือนการสอนให้โมเดลเรียนรู้ภาษาไทย ไม่ว่าจะเป็นคลังคำศัพท์ บริบท หรือวัฒนธรรมของภาษาไทย รวมถึงความรู้ทั่วไปที่เกิดขึ้นทั่วโลก
  • Instruction-tuned Model ซึ่งเปรียบเสมือนการสอนต่ออีกขั้นหนึ่ง ให้โมเดลสามารถสื่อสารสิ่งที่เข้าใจจากขั้นตอนการ Pretraining ตามคำสั่งที่ป้อนเข้าไปได้ เช่น การแปล การสรุปความ หรือการตอบคำถาม เป็นต้น ซึ่งผลการทดลองในชุดข้อสอบภาษาไทยแสดงให้เห็นว่า Typhoon มีประสิทธิภาพเหนือกว่าโมเดลภาษาไทยที่เผยแพร่สาธารณะอยู่ทั้งหมด

SCB 10X เปิดเผยว่า โมเดล "Typhoon" ใช้ข้อมูลในการเทรนด์เพียง 7 พันล้านพารามิเตอร์ และมีประสิทธิภาพมากกว่า 2.62 เท่าในการอ่านข้อความภาษาไทย และมีประสิทธิภาพเทียบเท่าได้กับ GPT-3.5 ในเวอร์ชันภาษาไทย โดยวัดจาก Benchmark ที่รวบรวมและจัดเตรียมมาจากข้อสอบภาษาไทยความยากเทียบเท่าข้อสอบมัธยมปลายและข้อสอบมาตรฐานอื่นๆ ในประเทศไทย

นอกจากนี้"Typhoon" โมเดลภาษาไทยขนาดใหญ่ ถือเป็นก้าวสำคัญในการพัฒนาโมเดลภาษา AI สำหรับภาษาไทยที่จะลดข้อจำกัดด้านทรัพยากรของภาษาไทยที่ไม่มีข้อมูลมากเพียงพอ (Low Resource Language) ซึ่งจะเป็นส่วนสำคัญในการเพิ่มขีดความสามารถด้านการแข่งขันให้แก่อุตสาหกรรม AI ของไทย และเปิดโอกาสใหม่ๆ สำหรับการใช้งานทางภาษาที่หลากหลาย

โดย SCB 10X เปิดให้ผู้สนใจและนักพัฒนาได้ทดลองใช้ Typhoon-7B ในเวอร์ชัน Pretrained model ภายใต้ใบอนุญาต Apache 2.0 อย่างไม่มีค่าใช้จ่าย โดยสามารถดาวน์โหลดได้ที่ https://huggingface.co/scb10x/typhoon-7b

ซึ่งมีรายงานเชิงเทคนิคประกอบ สามารถอ่านเพิ่มเติมได้ที่ https://arxiv.org/abs/2312.13951

อ่านข่าวต้นฉบับได้ที่ : SCB10X เปิดตัว "Typhoon" โมเดลGenAI ภาษาไทยโดยเฉพาะ คนไทยใช้งานได้ไม่ติดขัดเรื่องภาษาอีกต่อไป

ข่าวอื่นที่เกี่ยวข้อง

ตามข่าวก่อนใครได้ที่
- Website : Thairath Money
- LINE Official : Thairath

ดูข่าวต้นฉบับ
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...