มักอีหลี! มข.พัฒนา AI "เว้าจา" แปลงข้อความเป็น "เสียงพูดอีสาน" ที่แรกของไทย
มักอีหลี! มข.พัฒนา AI "เว้าจา" แปลงข้อความเป็น "เสียงพูดอีสาน" ที่แรกของไทย ใช้เทคโนโลยีอนุรักษ์ภาษาถิ่น นำร่องใช้บนรถขนส่งสาธารณะ ชูความเป็นอีสาน
วันนี้ (7 มิ.ย. 66) ข้อมูลจาก มหาวิทยาลัยขอนแก่น ออกมาประกาศเปิดตัว การพัฒนาAI "เว้าจา" ที่สามารถแปลงข้อความเป็น "เสียงพูดอีสาน" สร้างอัตลักษณ์ชูความเป็นอีสาน อนุรักษ์ภาษาพื้นถิ่นด้วยเทคโนโลยี และชูความเป็นอีสาน
"เด็กอีสานสมัยนี้ บางคนแทบจะพูดภาษาอีสานไม่ได้ เราอยากจะใช้เทคโนโลยีที่วิจัยมาเป็นส่วนหนึ่งในการอนุรักษ์ภาษาถิ่นให้คงอยู่"
แนวคิดนี้กลายเป็นจุดเริ่มต้นที่ทำให้อ.ดร.พงษ์ศธร จันทร์ยอย อาจารย์วิทยาลัยการคอมพิวเตอร์ มหาวิทยาลัยขอนแก่น เจ้าของงานวิจัย “เว้าจา” ตัดสินใจศึกษา ค้นคว้า และวิจัยการประมวลผลภาษาธรรมชาติและเสียง (Natural Language and Speech Processing : NLSP)
อันเป็นแขนงหนึ่งของปัญญาประดิษฐ์ที่จะช่วยให้คอมพิวเตอร์สามารถเข้าใจภาษามนุษย์หรือภาษาธรรมชาติได้ จนเกิดเป็น AI แปลงข้อความเป็นเสียงภาษาอีสานขึ้นเพื่ออนุรักษ์รากทางวัฒนธรรมและภาษาถิ่นให้คงอยู่ด้วยเทคโนโลยี
ภาพประกอบจาก มหาวิทยาลัยขอนแก่น
การวิจัยตั้งแต่ช่วงปริญญาโทและปริญญาเอก ซึ่งมี ผศ.ดร.พุธษดี ศิริแสงตระกูล เป็นที่ปรึกษาในขณะนั้น เริ่มต้นด้วยการเก็บฐานข้อมูลเสียงภาษาอีสานตอนกลางจากเจ้าของภาษา (Native Speaker) มากกว่า 5,000 ประโยค ความยาวรวมกว่า 6 ชั่วโมง ใช้เวลาเก็บข้อมูลหลายเดือน เพื่อนำมาเข้าสู่การแทนเสียงด้วยแบบจำลองทางสถิติ ให้สามารถสังเคราะห์เสียงได้เป็นธรรมชาติ เกิดเป็น AI แปลงเสียงเวอร์ชันแรก
ก่อนจะพัฒนามาเป็น เวอร์ชัน 2 หรือ เว้าจา ในปัจจุบัน ที่ใช้เทคโนโลยี Deep Learning ให้ AI สามารถแปลงข้อความเป็นการออกเสียงภาษาอีสานได้สมบูรณ์ ถูกต้อง และสมจริงมากขึ้น รวมถึงเพิ่มเติมเสียงผู้หญิงเข้ามาให้ได้เลือกใช้งานกัน
ภาพประกอบจาก มหาวิทยาลัยขอนแก่น
ภาพประกอบจาก มหาวิทยาลัยขอนแก่น
ภาพประกอบจาก มหาวิทยาลัยขอนแก่น
"เว้าจา ใช้งานง่าย ๆเพียงพิมพ์คำอ่านภาษาอีสานลงไป AI จะสังเคราะห์เสียงภาษาอีสานทันที สามารถนำไปประยุกต์ใช้ประโยชน์ได้หลากหลาย ล่าสุด รถขอนแก่นซิตี้บัส ก็นำเว้าจาไปใช้เป็นเสียงประกาศแจ้งจุดจอดตลอดเส้นทาง กลายเป็น Signature ขนส่งสาธารณะของขอนแก่นให้นักท่องเที่ยวหรือผู้ใช้บริการประทับใจ"
ขณะที่ ผศ.ดร.พุธษดี ศิริแสงตระกูล รองคณบดีฝ่ายวิชาการ วิทยาลัยการคอมพิวเตอร์ มหาวิทยาลัยขอนแก่น เสริมว่า งานวิจัยการประมวลผลภาษาธรรมชาติและเสียงที่วิทยาลัยการคอมพิวเตอร์ มหาวิทยาลัยขอนแก่น พัฒนาขึ้นนั้นไม่ได้มีเฉพาะเว้าจาที่เป็น AI สังเคราะห์เสียงเท่านั้น
แต่ยังมีการแปลภาษาด้วยเครื่องมือการสืบค้นสารสนเทศ การสังเคราะห์เสียง การรู้จำเสียงพูด การรู้จำตัวอักษรโบราณ รวมไปถึงการนำไปประยุกต์ใช้ในศาสตร์อื่น ๆ ได้
ภาพประกอบจาก มหาวิทยาลัยขอนแก่น
"การแปลงข้อความสังเคราะห์ออกมาเป็นเสียงนั้นเป็นประโยชน์มาก โดยเฉพาะกับกลุ่มผู้บกพร่องทางการมองเห็น จะสามารถรับรู้ข้อมูล ข่าวสารได้จากการฟัง"
"ไม่เพียงเท่านั้น เว้าจา ยังสามารถนำไปประยุกต์ใช้งานได้กับอุตสาหกรรมต่าง ๆ ทั้งการท่องเที่ยว งานประชาสัมพันธ์ หรือการแพทย์ เพื่อรักษารากวัฒนธรรมอีสานให้อยู่คู่คนรุ่นหลังต่อไป"
สำหรับผู้ที่สนใจนำ AI "เว้าจา" ไปใช้งาน สามารถติดต่อฝ่ายวิจัยและนวัตกรรม วิทยาลัยการคอมพิวเตอร์ มหาวิทยาลัยขอนแก่นได้
ภาพประกอบจาก มหาวิทยาลัยขอนแก่น
ทั้งนี้ ในอนาคตจะมีการพัฒนา “เว้าจา” ให้ครบวงจรมากยิ่งขึ้น ทั้งการพิมพ์คำภาษาไทยให้สามารถออกเสียงเป็นภาษาอีสานได้ หรือแปลงเสียงเป็นข้อความ
รวมถึงการแปลภาษาไทยเป็นอีสาน หรือแปลภาษาอีสานเป็นไทย และการสร้าง VOICE BOT คล้าย Siri แต่เป็นการสื่อสารภาษาไทยและอีสาน เพื่อช่วยให้ผู้คนสามารถสื่อสารกันได้อย่างเข้าใจ ก่อนจะพัฒนาไปสู่ภาษาพื้นถิ่นอื่น ๆ ต่อไป
ที่มา : มหาวิทยาลัยขอนแก่น