ม.ขอนแก่น พัฒนา AI “เว้าจา” แปลงข้อความเป็นเสียงพูดอีสาน ที่แรกของไทย นำร่องใช้บนรถขนส่งสาธารณะขอนแก่นซิตี้บัส สร้างอัตลักษณ์ชูความเป็นอีสาน-อนุรักษ์ภาษาพื้นถิ่นด้วยเทคโนโลยี
วันที่ 7 มิถุนายน 2566 ดร.พงษ์ศธร จันทร์ยอย อาจารย์วิทยาลัยการคอมพิวเตอร์ มหาวิทยาลัยขอนแก่น เปิดเผยว่าการพัฒนาปัญญาประดิษฐ์ หรือ AI ตกอยู่ในความสนใจของทั่วโลก หลังเกิดเครื่องมือช่วยอำนวยความสะดวกมนุษย์มากมาย ทั้งการแปลงเสียงเป็นข้อความ แปลงข้อความเป็นภาพ หรือแปลงข้อความเป็นเสียง แต่ส่วนใหญ่ยังคงเป็นการใช้งานและสื่อสารด้วยภาษาอังกฤษ และภาษาไทย
“เด็กอีสานสมัยนี้ บางคนแทบจะพูดภาษาอีสานไม่ได้ เราอยากจะใช้เทคโนโลยีที่วิจัยมาเป็นส่วนหนึ่งในการอนุรักษ์ภาษาถิ่นให้คงอยู่”
แนวคิดนี้กลายเป็นจุดเริ่มต้นงานวิจัย “เว้าจา” ที่ศึกษา ค้นคว้า และวิจัยการประมวลผลภาษาธรรมชาติและเสียง (Natural Language and Speech Processing : NLSP) ซึ่งเป็นแขนงหนึ่งของปัญญาประดิษฐ์ที่จะช่วยให้คอมพิวเตอร์สามารถเข้าใจภาษามนุษย์หรือภาษาธรรมชาติได้ จนเกิดเป็น AI แปลงข้อความเป็นเสียงภาษาอีสานขึ้นเพื่ออนุรักษ์รากทางวัฒนธรรมและภาษาถิ่นให้คงอยู่ด้วยเทคโนโลยี
การวิจัยเริ่มตั้งแต่ช่วงปริญญาโทและปริญญาเอก เริ่มต้นด้วยการเก็บฐานข้อมูลเสียงภาษาอีสานตอนกลางจากเจ้าของภาษา (Native Speaker) มากกว่า 5,000 ประโยค ความยาวรวมกว่า 6 ชั่วโมง ซึ่งใช้เวลาเก็บข้อมูลหลายเดือน เพื่อนำมาเข้าสู่การแทนเสียงด้วยแบบจำลองทางสถิติ ให้สามารถสังเคราะห์เสียงได้เป็นธรรมชาติ เกิดเป็น AI แปลงเสียงเวอร์ชั่นแรก
ก่อนจะพัฒนามาเป็น เวอร์ชั่น 2 หรือเว้าจา ในปัจจุบัน ที่ใช้เทคโนโลยี Deep Learning ให้ AI สามารถแปลงข้อความเป็นการออกเสียงภาษาอีสานได้สมบูรณ์ ถูกต้อง และสมจริงมากขึ้น รวมถึงเพิ่มเติมเสียงผู้หญิงเข้ามาให้ได้เลือกใช้งานกัน
“เว้าจา ใช้งานง่าย ๆ เพียงพิมพ์คำอ่านภาษาอีสานลงไป AI จะสังเคราะห์เสียงภาษาอีสานทันที สามารถนำไปประยุกต์ใช้ประโยชน์ได้หลากหลาย ล่าสุด รถขอนแก่นซิตี้บัส ก็นำเว้าจาไปใช้เป็นเสียงประกาศแจ้งจุดจอดตลอดเส้นทาง กลายเป็น Signature ขนส่งสาธารณะของขอนแก่นให้นักท่องเที่ยวหรือผู้ใช้บริการประทับใจ”
ขณะที่ ผศ.ดร.พุธษดี ศิริแสงตระกูล รองคณบดีฝ่ายวิชาการ วิทยาลัยการคอมพิวเตอร์ มหาวิทยาลัยขอนแก่น กล่าวเสริมว่า งานวิจัยการประมวลผลภาษาธรรมชาติและเสียงที่วิทยาลัยการคอมพิวเตอร์ มหาวิทยาลัยขอนแก่น พัฒนาขึ้นนั้นไม่ได้มีเฉพาะเว้าจาที่เป็น AI สังเคราะห์เสียงเท่านั้น แต่ยังมีการแปลภาษาด้วยเครื่องมือการสืบค้นสารสนเทศ การสังเคราะห์เสียง การรู้จำเสียงพูด การรู้จำตัวอักษรโบราณ รวมไปถึงการนำไปประยุกต์ใช้ในศาสตร์อื่น ๆ ได้
“การแปลงข้อความสังเคราะห์ออกมาเป็นเสียงนั้นเป็นประโยชน์มาก โดยเฉพาะกับกลุ่มผู้บกพร่องทางการมองเห็น จะสามารถรับรู้ข้อมูล ข่าวสารได้จากการฟัง ไม่เพียงเท่านั้น เว้าจา ยังสามารถนำไปประยุกต์ใช้งานได้กับอุตสาหกรรมต่าง ๆ ทั้งการท่องเที่ยว งานประชาสัมพันธ์ หรือการแพทย์ เพื่อรักษารากวัฒนธรรมอีสานให้อยู่คู่คนรุ่นหลังต่อไป”
สำหรับผู้ที่สนใจนำ AI “เว้าจา” ไปใช้งาน สามารถติดต่อฝ่ายวิจัยและนวัตกรรม วิทยาลัยการคอมพิวเตอร์ มหาวิทยาลัยขอนแก่นได้ ทั้งนี้ ในอนาคตจะมีการพัฒนา “เว้าจา” ให้ครบวงจรมากยิ่งขึ้น ทั้งการพิมพ์คำภาษาไทยให้สามารถออกเสียงเป็นภาษาอีสานได้ หรือแปลงเสียงเป็นข้อความ รวมถึงการแปลภาษาไทยเป็นอีสาน หรือแปลภาษาอีสานเป็นไทย และการสร้าง VOICE BOT คล้าย Siri แต่เป็นการสื่อสารภาษาไทยและอีสาน เพื่อช่วยให้ผู้คนสามารถสื่อสารกันได้อย่างเข้าใจ ก่อนจะพัฒนาไปสู่ภาษาพื้นถิ่นอื่น ๆ ต่อไป
ความเห็น 0