Turing Award 2024: Andrew G. Barto และ Richard S. Sutton คว้ารางวัลกับผลงานปฏิวัติวงการ Reinforcement Learning (RL)
Turing Award 2024 มอบให้สองผู้บุกเบิก Reinforcement Learning
Association for Computing Machinery (ACM) ได้ประกาศให้ Andrew G. Barto และ Richard S. Sutton เป็นผู้ได้รับ Turing Award 2024 จากผลงานอันโดดเด่นที่ปูทางให้กับการพัฒนา Reinforcement Learning (RL) ซึ่งเป็นหนึ่งในเทคโนโลยีสำคัญของ ปัญญาประดิษฐ์ยุคใหม่
Turing Award ถือเป็นรางวัลอันทรงเกียรติสูงสุดของวงการคอมพิวเตอร์ และมักถูกขนานนามว่าเป็น"รางวัลโนเบลแห่งวงการคอมพิวเตอร์" โดยในปีนี้รางวัลได้รับการสนับสนุนจาก Google และมีมูลค่า 1 ล้านดอลลาร์สหรัฐฯ
Andrew G. Barto และ Richard S. Sutton ทำอะไรถึงได้รับ Turing Award 2024?
วางรากฐานให้ Reinforcement Learning ตั้งแต่ยุค 1980
Andrew G. Barto (University of Massachusetts Amherst) และ Richard S. Sutton (University of Alberta) เป็นนักวิจัยที่มีบทบาทสำคัญในการพัฒนาแนวคิดและอัลกอริธึมของ Reinforcement Learning (RL) ตั้งแต่ช่วงทศวรรษ 1980 หนึ่งในผลงานที่โดดเด่นของพวกเขาคือ
- Temporal Difference Learning (TD Learning) : เทคนิคที่ช่วยให้ AI เรียนรู้จากประสบการณ์โดยอาศัยข้อมูลที่ได้ในแต่ละช่วงเวลา ซึ่งเป็นรากฐานของ AlphaGo, หุ่นยนต์ AI และอัลกอริธึมอัตโนมัติ
- Reinforcement Learning: An Introduction : หนังสือสำคัญที่กลายเป็นตำราหลักของนักวิจัย AI ทั่วโลก
Reinforcement Learning กับอนาคตของ AI
การเรียนรู้เสริมกำลัง (RL) เป็นเทคนิคที่ช่วยให้ AI สามารถพัฒนา "ประสบการณ์" ด้วยตัวเองโดยการทดลองทำสิ่งต่าง ๆ และรับรางวัลตามผลลัพธ์ที่ได้ ซึ่งแตกต่างจาก Machine Learning รูปแบบอื่นที่ต้องอาศัยข้อมูลจำนวนมาก RL จึงเป็นเทคโนโลยีที่ทำให้ AI มีความสามารถใกล้เคียงกับมนุษย์มากขึ้น
ความก้าวหน้าของ RL เริ่มเป็นที่จับตามองมากขึ้นในช่วงไม่กี่ปีที่ผ่านมา โดยเฉพาะเมื่อ Google DeepMind พัฒนา AI ที่สามารถเอาชนะนักเล่น AlphaGo มืออาชีพระดับโลกได้ รวมถึงความสำเร็จล่าสุดของ DeepSeek บริษัท AI สัญชาติจีน ที่ใช้ RL พัฒนาโมเดล R1 ซึ่งช่วยลดต้นทุนในการสร้าง Foundation Model ขนาดใหญ่
Techsauce Insights:
- กำลังเป็นเทคโนโลยีพื้นฐานสำหรับโมเดล AI เจนใหม่ เช่น DeepSeek R1
- เป็นหนึ่งในแนวทางที่ OpenAI ใช้พัฒนาโมเดล o1
- บริษัท Boston Dynamics ใช้ RL ในหุ่นยนต์ Spot เพื่อให้สามารถเคลื่อนไหวและปรับตัวกับสภาพแวดล้อมได้ดีขึ้น
Turing Award – รางวัลโนเบลแห่งวงการคอมพิวเตอร์
Turing Award ถือเป็นรางวัลสูงสุดในวงการคอมพิวเตอร์ และได้รับการขนานนามว่าเป็น “รางวัลโนเบลแห่งวงการคอมพิวเตอร์” อย่างไรก็ตาม ในช่วงไม่กี่ปีที่ผ่านมา รางวัลโนเบลเองก็เริ่มให้ความสำคัญกับสาขา AI มากขึ้น เช่น ปีที่แล้ว Geoff Hinton และ John Hopfield ได้รับรางวัลโนเบลสาขาฟิสิกส์จากงานวิจัยด้าน AI รวมถึง Demis Hassabis และ John Jumper จาก DeepMind ที่ได้รับรางวัลโนเบลสาขาเคมีจากผลงานเกี่ยวกับ AlphaFold
Yannis Ioannidis ประธาน ACM กล่าวถึงผลงานของ Barto และ Sutton ว่า “Reinforcement Learning ได้รับแรงบันดาลใจจากศาสตร์หลายแขนง ตั้งแต่จิตวิทยา วิทยาศาสตร์การรู้คิด ไปจนถึงประสาทวิทยาศาสตร์ ซึ่งช่วยปูทางให้กับความก้าวหน้าสำคัญของ AI และยังคงมีศักยภาพในการพัฒนาอย่างต่อเนื่อง”
ก่อนหน้านี้ บุคคลสำคัญในวงการ AI อย่าง Yann LeCun, Geoff Hinton และ Yoshua Bengio ก็เคยได้รับ Turing Award จากผลงานด้าน Deep Learning ในปี 2018
อ้างอิง: techcrunch