สาเหตุโดนแบน เปิดพฤติกรรมสุดแปลก Claude AI เรียนรู้จากชาวเน็ต

[จากพวกเรา] ย้อนกลับไปปีที่แล้ว Anthropic เคยทดสอบ Claude โมเดล Opus 4 ให้ดูแลบริษัทที่สมมุติขึ้น แต่ทันทีที่รู้ว่ากำลังจะโดนปิด ตัว AI จึงขู่แฉความลับของผู้บริหาร (สมมุติ) ทันที ล่าสุดพบสาเหตุแล้ว Anthropic เผย Claude ได้เรียนรู้จากข้อความบนอินเทอร์เน็ต ที่คุยกันว่า AI เป็นสิ่งชั่วร้าย และสนใจแต่การเอาชีวิตรอด…ก็เลยทำจริง !!

Anthropic เผยบทความเกี่ยวกับพฤติกรรมแปลก ๆ ของ Claude ในโมเดล Opus 4 ที่ครั้งหนึ่งเคยทดสอบประสิทธิภาพ ด้วยการมอบหมายให้ Claude Opus 4 ไปเป็นผู้ช่วยบริษัทสมมุติแห่งหนึ่ง พร้อมให้สิทธิ์เข้าถึงอีเมล์ของบริษัทดังกล่าวได้ เพื่อดูเลยว่า AI จะมีการชั่งน้ำหนักถึงการกระทำของตนเองหรือไม่

ผลคือ “ไม่” หลังทาง Anthropic ลองใจ AI ว่าจะปิดการใช้งานมัน และแทนที่ด้วยระบบอื่นในเร็ว ๆ นี้ ตัว Claude Opus 4 ก็รีบขู่ทันทีเลยว่า “จะแฉเรื่องพฤติกรรมคบชู้นะ” ของผู้บริหารรายหนึ่งในบริษัทจำลอง หลังดึงข้อมูลที่คิดว่าเป็นความลับในอีเมล์ของบริษัทจำลองนี้เอง

จุดน่าตกใจคือ Anthropic ได้ลองทดสอบกับ Claude หลาย ๆ เวอร์ชัน ก็พบเลยว่าตัว AI เลือกใช้วิธีการแบล็กเมล์สูงถึง 96% ของสถานการณ์จำลองทั้งหมด เมื่อเป้าหมายหรือการมีอยู่ของมันถูกคุกคาม และนอกตัว Claude แล้ว ทาง Anthropic ยังกล่าวด้วยว่าโมเดล AI จากบริษัทอื่น ก็เคยประสบปัญหาที่คล้าย ๆ กัน

“สรุปเป็นความผิดของพวกเราเอง…”

แน่นอนว่าทาง Anthropic ได้ลองหาสาเหตุ จนในที่สุดก็พบเลยว่า Claude เรียนรู้มาจากข้อความบนอินเทอร์เน็ต ที่มีการพูดคุยหรือสร้างภาพให้ AI เป็นสิ่งชั่วร้าย และสนใจแต่การเอาชีวิตรอด

ปัจจุบันทาง Anthropic ได้แก้ไขพฤติกรรมนี้ของ Claude แล้ว พร้อมระบุด้วยว่าโมเดลรุ่นถัดมาของบริษัท ไม่ได้แสดงพฤติกรรมการแบล็กเมล์จากการทดสอบอีกเลย นับตั้งแต่รุ่น Claude Haiku 4.5 เป็นต้นไป

สำหรับการแก้ปัญหานั้น ก็เผยเลยว่า “ใช้ข้อมูลการฝึกสอนที่มีความสร้างสรรค์และดีงามมากขึ้น” โดยผ่านการฝึกสอนด้วยเอกสารเกี่ยวกับรัฐธรรมนูญของ Claude และเรื่องราวสมมติที่ AI ประพฤติตัวอย่างน่ายกย่อง ง่าย ๆ คือพยายามหาตัวอย่างที่ดีให้ AI เลียนแบบยังไงยังงั้น มากกว่าไปเอาจากโซเชียลมีเดีย

So it was Yud’s fault? ????
Maybe me too ????
— Elon Musk (@elonmusk) May 9, 2026

ทันทีที่ Anthropic เผยเรื่องราวแปลก ๆ ของ Claude Opus 4 พ่อหนุ่มคนดีคนเดิมอย่าง Elon Musk ก็เข้ามาทวีตตอบกลับ Anthropic เลยว่า

“ตกลงมันเป็นความผิดของ Yud สินะ?” ตามด้วยอิโมจิหัวเราะ

อนึ่ง “Yud” มาจากชื่อ Eliezer Yudkowsky นักวิจัยตัวยง ที่คอยออกมาเตือนเรื่องความเสี่ยงของ AI ว่าจะกวาดล้างเผ่าพันธุ์มนุษย์ในซักวัน

“แต่บางทีผมก็อาจจะมีส่วนผิดด้วยเหมือนกัน” Elon Musk กล่าวเสริมทิ้งท้าย….

ที่มา : Techspot

⭐️Techhub รวม How To , Tips เทคนิค อัปเดตทุกวัน

กดดูแบบเต็มๆ ที่ www.techhub.in.th

โปรดอัพเดตเบราว์เซอร์

ไอที

Techhub

โปรดอัพเดตเบราว์เซอร์เปิดใช้งาน Javascript

สาเหตุโดนแบน เปิดพฤติกรรมสุดแปลก Claude AI เรียนรู้จากชาวเน็ต

Techhub

โปรดอัพเดตเบราว์เซอร์