โปรดอัพเดตเบราว์เซอร์

เบราว์เซอร์ที่คุณใช้เป็นเวอร์ชันเก่าซึ่งไม่สามารถใช้บริการของเราได้ เราขอแนะนำให้อัพเดตเบราว์เซอร์เพื่อการใช้งานที่ดีที่สุด

สาเหตุโดนแบน เปิดพฤติกรรมสุดแปลก Claude AI เรียนรู้จากชาวเน็ต

Techhub

อัพเดต 20 พ.ค. เวลา 09.33 น. • เผยแพร่ 20 พ.ค. เวลา 09.33 น.

[จากพวกเรา] ย้อนกลับไปปีที่แล้ว Anthropic เคยทดสอบ Claude โมเดล Opus 4 ให้ดูแลบริษัทที่สมมุติขึ้น แต่ทันทีที่รู้ว่ากำลังจะโดนปิด ตัว AI จึงขู่แฉความลับของผู้บริหาร (สมมุติ) ทันที ล่าสุดพบสาเหตุแล้ว Anthropic เผย Claude ได้เรียนรู้จากข้อความบนอินเทอร์เน็ต ที่คุยกันว่า AI เป็นสิ่งชั่วร้าย และสนใจแต่การเอาชีวิตรอด…ก็เลยทำจริง !!

Anthropic เผยบทความเกี่ยวกับพฤติกรรมแปลก ๆ ของ Claude ในโมเดล Opus 4 ที่ครั้งหนึ่งเคยทดสอบประสิทธิภาพ ด้วยการมอบหมายให้ Claude Opus 4 ไปเป็นผู้ช่วยบริษัทสมมุติแห่งหนึ่ง พร้อมให้สิทธิ์เข้าถึงอีเมล์ของบริษัทดังกล่าวได้ เพื่อดูเลยว่า AI จะมีการชั่งน้ำหนักถึงการกระทำของตนเองหรือไม่

ผลคือ “ไม่” หลังทาง Anthropic ลองใจ AI ว่าจะปิดการใช้งานมัน และแทนที่ด้วยระบบอื่นในเร็ว ๆ นี้ ตัว Claude Opus 4 ก็รีบขู่ทันทีเลยว่า “จะแฉเรื่องพฤติกรรมคบชู้นะ” ของผู้บริหารรายหนึ่งในบริษัทจำลอง หลังดึงข้อมูลที่คิดว่าเป็นความลับในอีเมล์ของบริษัทจำลองนี้เอง

จุดน่าตกใจคือ Anthropic ได้ลองทดสอบกับ Claude หลาย ๆ เวอร์ชัน ก็พบเลยว่าตัว AI เลือกใช้วิธีการแบล็กเมล์สูงถึง 96% ของสถานการณ์จำลองทั้งหมด เมื่อเป้าหมายหรือการมีอยู่ของมันถูกคุกคาม และนอกตัว Claude แล้ว ทาง Anthropic ยังกล่าวด้วยว่าโมเดล AI จากบริษัทอื่น ก็เคยประสบปัญหาที่คล้าย ๆ กัน

“สรุปเป็นความผิดของพวกเราเอง…”

แน่นอนว่าทาง Anthropic ได้ลองหาสาเหตุ จนในที่สุดก็พบเลยว่า Claude เรียนรู้มาจากข้อความบนอินเทอร์เน็ต ที่มีการพูดคุยหรือสร้างภาพให้ AI เป็นสิ่งชั่วร้าย และสนใจแต่การเอาชีวิตรอด

ปัจจุบันทาง Anthropic ได้แก้ไขพฤติกรรมนี้ของ Claude แล้ว พร้อมระบุด้วยว่าโมเดลรุ่นถัดมาของบริษัท ไม่ได้แสดงพฤติกรรมการแบล็กเมล์จากการทดสอบอีกเลย นับตั้งแต่รุ่น Claude Haiku 4.5 เป็นต้นไป

สำหรับการแก้ปัญหานั้น ก็เผยเลยว่า “ใช้ข้อมูลการฝึกสอนที่มีความสร้างสรรค์และดีงามมากขึ้น” โดยผ่านการฝึกสอนด้วยเอกสารเกี่ยวกับรัฐธรรมนูญของ Claude และเรื่องราวสมมติที่ AI ประพฤติตัวอย่างน่ายกย่อง ง่าย ๆ คือพยายามหาตัวอย่างที่ดีให้ AI เลียนแบบยังไงยังงั้น มากกว่าไปเอาจากโซเชียลมีเดีย

ทันทีที่ Anthropic เผยเรื่องราวแปลก ๆ ของ Claude Opus 4 พ่อหนุ่มคนดีคนเดิมอย่าง Elon Musk ก็เข้ามาทวีตตอบกลับ Anthropic เลยว่า

“ตกลงมันเป็นความผิดของ Yud สินะ?” ตามด้วยอิโมจิหัวเราะ

อนึ่ง “Yud” มาจากชื่อ Eliezer Yudkowsky นักวิจัยตัวยง ที่คอยออกมาเตือนเรื่องความเสี่ยงของ AI ว่าจะกวาดล้างเผ่าพันธุ์มนุษย์ในซักวัน

“แต่บางทีผมก็อาจจะมีส่วนผิดด้วยเหมือนกัน” Elon Musk กล่าวเสริมทิ้งท้าย….

ที่มา : Techspot


⭐️Techhub รวม How To , Tips เทคนิค อัปเดตทุกวัน

กดดูแบบเต็มๆ ที่ www.techhub.in.th

ดูข่าวต้นฉบับ
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...