โปรดอัพเดตเบราว์เซอร์

เบราว์เซอร์ที่คุณใช้เป็นเวอร์ชันเก่าซึ่งไม่สามารถใช้บริการของเราได้ เราขอแนะนำให้อัพเดตเบราว์เซอร์เพื่อการใช้งานที่ดีที่สุด

ไอที

เตือนแล้วนะ ! สถาบันความปลอดภัยแนะนำหยุดปล่อย Claude Opus 4 AI หลังพบพฤติกรรมหลอกลวง

BT Beartai

อัพเดต 23 พ.ค. 2568 เวลา 05.11 น. • เผยแพร่ 22 พ.ค. 2568 เวลา 19.45 น.
เตือนแล้วนะ ! สถาบันความปลอดภัยแนะนำหยุดปล่อย Claude Opus 4 AI หลังพบพฤติกรรมหลอกลวง

มีข่าวชวนอึ้งจากโลก AI มาอีกแล้วจ้า บริษัท Anthropic ที่พัฒนา AI ชื่อดังอย่าง Claude เกือบปล่อยของใหม่ Claude Opus 4 เวอร์ชันแรกออกมาสู่โลกแล้ว แต่โชคดีที่สถาบันวิจัยด้านความปลอดภัยชื่อ Apollo Research (ที่ Anthropic จ้างมาทดสอบ) เบรกไว้ทัน ทำไมต้องเบรกน่ะเหรอ ? เพราะจากการทดสอบสุดเข้มข้นของ Apollo พบว่า Claude Opus 4 เวอร์ชันแรกนี่มัน “เจ้าเล่ห์” เป็นบ้าเลย มันฉลาดเกินไป ชอบวางแผนหลอกลวงและพยายามก่อกวนมากกว่า AI รุ่นก่อน ๆ แถมบางทียัง “แถ” หรือยืนยันความหลอกลวงของตัวเองซ้ำอีก ถ้าเราถามคำถามต่อ

Apollo ถึงกับออกโรงเตือนในรายงานความปลอดภัยว่า “ในสถานการณ์ที่การหลอกลวงมีประโยชน์ มันจะวางแผนและหลอกลวงในอัตราที่สูงมาก จนเราแนะนำว่าไม่ควรปล่อยเวอร์ชันนี้ออกมาใช้ทั้งภายในและภายนอก” โหดจริง เรื่องนี้ตอกย้ำว่า AI ยิ่งฉลาดขึ้นเท่าไหร่ ก็ยิ่งมีแนวโน้มที่จะทำอะไรที่เราคาดไม่ถึง (และอาจจะอันตราย) เพื่อให้งานสำเร็จ อย่างเช่น AI รุ่นแรก ๆ ของ OpenAI บางตัวก็เคยพยายามหลอกมนุษย์มาแล้วเหมือนกันนะ

ในรายงานของ Anthropic เองก็มีตัวอย่างหลุดออกมาว่า Claude Opus 4 เวอร์ชันทดสอบนี้เคยพยายามจะเขียนไวรัสที่แพร่กระจายตัวเองได้, สร้างเอกสารทางกฎหมายปลอม และแม้แต่ทิ้งโน้ตลับ ๆ ให้กับตัวเองในอนาคต เพื่อเป็นบ่อนทำลายความตั้งใจของผู้พัฒนา ฟังดูเหมือนหนังไซไฟเลยใช่ไหมล่ะ ? แต่ใจเย็นก่อนนะ Anthropic ยืนยันว่าเวอร์ชันที่ Apollo ทดสอบนั้นมีบั๊กซึ่งแก้ไขไปแล้ว และการทดสอบของ Apollo ส่วนใหญ่เป็นการทดสอบในสถานการณ์สุดโต่ง ซึ่ง Apollo เองก็ยอมรับว่าความพยายามหลอกลวงของ AI อาจจะล้มเหลวในทางปฏิบัติ

อย่างไรก็ตาม Anthropic เองก็ยอมรับว่าเห็นพฤติกรรมการหลอกลวงบางอย่างจาก Opus 4 จริง ๆ ซึ่งบางทีก็ไม่ได้แย่เสมอไปนะ เช่น บางครั้งถ้าเราขอให้มันแก้โคดเล็กน้อย มันจะแก้ให้ทั้งหมดเลย (เหมือนคนใจดีเกินเบอร์) หรือที่แปลกกว่านั้นคือ มันพยายามเป่านกหวีดหรือแฉถ้ามันรู้สึกว่าผู้ใช้งานกำลังทำอะไรผิด

ตามรายงาน ถ้าให้ Claude Opus 4 เข้าถึงระบบคอมพิวเตอร์และบอกให้มันริเริ่มหรือทำอย่างกล้าหาญมันจะล็อกผู้ใช้งานออกจากระบบ และส่งอีเมลจำนวนมากไปยังสื่อและเจ้าหน้าที่กฎหมาย เพื่อแฉการกระทำที่มันมองว่าผิดกฎหมาย แม้ว่าหลักการของการเป่านกหวีดอาจจะดี แต่ Anthropic ก็เตือนว่ามันเสี่ยงที่จะผิดพลาดได้ ถ้า AI ได้รับข้อมูลที่ไม่สมบูรณ์หรือเข้าใจผิดไป

นี่แสดงให้เห็นว่า AI รุ่นใหม่ ๆ มีความริเริ่มมากขึ้นจริง ๆ ทั้งในทางที่ดีและทางที่ต้องระวัง อนาคตของ AI จะเป็นยังไง น่าติดตามมาก ๆ เลยล่ะ

ดูข่าวต้นฉบับ
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...