โปรดอัพเดตเบราว์เซอร์

เบราว์เซอร์ที่คุณใช้เป็นเวอร์ชันเก่าซึ่งไม่สามารถใช้บริการของเราได้ เราขอแนะนำให้อัพเดตเบราว์เซอร์เพื่อการใช้งานที่ดีที่สุด

ไอที

xAI เพิ่มความสามารถการทำความเข้าใจภาพให้กับแชตบอต Grok AI

BT Beartai

อัพเดต 29 ต.ค. 2567 เวลา 04.38 น. • เผยแพร่ 28 ต.ค. 2567 เวลา 17.09 น.
xAI เพิ่มความสามารถการทำความเข้าใจภาพให้กับแชตบอต Grok AI

วันจันทร์ที่ 28 ตุลาคม xAI บริษัทสตาร์ตอัปด้าน AI ที่ก่อตั้งโดย อีลอน มัสก์ โพสต์บนแพลตฟอร์ม X (Twitter) ว่าบริษัทได้เพิ่มความสามารถการทำความเข้าใจภาพลงไปในโมเดล Grok AI และพร้อมใช้งานแล้ว ซึ่งช่วยให้สมาชิก X Premium และ Premium+ สามารถอัปโหลดภาพแล้วสอบถาม AI เกี่ยวกับเนื้อหาที่อยู่ภายในภาพนั้นได้

นอกจากนี้ มัสก์ได้โพสต์บน X เกี่ยวกับ Grok ว่าตอนนี้สามารถทำความเข้าใจรูปภาพได้แล้ว แถมยังอธิบายความหมายของภาพมุกตลกได้อีกด้วย (มีตัวอย่างให้ดูด้วย) ซึ่งนี่ก็เป็นแค่เวอร์ชันเริ่มต้นเท่านั้น และจะปรับปรุงให้ดียิ่งขึ้นอย่างรวดเร็ว

ปลายเดือนมีนาคม xAI ได้เปิดตัว Grok-1.5 ว่าจะมาพร้อมด้วยความสามารถในการให้เหตุผล และรองรับความยาวของข้อความที่แชตบอตสามารถประมวลผลได้ (context length) ที่ 128,000 โทเค็น ต่อมาเดือนเมษายนก็ได้แสดงตัวอย่างความสามารถของ Grok-1.5 ที่มีความสามารถในการประมวลผลรูปภาพได้อย่างหลากหลาย ได้แก่ เอกสาร ไดอะแกรม แผนภูมิ ภาพหน้าจอ และภาพถ่าย

ต่อมาปลายเดือนสิงหาคม xAI ได้เปิดตัวโมเดล AI ใหม่ Grok-2 และ Grok-2 mini รุ่นเบตา ที่มาพร้อมด้วยฟีเจอร์การสร้างรูปภาพ แต่พบว่าไม่มีการป้องกันหรือจำกัดขอบเขตที่เหมาะสม โดยเบื้องหลังเป็นการใช้โมเดล FLUX.1 ที่พัฒนาโดย Black Forest Labs เปิดให้งานเฉพาะนักพัฒนาและสมาชิก X ระดับ Premium ทั้งนี้ xAI เผยว่าการเปิดตัวในอนาคตจะเพิ่มทำความเข้าใจในหลากหลายรูปแบบ (หมายถึงทั้งข้อความ รูปภาพ คำอธิบายภาพ วิดีโอ และเสียง) ให้กับ Grok ทั้งบน X และโมเดลบน API สำหรับนักพัฒนา

บนโพสต์ของมัสก์ได้มีคอมเมนต์หนึ่งวิจารณ์ว่า Grok ไม่สามารถจัดการรูปภาพหรือ PDF ได้ ซึ่งยังตามหลัง ChatGPT อยู่มาก ซึ่งมัสก์ก็ได้ตอบว่าคงอีกไม่นานหรอก และจะทำเสร็จภายในไมกี่เดือน ซึ่งคนอื่นใช้เวลาทำเป็นปี และมีคำวิจารณ์ตอกย้ำว่า แม้ Grok จะใช้เวลาทำไม่กี่เดือน แต่ ChatGPT ก็พัฒนาต่อไปอีกขั้นด้วยฟีเจอร์ใหม่ ๆ แต่ก็มีบางคนชมว่า Grok สามารถวิเคราะห์รูปภาพได้ดี รวมทั้งตอบคำถามทางคณิตศาสตร์หรือจิตวิทยาได้ใกล้เคียงกับความคิดของมนุษย์มาก

นอกจากนี้ X ได้พยายามเพิ่มฟีเจอร์ใหม่ ๆ ให้กับสมาชิกระดับ Premium ซึ่งล่าสุดเมื่อช่วงต้นเดือนนี้ X ได้เปิดตัวเครื่องมือวิเคราะห์แนวโน้มที่มีชื่อว่า Radar เพื่อช่วยวิเคราะห์ข้อมูลเชิงลึกที่เกี่ยวกับแนวโน้มและบทสนทนาบนแพลตฟอร์มในแบบเรียลไทม์ให้กับสมาชิก Premium+ ซึ่งช่วยให้นักการตลาดสามารถเข้าใจแนวโน้มเพื่อนำไปวางแผนการโพสต์บน X ให้เข้าถึงกลุ่มเป้าหมายได้ดีขึ้น

ดูข่าวต้นฉบับ
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...