xAI เปิดตัว "Grok Vision" ฟีเจอร์ใหม่ที่ทำให้แชทบอท AI "มีตา"
xAI ประกาศเปิดตัว "Grok Vision" ความสามารถใหม่แชทบอท Grok ที่สามารถ "มองเห็น" และทำความเข้าใจสิ่งต่างๆ ที่ปรากฏผ่านกล้องสมาร์ทโฟนของผู้ใช้งานได้แล้ว
xAI บริษัทด้านปัญญาประดิษฐ์ที่ก่อตั้งโดย Elon Musk ได้ประกาศเปิดตัวความสามารถใหม่ที่น่าสนใจสำหรับแชทบอท Grok
นั่นคือฟีเจอร์ "Grok Vision" ซึ่งทำให้ Grok สามารถ "มองเห็น" และทำความเข้าใจสิ่งต่างๆ ที่ปรากฏผ่านกล้องสมาร์ทโฟนของผู้ใช้งานได้แล้ว
โดยความสามารถนี้มีความคล้ายคลึงกับฟีเจอร์ด้านการมองเห็นแบบเรียลไทม์ที่มีให้บริการบนแชทบอท AI คู่แข่งอย่าง Google Gemini และ ChatGPT ในปัจจุบัน
Grok Vision เปิดตัวอย่างเป็นทางการเมื่อวันอังคาร โดยหลักการทำงานคือ ผู้ใช้สามารถหันกล้องของโทรศัพท์ไปยังวัตถุต่างๆ เช่น สินค้า ป้าย หรือเอกสาร แล้วถามคำถามที่เกี่ยวข้องกับสิ่งเหล่านั้นกับ Grok ได้โดยตรง
ปัจจุบัน ฟีเจอร์ Grok Vision พร้อมให้ใช้งานแล้วบนแอปพลิเคชัน Grok สำหรับระบบปฏิบัติการ iOS เท่านั้น ส่วนแอป Grok บน Android ยังไม่มีการรองรับฟีเจอร์นี้
นอกเหนือจาก Grok Vision แล้ว ในการอัปเดตครั้งนี้ Grok ยังได้รับการเพิ่มความสามารถด้านอื่นเพิ่มเติม อาทิ โหมดเสียงที่สามารถรองรับการสนทนาได้หลายภาษา และฟังก์ชันการค้นหาข้อมูลแบบเรียลไทม์ผ่านการสั่งงานด้วยเสียง
อย่างไรก็ตาม สำหรับผู้ใช้งาน Grok บนอุปกรณ์ Android จะสามารถเข้าถึงฟีเจอร์ด้านเสียงและการค้นหาเหล่านี้ได้ก็ต่อเมื่อเป็นสมาชิกระดับ SuperGrok ของ xAI ซึ่งมีค่าบริการอยู่ที่ 30 ดอลลาร์สหรัฐฯ ต่อเดือน
ทั้งนี้ เป็นที่น่าจับตาว่า Grok มีการพัฒนาอย่างต่อเนื่องและรวดเร็วในช่วงที่ผ่านมา โดยมีการเพิ่มฟีเจอร์ใหม่ๆ อยู่เสมอ ตัวอย่างเช่น
เมื่อต้นเดือนที่ผ่านมา xAI ได้เพิ่มความสามารถด้าน "หน่วยความจำ" (memory) ให้กับ Grok ทำให้แชทบอทสามารถจดจำรายละเอียดและนำข้อมูลจากการสนทนาครั้งก่อนๆ มาปรับใช้ในการตอบคำถามหรือสานต่อบทสนทนาได้อย่างมีประสิทธิภาพยิ่งขึ้น