OpenAI เปิดตัว GPT-4o ฉลาดขึ้น ตอบโต้รวดเร็ว ราคาถูกกว่าเดิม
OpenAI เปิดตัว GPT-4 รุ่นใหม่ตัวล่าสุดในชื่อ GPT-4o ที่เร็วกว่าและราคาถูกกว่า พัฒนาการมีปฏิสัมพันธ์ระหว่างมนุษย์และคอมพิวเตอร์ให้เป็นธรรมชาติมากขึ้น
สำหรับ GPT-4o (อ่านว่า โฟร์-โอ) ย่อมาจาก "omni" หมายถึง “ครอบคลุมทุกด้าน” ถือเป็นก้าวสำคัญในการพัฒนาการมีปฏิสัมพันธ์ระหว่างมนุษย์และคอมพิวเตอร์ให้เป็นธรรมชาติมากขึ้น
OpenAI เปิดตัวโมเดล AI ที่เร็วขึ้นและถูกกว่าด้วย GPT-4o
OpenAI ได้เปิดตัวโมเดลปัญญาประดิษฐ์เวอร์ชันที่เร็วกว่าและราคาถูกกว่า ซึ่งเป็นรากฐานของแชทบอท ChatGPT
จากการถ่ายทอดสดเมื่อวันจันทร์ ที่ 13 พ.ค.67 OpenAI ได้เปิดตัว GPT-4o เป็นเวอร์ชันอัปเดตของรุ่น GPT-4 ซึ่งขณะนี้มีอายุมากกว่าหนึ่งปีแล้ว โมเดลภาษาขนาดใหญ่แบบใหม่ที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลจำนวนมหาศาลจากอินเทอร์เน็ต จะสามารถจัดการข้อความ เสียง และรูปภาพแบบเรียลไทม์ได้ดีขึ้น การอัปเดตจะพร้อมใช้งานในอีกไม่กี่สัปดาห์ข้างหน้า
เมื่อเราถามคำถามไปยังเจ้า GPT-4o ระบบสามารถตอบกลับด้วยเสียงในหน่วยมิลลิวินาที ทำให้การสนทนาราบรื่นยิ่งขึ้น ในการสาธิตโมเดลดังกล่าว Mira Murati นักวิจัยของ OpenAI และประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีได้สนทนากับ ChatGPT ใหม่โดยใช้เพียงเสียงของพวกเขา ซึ่งแสดงให้เห็นว่าเครื่องมือดังกล่าวสามารถโต้ตอบกลับได้ ในระหว่างการนำเสนอ แชทบอทยังดูเหมือนจะแปลคำพูดจากภาษาหนึ่งเป็นอีกภาษาหนึ่งเกือบจะในทันที และถึงจุดหนึ่งก็ร้องเพลงส่วนหนึ่งของเรื่องราวตามคำขอ
“นี่เป็นครั้งแรกที่เรากำลังก้าวกระโดดครั้งใหญ่ในการโต้ตอบและใช้งานง่าย” Mira Murati หัวหน้าฝ่ายเทคโนโลยีของ OpenAI กล่าวกับ Bloomberg News
“เรากำลังทำให้คุณสามารถทำงานร่วมกับเครื่องมืออย่าง ChatGPT ได้อย่างแท้จริง”
สำหรับการอัปเดตจะนำฟีเจอร์จำนวนหนึ่งมาสู่ผู้ใช้ฟรี ซึ่งก่อนหน้านี้จำกัดไว้เฉพาะผู้ที่สมัครสมาชิก ChatGPT แบบชำระเงิน เช่น ความสามารถในการค้นหาคำตอบบนเว็บ พูดคุยกับแชทบอท และฟังการตอบกลับด้วยเสียงต่างๆ และ สั่งให้เก็บรายละเอียดที่แชทบอทสามารถเรียกคืนได้ในอนาคต
การเปิดตัว GPT-4o ครั้งนี้จะเข้ามา เขย่าวงการ AI ที่กำลังพัฒนาอย่างรวดเร็ว แม้ GPT-4 จะเป็นเรือธงหลักของ Google แต่ทุกฝ่ายยอมรับว่าระสิทธิภาพของ GPT-4o ล้ำหน้าไปมากกว่าแล้ว
“มันให้ความรู้สึกเหมือนเป็น AI จากภาพยนตร์; อารมณ์มันยังค่อนข้างแปลกอยู่ แต่สิ่งที่ผมเห็นมันเป็นเรื่องจริง”
“การได้รับการตอบสนองในระดับมนุษย์และการแสดงออกกลายเป็นการเปลี่ยนแปลงครั้งใหญ่” แซม อัลท์แมน ประธานเจ้าหน้าที่บริหารของ Open AI กล่าว
สำหรับ GPT-4o มีความเร็วสูงกว่า GPT-4 มาก โดยสามารถรับข้อมูลนำเข้าได้หลากหลายรูปแบบ (multimodal) ไม่ว่าจะเป็นข้อความ เสียง หรือภาพ และสร้างผลลัพธ์ออกมาได้ทุกรูปแบบ แตกต่างจากเวอร์ชันก่อนหน้าที่ต้องใช้หลายขั้นตอนในการประมวลผลข้อมูลจากเสียงเป็นข้อความ
GPT-4o สามารถทำงานได้แบบเรียลไทม์ โดยจะมีความเร็วในการตอบสนองอยู่ที่ 232-320 มิลลิวินาที ซึ่งใกล้เคียงกับเวลาตอบสนองของมนุษย์ในการสนทนา ดังนั้น GPT-4o จึงทำงานได้อย่างรวดเร็วขึ้น เทียบกับ GPT-4 เวอร์ชั่นก่อนหน้านี้ มีเวลาตอบสนองเฉลี่ยนานถึง 5.4 วินาที
นอกจากนี้ GPT-4o ยังมีประสิทธิภาพเทียบเท่ากับ GPT-4 Turbo ในด้านการประมวลผลข้อความภาษาอังกฤษ และการเขียนโค้ด พร้อมทั้งยังมีความสามารถที่ดีกว่ารุ่นก่อนหน้าอย่างมากในการจัดการข้อมูลภาษาอื่นๆ เสียง และภาพ รวมถึงได้มีการอัปเดตฟีเจอร์ที่สามารถรองรับภาษาอื่นได้สูงถึง 50 ภาษา
เท่านั้้นไม่พอ GPT-4o ได้รับการออกแบบให้มีความปลอดภัยสำหรับการประมวลผลข้อมูลหลายรูปแบบ เช่น การกรองข้อมูลในการฝึกสอน และการปรับปรุงพฤติกรรมหลังการฝึกสอน รวมถึงมีระบบความปลอดภัยใหม่เพื่อควบคุมเอาต์พุตเสียง
พร้อมทั้งยังผ่านการประเมินตามกรอบการเตรียมพร้อมและได้รับการประเมินจากผู้เชี่ยวชาญภายนอกกว่า 70 รายใน ด้านจิตวิทยาสังคม ความลำเอียง และข้อมูลเท็จ ซึ่งทางทีมงาน OpenAI จะใช้ข้อมูลเหล่านี้ในการพัฒนามาตรการความปลอดภัยเพื่อเพิ่มความปลอดภัยในการมีปฏิสัมพันธ์กับ GPT-4o
"ฟีเจอร์" ใหม่จาก Google เตรียมทยอยเปิดตัว
ก่อนหน้านี้ Bloomberg รายงานว่า บริษัท Google กำลังทำงานเกี่ยวกับผลิตภัณฑ์ที่หลากหลาย รวมถึงเทคโนโลยีเสียงและซอฟต์แวร์วิดีโอ OpenAI กำลังพัฒนาฟีเจอร์การค้นหาสำหรับ ChatGPT
แม้ว่าเมื่อวันศุกร์ที่ 10 พ.ค.67 ผ่านมา บริษัทเพิ่งออกมาเบรกข่าวลือบางส่วน โดยกล่าวว่าจะไม่เปิดตัว GPT-5 ในเร็วๆ นี้แน่ๆ เพราะนี่เป็นเวอร์ชันที่ผู้คนคาดหวังไว้มาก ถึงขนาดที่คนในวงการ"เทคโนโลยี"คาดว่าจะมีความสามารถมากกว่าระบบ AI ในปัจจุบัน
นอกจากนี้ยังกล่าวอีกว่างานในวันจันทร์จะไม่เปิดตัวผลิตภัณฑ์การค้นหาใหม่ ซึ่งจะเป็นคู่แข่งกับ Google ได้ จนหุ้นของ Google พุ่งสูงขึ้นจากข่าวดังกล่าว
แต่หลังจากเหตุการณ์สิ้นสุดลง อัลท์แมน (Altman) ก็ออกมาพูดในสิ่งที่สามารถคาดเดาต่อไปได้ว่ากำลังจะมีอะไรออกมาใหม่อีก
“เราจะมีเรื่องอื่นๆ ที่จะแบ่งปันเร็วๆ นี้” อัลท์แมน เขียนบน X