DeepSeek เผยกลไกใหม่ลับคม AI คิดเองได้ ตอบคำถามแม่นยำ ตรงจุด
DeepSeek จับมือมหาวิทยาลัยชิงหวา พัฒนากลไกใหม่ ให้ AI ประเมินและพัฒนากรอบคิดเองได้ ตอบคำถามได้เฉียบคม แม่นยำกว่าเดิม หวังท้าชนยักษ์ใหญ่ในวงการ
รายงานจาก Bloomberg ชี้ว่า บริษัทสตาร์ทอัพ AI สัญชาติจีน DeepSeek ร่วมกับนักวิจัยจากมหาวิทยาลัยชิงหวา ได้เปิดเผยแนวทางใหม่ที่อาจพลิกโฉมวงการโมเดลภาษาขนาดใหญ่ (LLMs) โดยมุ่งหวังที่จะยกระดับความเฉลียวฉลาดและประสิทธิภาพในการทำงานให้เหนือกว่าคู่แข่ง
DeepSeek เคยสร้างความฮือฮาไปเมื่อเดือนมกราคมที่ผ่านมา ด้วยการเปิดตัว R1 โมเดลปัญญาประดิษฐ์และแชทบอทที่บริษัทเคลมว่ามีต้นทุนต่ำกว่า แต่ให้ประสิทธิภาพเทียบเคียงได้กับ ChatGPT โมเดลคู่แข่งจาก OpenAI
ล่าสุด ในงานวิจัยที่เผยแพร่ใน arXiv คลังเก็บเอกสารอิเล็กทรอนิกส์ที่นักวิจัยนิยมเข้ามาแบ่งปันผลงานของตน DeepSeek ได้ประกาศความร่วมมือกับนักวิจัยจากมหาวิทยาลัยชิงหวา ในการพัฒนาเทคนิคที่ช่วยให้โมเดล AI สามารถพัฒนาศักยภาพของตนเองได้อย่างต่อเนื่อง
หัวใจสำคัญของเทคโนโลยีนี้คือ Self-Principled Critique Tuning (SPCT) ซึ่งเป็นกระบวนการฝึกฝนให้ AI สามารถสร้างหลักเกณฑ์หรือกฎสำหรับการประเมินคุณภาพของเนื้อหาที่สร้างขึ้นได้ด้วยตัวเอง จากนั้นจึงใช้กฎเหล่านั้นในการวิเคราะห์วิจารณ์ผลลัพธ์ที่ได้มาอย่างละเอียดถี่ถ้วน
SPCT ช่วยให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้น โดยอาศัยการประเมินผลลัพธ์หลายรายการไปพร้อมๆ กัน แทนที่จะพึ่งพาโมเดลที่มีขนาดใหญ่ขึ้นเพียงอย่างเดียว แนวทางนี้รู้จักกันในชื่อ Generative Reward Modeling (GRM)
ซึ่งเป็นระบบการเรียนรู้ของเครื่องที่ทำหน้าที่ตรวจสอบและให้คะแนนผลลัพธ์ที่สร้างโดยโมเดล AI เพื่อให้มั่นใจว่าสอดคล้องกับความต้องการของผู้ใช้งาน โดยมี SPCT เป็นกลไกสำคัญในการปรับปรุง
กลไกการทำงานโดยสังเขป
โดยปกติแล้ว การพัฒนา AI ให้มีความสามารถสูงขึ้น มักจะต้องขยายขนาดของโมเดลในขั้นตอนการฝึกฝน ซึ่งต้องอาศัยทรัพยากรบุคคลและพลังประมวลผลมหาศาล
แต่ DeepSeek ได้สร้างระบบที่มี "ผู้ตัดสิน" ในตัว ซึ่งสามารถประเมินคำตอบของ AI ได้แบบเรียลไทม์
เมื่อผู้ใช้ตั้งคำถาม ตัวตัดสินนี้จะทำการเปรียบเทียบคำตอบที่ AI กำลังจะสร้างขึ้น กับทั้งหลักการพื้นฐานของ AI เอง และลักษณะของคำตอบที่ดีที่ควรจะเป็น
หากคำตอบมีความใกล้เคียงกับเกณฑ์ที่กำหนด AI จะได้รับข้อมูลป้อนกลับเชิงบวก ซึ่งจะกระตุ้นให้ AI พัฒนาปรับปรุงตัวเองให้ดียิ่งขึ้น
DeepSeek เรียกขานระบบการพัฒนาตนเองนี้ว่า "DeepSeek-GRM" และนักวิจัยเชื่อมั่นว่า เทคนิคนี้จะช่วยให้โมเดลของพวกเขามีประสิทธิภาพเหนือกว่าคู่แข่งรายอื่นๆ เช่น Gemini ของ Google, Llama ของ Meta และ GPT-4o ของ OpenAI
ทั้งนี้ DeepSeek มีแผนที่จะเปิดตัวโมเดล AI ขั้นสูงเหล่านี้ในรูปแบบโอเพนซอร์ส เพื่อให้ชุมชนนักพัฒนาสามารถนำไปใช้งานและต่อยอดได้ แต่ยังไม่มีการกำหนดกรอบเวลาที่ชัดเจนสำหรับการเปิดตัวดังกล่าว