จีนรุกหนัก! Alibaba เปิดตัวโมเดล AI ที่อ้างว่าเหนือกว่า DeepSeek-V3
วงการ AI คึกคัก บริษัทเทคโนโลยีของจีน Alibaba เปิดตัวโมเดลปัญญาประดิษฐ์ Qwen 2.5 เวอร์ชันใหม่ในวันพุธ ซึ่งบริษัทอ้างว่าเหนือกว่า DeepSeek-V3 ที่ได้รับการยกย่องอย่างสูงทั่วโลก
ถือเป็นช่วงเวลาที่ผิดปกติ ในการเปิดตัว Qwen 2.5-Max ในวันแรกของปีใหม่ทางจันทรคติ ซึ่งเป็นช่วงที่ชาวจีนส่วนใหญ่หยุดงานและเฉลิมฉลองกับครอบครัว ชี้ให้เห็นถึงแรงกดดันที่บริษัทสตาร์ทอัพด้าน AI ของจีนอย่าง DeepSeek พุ่งสูงขึ้นในช่วงสามสัปดาห์ที่ผ่านมา ไม่ใช่แค่คู่แข่งในต่างประเทศ แต่ยังรวมถึงการแข่งขันในประเทศด้วย
“Qwen 2.5-Max มีประสิทธิภาพเหนือกว่า … (ผู้เล่น) เกือบจะทั่วทั้งกระดาน GPT-4o, DeepSeek-V3 และ Llama-3.1-405B” หน่วยคลาวด์ของ Alibaba กล่าวในประกาศที่โพสต์บนบัญชี WeChat อย่างเป็นทางการ โดยอ้างถึง OpenAI และ Meta
การเปิดตัวผู้ช่วย AI ของ DeepSeek เมื่อวันที่ 10 มกราคม ซึ่งขับเคลื่อนโดยรุ่น DeepSeek-V3 รวมถึงการเปิดตัวรุ่น R1 ในวันที่ 20 มกราคม สร้างความตกตะลึงให้กับซิลิคอนแวลลีย์ และทำให้หุ้นเทคโนโลยีร่วงลง โดยคาดว่าสตาร์ทอัพจากจีนจะมีต้นทุนการพัฒนาและต้นทุนการใช้งานต่ำกว่าชาติตะวันตก ทำให้นักลงทุนตั้งคำถามถึงแผนการใช้จ่ายจำนวนมากของบริษัท AI ชั้นนำในสหรัฐอเมริกา
แต่ความสำเร็จของ DeepSeek ก็ยังนำไปสู่แรงกดดันในหมู่คู่แข่งในประเทศจีน เพื่ออัพเกรดโมเดล AI ของตนเองอีกด้วย
สองวันหลังจากการเปิดตัว DeepSeek-R1 เจ้าของ TikTok ByteDance ได้เปิดตัวการอัปเดตโมเดล AI ที่เป็นเรือธง ซึ่งอ้างว่ามีประสิทธิภาพเหนือกว่า o1 ของ OpenAI ที่สนับสนุนโดย Microsoft ใน AIME ซึ่งเป็นการทดสอบเกณฑ์มาตรฐานที่วัดว่าโมเดล AI เข้าใจและตอบสนองต่อคำสั่งที่ซับซ้อนได้ดีเพียงใด
สิ่งนี้สอดคล้องกับคำกล่าวอ้างของ DeepSeek ที่ว่าโมเดล R1 ทัดเทียมกับ o1 ของ OpenAI ในด้านการวัดประสิทธิภาพหลายประการ