หมดปัญหาถอดเทป Alibaba เปิดตัว AI ตอบคำถามวีดีโอเรียลไทม์

08 เมษายน 2568

Alibaba เปิดตัว Qwen2.5 Omni และ QVQ-Max โมเดล AI ที่เข้าใจภาพ เสียง วิดีโอ พร้อมคิด วิเคราะห์ และตอบสนองแบบเรียลไทม์

Alibaba cloud เปิดตัวโมเดลใหม่ในตระกูล Qwen อีก 2 รุ่น ได้แก่ Qwen2.5 Omni ที่สามารถรับรู้ข้อมูลทั้งในรูปแบบภาพ เสียง และวีดีโอ พร้อมสามารถตอบสนองเนื้อหาเหล่านั้นแบบเรียลไทม์ และ Qwen2.5 QVQ-Max โมเดลที่ช่วยอ่านภาพแล้วคิดก่อนตอบ

Qwen2.5 Omni เป็นโมเดล Multimodal ที่ประมวลผลเนื้อหาได้หลากหลาย โดยมีจุดเด่นสำคัญคือสถาปัตยกรรม Thinker-Talker โดยแบ่งเป็นส่วนที่ทำการประมวลผลและทำความเข้าใจเนื้อหาข้อมูลหลายมิติ กับส่วนทำหน้าที่ตอบสนองและสร้างเนื้อหาแบบเสียงอย่างลื่นไหล

นั่นทำให้ Qwen2.5 Omni เป็นโมเดล AI ที่สามารถตรวจสอบ วิเคราะห์ข้อมูล และตอบคำถามแก่ผู้ใช้งานได้แบบเรียลไทม์ สามารถตอบคำถามหรือไขข้อสงสัยได้ทันทีแม้ในระหว่างการวิเคราะห์ข้อมูล สะดวกต่อการตรวจสอบเนื้อหาหรือแกะเทปต่างๆ พร้อมสามารถอธิบายและประมวลผลเนื้อหาได้อย่างเป็นธรรมชาติ

อีกหนึ่งโมเดลที่ได้รับการเปิดตัวพร้อมกันคือ Qwen2.5 QVQ-Max โมเดลการให้เหตุผลรุ่นใหม่ ทีสามารถแกะรายละเอียดข้อมูลภาพ ด้วยคุณสมบัติการสังเกตและวิเคราะห์อย่างละเอียดจากภาพและวีดีโอที่ป้อนสู่ระบบ และสามารถทำความเข้าใจพร้อมระบุรายละเอียดทั้งหมดได้อย่างรวดเร็ว

ผลลัพธ์ที่ได้ช่วยให้โมเดลนี้มีขีดความสามารถในการวิเคราะห์โดยใช้เหตุผลร่วมกับเนื้อหาได้หลากหลาย ตั้งแต่แผนภูมิ ภาพถ่าย ไปจนคลิปวีดีโอ ซึ่งจะช่วยให้การวิเคราะห์และสร้างสรรค์เนื้อหาใหม่ๆ ทั้งด้านภาพ คลิปวีดีโอ แผนภูมิ หรือแม้แต่การเขียนโค้ดมีประสิทธิภาพมากยิ่งขึ้น

ปัจจุบัน Qwen2.5 Omni และ Qwen2.5 QVQ-Max เปิดให้ใช้งานแล้วบน Qwen Chat

หมดปัญหาถอดเทป Alibaba เปิดตัว AI ตอบคำถามวีดีโอเรียลไทม์

Alibaba เปิดตัว Qwen2.5 Omni และ QVQ-Max โมเดล AI ที่เข้าใจภาพ เสียง วิดีโอ พร้อมคิด วิเคราะห์ และตอบสนองแบบเรียลไทม์

ข่าวล่าสุด

ประธานปปช.ลงลุยเอง สอบ”ปธ.บห.-CEO KTB” สรรหาบอร์ดโดยไม่ชอบ

เบื้องหลังลดค่าไฟ คือกลไกที่ กกพ.วางระบบ หาใช่ผลงานของ รมต.

ตลท. ปูทาง "ตั้งกระดานเทรดใหม่" ดึงบริษัท New Economy ต่างชาติเทรด

"จุลพันธ์" เผย 4 บริษัทยักษ์ สนใจลงทุน Entertainment Complex ในไทย

“ดีอี” ดันมาตรฐานซอฟต์แวร์ AI-Green หนุน SME ใช้ซอฟต์แวร์คุณภาพ