หมดปัญหาถอดเทป Alibaba เปิดตัว AI ตอบคำถามวีดีโอเรียลไทม์

08 เมษายน 2568

Alibaba เปิดตัว Qwen2.5 Omni และ QVQ-Max โมเดล AI ที่เข้าใจภาพ เสียง วิดีโอ พร้อมคิด วิเคราะห์ และตอบสนองแบบเรียลไทม์

Alibaba cloud เปิดตัวโมเดลใหม่ในตระกูล Qwen อีก 2 รุ่น ได้แก่ Qwen2.5 Omni ที่สามารถรับรู้ข้อมูลทั้งในรูปแบบภาพ เสียง และวีดีโอ พร้อมสามารถตอบสนองเนื้อหาเหล่านั้นแบบเรียลไทม์ และ Qwen2.5 QVQ-Max โมเดลที่ช่วยอ่านภาพแล้วคิดก่อนตอบ

 

Qwen2.5 Omni เป็นโมเดล Multimodal ที่ประมวลผลเนื้อหาได้หลากหลาย โดยมีจุดเด่นสำคัญคือสถาปัตยกรรม Thinker-Talker โดยแบ่งเป็นส่วนที่ทำการประมวลผลและทำความเข้าใจเนื้อหาข้อมูลหลายมิติ กับส่วนทำหน้าที่ตอบสนองและสร้างเนื้อหาแบบเสียงอย่างลื่นไหล

 

นั่นทำให้ Qwen2.5 Omni เป็นโมเดล AI ที่สามารถตรวจสอบ วิเคราะห์ข้อมูล และตอบคำถามแก่ผู้ใช้งานได้แบบเรียลไทม์ สามารถตอบคำถามหรือไขข้อสงสัยได้ทันทีแม้ในระหว่างการวิเคราะห์ข้อมูล สะดวกต่อการตรวจสอบเนื้อหาหรือแกะเทปต่างๆ  พร้อมสามารถอธิบายและประมวลผลเนื้อหาได้อย่างเป็นธรรมชาติ

 

อีกหนึ่งโมเดลที่ได้รับการเปิดตัวพร้อมกันคือ Qwen2.5 QVQ-Max โมเดลการให้เหตุผลรุ่นใหม่ ทีสามารถแกะรายละเอียดข้อมูลภาพ ด้วยคุณสมบัติการสังเกตและวิเคราะห์อย่างละเอียดจากภาพและวีดีโอที่ป้อนสู่ระบบ และสามารถทำความเข้าใจพร้อมระบุรายละเอียดทั้งหมดได้อย่างรวดเร็ว

 

ผลลัพธ์ที่ได้ช่วยให้โมเดลนี้มีขีดความสามารถในการวิเคราะห์โดยใช้เหตุผลร่วมกับเนื้อหาได้หลากหลาย ตั้งแต่แผนภูมิ ภาพถ่าย ไปจนคลิปวีดีโอ ซึ่งจะช่วยให้การวิเคราะห์และสร้างสรรค์เนื้อหาใหม่ๆ ทั้งด้านภาพ คลิปวีดีโอ แผนภูมิ หรือแม้แต่การเขียนโค้ดมีประสิทธิภาพมากยิ่งขึ้น

 

ปัจจุบัน Qwen2.5 Omni และ Qwen2.5 QVQ-Max เปิดให้ใช้งานแล้วบน Qwen Chat

Thailand Web Stat