Scribe โมเดล AI ถอดเสียงเป็นข้อความที่รองรับภาษาไทย

01 มีนาคม 2568

เปิดตัว Scribe โมเดล AI ถอดเสียงเป็นข้อความตัวใหม่ รองรับการใช้งานกว่า 99 ภาษา รวมถึงภาษาไทย พร้อมคุณสมบัติในการสรุปเนื้อหา ประทับเวลา และแยกเสียงผู้พูด

ElevenLabs สตาร์อัพด้าน AI เปิดตัวโมเดลปัญญาประดิษฐ์ตัวใหม่ในชื่อ Scribe ที่มีคุณสมบัติในการแปลงคำพูดในรูปแบบเสียงออกมาเป็นข้อความ ชูจุดเด่นในด้านความแม่นยำอย่างสมบูรณ์แบบในการแกะเนื้อหา พร้อมการรองรับภาษาต่างๆ ทั่วโลกมากถึง 99 ภาษา

 

แน่นอนโปรแกรมแกะเสียงพูดออกมาเป็นข้อความไม่ใช่ของใหม่ หลายบริษัทต่างพัฒนาโปรแกรมหรือ AI รองรับการใช้งานส่วนนี้ สิ่งที่ทำให้ Scribe แตกต่างจากเจ้าอื่นคือ จำนวนภาษารองรับการใช้งานที่มีมากถึง 99 ภาษา หนึ่งในนั้นยังมีภาษาไทยให้ใช้งานอีกด้วย

 

จุดเด่นสำคัญของ Scribe ไม่ใช่แค่รองรับภาษาได้หลากหลาย ความแม่นยำก็โดดเด่น ในขั้นตอนการทดสอบมีอยู่ 25 ภาษาที่มีความแม่นยำดีเยี่ยมอยู่ที่ 97% ส่วนภาษาอื่นจะมีความแม่นยำในการถอดความลดหลั่นกันไป สำหรับภาษาไทยมีค่าความแม่นยำเฉลี่ยอยู่ที่ 88.4% ขณะที่ Gemini Flash 2 มีค่าความแม่นยำอยู่ที่ 82.1% เท่านั้น

 

อีกหนึ่งจุดเด่นของ AI ตัวนี้คือ ไฟล์เสียงที่ทำการถอดความออกมาจะถูกสรุปเนื้อหาและหัวข้อสนทนาออกมาแล้ว Scribe ยังสามารถแยกแยะน้ำเสียงว่าใครเป็นคนพูด ในช่วงเวลาเท่าไหร่ พูดออกมาจากทิศทางไหน และยังสามารถเก็บข้อมูลเสียงบรรยากาศภายในเนื้อหา เช่น เสียงดังแทรก หรือ เสียงหัวเราะของผู้ชมได้อีกด้วย

 

ปัจจุบัน Scribe รองรับการใช้งานร่วมกับไฟล์เสียงที่ได้รับการบันทึกไว้เท่านั้น จึงอาจมีข้อจำกัดการใช้งานในบางด้าน แต่ในอนาตคพวกเขาตั้งใจจะพัฒนาให้สามารถถอดเนื้อหาที่พูดออกมา พร้อมปรากฏเป็นซับไตเติ้ลระหว่างการสนทนาได้แบบเรียลไทม์อีกด้วย

 

สำหรับท่านที่สนใจสามารถทดลองใช้ Scribe ได้ ส่วนค่าบริการนั้น Scribe คิดค่าใช้จ่ายในการถอดเสียงชั่วโมงละ 0.4 ดอลลาร์(ราว 13.50 บาท)

Thailand Web Stat