Google เปิดตัว DolphinGemma โมเดล AI แปลภาษาโลมาตัวแรกของโลก
Google เปิดตัว DolphinGemma โมเดล AI ตัวแรกของโลกที่สามารถถอดรหัสเสียงโลมา หวังสื่อสารกับสัตว์ทะเลได้อย่างลึกซึ้ง
ที่ผ่านมาเราอาจเคยได้ยิน AI ทำงานและมีขีดความสามารถหลากหลาย แต่วันนี้เราจะยกระดับไปอีกขั้นเมื่อ Google เปิดตัว AI ใหม่ในชื่อ DolphinGemma โมเดลภาษาที่ใช้ในการถอดรหัสเสียงร้องเฉพาะของโลมา และสามารถแปลภาษาโลมาออกมาสำเร็จตัวแรกของโลก
โลมาเป็นสิ่งมีชีวิตความฉลาดสูงและมีภาษาสื่อสารของตัวเอง ด้วยเหตุนี้ Google จึงได้นำโมเดล AI อย่าง Gemma มาเทรนด้วยข้อมูลเสียงและภาพโลมาจาก Georgia Tech และ Wild Dolphin Project (WDP) ทีเก็บรวบรวมข้อมูลโลมาตั้งแต่ปี 1985 เพื่อเรียนรู้รูปแบบและพฤติกรรมโลมาอย่างละเอียด
จนประสบความสำเร็จออกมาเป็น DolphinGemma โมเดล AI ขนาดกลางที่สามารถประมวลผลบนสมาร์ทโฟน Pixel อาศัยเทคโนโลยี SoundStream ของ Google ในการแปลงเสียงร้องโลมาเป็นโทเคน เพื่อให้สามารถประมวลผลเนื้อหา อารมณ์ และพฤติกรรมการสนทนาของโลมา
ในขั้นต้น DolphinGemma ทำให้เข้าใจอารมณ์และรูปแบบการกระทำในระหว่างการส่งเสียงได้ดีขึ้น จนสามารถทำความเข้าใจการสื่อสารกับโลมาและสื่อสารเนื้อหาตอบกลับไป แต่ยังมีความท้าทายอีกหลายด้าน โดยเฉพาะการแยกแยะรูปแบบเสียงร้องของโลมาว่า มีโครงสร้างภาษาและรูปแบบการสื่อสารแบบมนุษย์หรือไม่
DolphinGemma จะช่วยให้เราสามารถสื่อสารกับสัตว์ได้มากและลึกซึ้งขึ้น ซึ่งจะช่วยในการทำความเข้าใจระบบความคิด สติปัญญา และวัฒนธรรมของท้องทะเลได้ลึกซึ้งยิ่งขึ้น นอกจากนี้ทีมวิจัยยังคาดหวังจะพัฒนาอุปกรณ์ให้สามารถทำการสื่อสารกับวาฬหรืออีกาเป็นลำดับถัดไป