posttoday

มิติใหม่แห่งการคุยกับตัวเอง อวาตาร์ AI ที่จำลองตัวเราผ่านวีดีโอคอล

03 มกราคม 2568

ที่ผ่านมาเราได้เห็นเสียงและภาพที่จำลองขึ้นมาจาก AI มาไม่น้อย บางครั้งอาจมีจุดสังเกตที่ชัดเจนหรืออาจเหมือนจริงจนแยกไม่ออก แต่จะเป็นอย่างไรถ้า อวาตาร์ AI สามารถจำลองเป็นเราได้ผ่านวีดีโอคอล

ช่วงที่ผ่านมานับเป็นปีทองแห่งการพัฒนา AI หรือ ปัญญาประดิษฐ์ อย่างแท้จริง จากความก้าวหน้าทางเทคโนโลยีที่ทำให้โมเดล AI มีขีดความสามารถสูงขึ้นเรื่อยๆ เห็นได้ชัดจากความก้าวหน้าของ AI Chatbot เจ้าต่างๆ ที่มีศักยภาพและฟังก์ชันการใช้งานเพิ่มขึ้นอย่างก้าวกระโดด

 

ล่าสุดกำลังจะล้ำไปอีกขั้นเมื่อเราสามารถสนทนาผ่าน AI ที่เป็นตัวเราได้ผ่านวีดีโอคอล

 

มิติใหม่แห่งการคุยกับตัวเอง อวาตาร์ AI ที่จำลองตัวเราผ่านวีดีโอคอล

 

จากอวาตาร์ AI สู่การสร้างภาพจำลองของตัวเรา

 

ปัจจุบันการสร้างอวาตาร์ AI ขึ้นมาพูดถ่ายทอดเนื้อหาที่ต้องการเป็นเรื่องที่พบเห็นได้ทั่วไป มีโปรแกรมที่สามารถสร้างคลิปวีดีโอเหล่านี้หลายรูปแบบ สามารถเลือกได้ตั้งแต่รูปร่างหน้าตา น้ำเสียง นิสัย อายุ หรือรูปแบบการสนทนาที่ต้องการถ่ายทอด เพื่อให้สอดคล้องกับวัตถุประสงค์ที่ต้องการนำไปใช้งาน

 

ด้วยเหตุนี้เราจึงสามาถรพบเห็นการใช้งานอวาตาร์ AI ตามคลิปวีดีโอ ไปจนการสนทนาคู่สายต่างๆ เป็นจำนวนมาก ตั้งแต่การพรีเซนต์งาน การนำเสนอสินค้า จัดทำสื่อการสอน ถ่ายทอดเนื้อหาคอนเทนต์ ไปจนการอ่านหนังสือเสียง ช่วยสนับสนุนการทำงานในหลายด้าน

 

ล่าสุดไม่เพียงแค่การสร้างอวาตาร์สมมติขึ้นมาบนโลกออนไลน์เท่านั้น เราสามารถสร้าง “ตัวเรา” ในรูปแบบดิจิทัลพร้อมพูดคุยตอบสนองจากการประมวลผลของ AI แบบเรียลไทม์ ที่ไม่เพียงสามารถพูดคุยตอบโต้กับคู่สนทนาที่พูดคุยด้วยเสียงของเราเองเท่านั้น แต่ยังตอบสนองต่อปัจจัยแวดล้อมอื่น เช่น เสียง ภาพ ไปจนภาษากายของเราได้ด้วย

 

ขั้นตอนการสร้างอวาตาร์ AI ของเราก็เรียบง่าย อย่างบริษัท Pickle จะอาศัยวีดีโอแนะนำตัว พูดคุย และท่าทางของเราที่มีความยาว 5 นาที จากนั้นก็สามารถสร้างอวาตาร์ของบุคคลนั้นออกมาได้ภายใน 24 ชั่วโมง หรือ Travas ที่อาศัยเพียงคลิปวีดีโอความยาว 2 นาที ก็สามารถจับลักษณะหน้าตา ท่าทาง และเสียงแล้วจำลองขึ้นใหม่อย่างสมจริง

 

คาดว่าเทคโนโลยีการสร้างอวาตาร์ AI ส่วนบุคคลอาจเปิดให้ใช้งานอย่างแพร่หลายในไม่ช้า

 

มิติใหม่แห่งการคุยกับตัวเอง อวาตาร์ AI ที่จำลองตัวเราผ่านวีดีโอคอล

 

ศักยภาพและประโยชน์ของอวาตาร์ AI ส่วนบุคคล

 

อวาตาร์ส่วนบุคคลที่ทำการจำลองขึ้นมาสามารถพูดคุยตอบโต้บทสนทนาอย่างลื่นไหล อ้างอิงจาก Travas การพูดคุยกับอวาตาร์ AI จะมีดีเลย์การตอบสนองอยู่ที่ราว 0.6 วินาทีเท่านั้น ทำให้สามารถโต้ตอบบทสนทนาได้ต่อเนื่องไม่แตกต่างจากคนจริง

 

นอกจากตอบรับบทสนทนาเรียลไทม์ อวาตาร์ AI ยังมีคุณสมบัติในการรับรู้ภาพและเสียงผ่านวีดีโอคอล สามารถสังเกตสภาพแวดล้อมแล้วนำมาเป็นหัวข้อบทสนทนา เช่น ชื่นชมธรรมชาติที่อยู่รอบตัว หรือวิเคราะห์ไลฟ์สไตล์ของคู่สนทนาได้จากข้าวของภายในห้องอีกด้วย

 

อีกหนึ่งจุดเด่นสำคัญของอวาตาร์ AI นี้คือ การขยับปาก น้ำเสียง สายตา สีหน้า ไปจนท่าทางการแสดงออกที่มีความสอดคล้อง แม้จะยังไม่สมบูรณ์เทียบเท่าคนจริงยังมีจุดให้สังเกตความผิดปกติอยู่บ้าง แต่หากไม่ตั้งใจสังเกตก็อาจไม่สามารถแยกแยะได้ และคาดว่าส่วนนี้จะได้รับการปรับปรุงในไม่ช้า

 

ด้วยเหตุนี้อวตาร์ AI จึงมีประโยชน์อย่างยิ่งในงานขาย โดยเฉพาะอวาตาร์ AI ที่เป็นภาพแทนตัวเรา ข้อมูลจากบริษัท Pickle อวาตาร์ AI ของพวกเขาจะรองรับการใช้งานร่วมกับโปรแกรมวีดีโอคอลต่างๆ เช่น Zoom, Google team ไปจนโปรแกรมสนทนาอื่นผ่านทั้ง Windows และ macOS ช่วยให้เราพร้อมวีดีโอคอลพูดคุยสนทนาได้ทุกที่ทุกเวลา

 

อีกหนึ่งจุดเด่นของอวาตาร์ AI ส่วนบุคคลคือ รองรับการใช้งานหลายภาษา อวตาร์ AI สามารถแปลภาษาการสนทนาแบบเรียลไทม์ได้ด้วยเสียงของผู้ใช้งาน โดยไม่สูญเสียน้ำเสียง โทนเสียง และเนื้อหาที่ต้องการถ่ายทอดได้แบบเรียลไทม์ สิ่งนี้จะเป็นประโยชน์อย่างยิ่งในการสื่อสารกับชาวต่างชาติ

 

นั่นทำให้ในอนาคตเราอาจสามารถพูดคุยสนทนาหลายภาษาให้เข้ากับคู่สนทนาพร้อมกันได้เลยทีเดียว

 

มิติใหม่แห่งการคุยกับตัวเอง อวาตาร์ AI ที่จำลองตัวเราผ่านวีดีโอคอล

 

ข้อจำกัดและความน่ากลัวของอวาตาร์ AI

 

การสร้างอวาตาร์ AI ที่ง่ายดายและสะดวกย่อมนำไปสู่มิติใหม่แห่งการต้มตุ๋น โดยเฉพาะการหลอกลวงทางออนไลน์ที่ทวีความรุนแรงในปัจจุบัน จากการที่สามารถสร้างอวาตาร์ AI ที่พูดด้วยเสียงและท่าทีของเราได้ อาจนำไปสู่การเก็บข้อมูลภาพและเสียงจากโลกออนไลน์ จากนั้นจึงนำไปหลอกญาติพี่น้องหรือคนใกล้ชิดโดยเฉพาะกลุ่มผู้สูงอายุ

 

อันดับต่อมาคือเมื่อประเมินแนวโน้มจากขีดความสามารถของ AI ในปัจจุบัน ข้อมูลจากงานวิจัยในเดือนเมษายน 2024 พบว่า GPT-4 ของ OpenAI มีประสิทธิภาพในการโน้มน้าวอารมณ์ของคู่สนทนาได้มากถึง 82% ซึ่งมากกว่าคู่สนทนาที่เป็นมนุษย์ รวมถึงสามารถคาดการณ์อารมณ์ของคู่สนทนาได้ โดยอาศัยน้ำเสียงและคำศัพท์ที่ใช้งานระหว่างสนทนา

 

นอกจากนี้ในปี 2021 ยังมีงานวิจัยเกี่ยวกับการวิเคราะห์ภาษากายของเราจาก AI พบว่า ปัญญาประดิษฐ์สามารถตรวจสอบการเคลื่อนไหวของดวงตา ทั้งการกระพริบตา การเคลื่อนไหวของดวงตา การจ้องมอง ไปจนการขยายรูม่านตา เพื่อใช้ในการทำนายบุคลิกภาพ ลักษณะนิสัย ความสนใจ ความชอบ ไปจนโรคภัยไข้เจ็บของคู่สนทนาเลยทีเดียว

 

นั่นทำให้ในอนาคตเราอาจได้เห็นเครื่องมือโน้มน้าวใจที่มีประสิทธิภาพสูงสุดในประวัติศาสตร์ ข้อมูลของเราจะถูก AI ประเมินและคาดการณ์ออกมาเป็นหน้ากระดาษโดยอาศัยการสนทนาสั้นๆ ไม่กี่นาที แน่นอนว่านี่เป็นเรื่องน่ากลัวอย่างยิ่งหากใช้ในการหลอกลวงบนโลกออนไลน์ แต่จะยิ่งน่ากลัวกว่านั้นเมื่อสิ่งนี้ถูกนำไปใช้ในบริษัทยักษ์ใหญ่

 

จินตนาการได้ไม่ยากว่าถ้าเทคโนโลยีนี้ถูกนำไปใช้ในฐานะพนักงานขายสินค้าและบริการ สร้างข้อมูลเท็จ สร้างคนรักเสมือนจริง หรือแม้แต่เครื่องมือจูงใจทางการเมือง บ่มเพาะสร้างความเกลียดชังต่างๆ จะสามารถเปลี่ยนแปลง ผลักดัน ไปจนชักจูงผู้คนสังคมไปในทิศทางใดได้บ้าง

 

ในเมื่อปัจจุบันแค่ข้อมูลการเยี่ยมชมและใช้งานเว็บไซต์ก็ทำให้เรารู้สึกขนหัวลุกในบางครั้งแล้ว

 

 

 

อย่างไรก็ตามใช่ว่าอวาตาร์ AI จะมีเพียงข้อเสีย คุณสมบัติโน้มน้าวและชักจูงจิตใจอาจช่วยชีวิตคนได้มากไม่แพ้กัน เช่น การใช้งานในฐานะนักบำบัด ที่ปรึกษา ผู้ฝึกสอน โค้ช ไปจนการเป็นเพื่อคุยต่างๆ ซึ่งอาจช่วยลดโอกาสในการเกิดโรคจิตเวชและอัตราการฆ่าตัวตายลงได้เช่นกัน

 

ที่เหลือเราคงต้องรอดูต่อไปว่าอวาตาร์ AI นี้จะถูกพัฒนาให้เกิดประโยชน์หรือสร้างปัญหาใดแก่สังคมบ้าง

 

 

 

ที่มา

 

https://techcrunch.com/2024/11/23/how-a-digital-you-can-sit-through-your-agonizing-web-conference-calls/

 

https://newatlas.com/ai-humanoids/tavus-heygen-conversational-video-ai/

 

https://newatlas.com/science/science/eye-tracking-privacy/

 

https://www.youtube.com/watch?v=uMEkBbJc3dU&t=3s&ab_channel=Pickle

 

https://www.youtube.com/watch?v=OZthIm5W-yQ&ab_channel=Tavus