โมเดลภาษารูปแบบใหม่ที่ช่วยระบุวรรณยุกต์จากคลื่นสมอง
การอ่านคลื่นสมองถือเป็นอีกหนึ่งเทคโนโลยีแห่งอนาคตที่เริ่มได้รับความสนใจมากขึ้น แต่ด้วยข้อจำกัดทางเทคโนโลยีและภาษาทำให้การเชื่อมต่อคลื่นสมองติดขัดไปบ้าง แต่ทุกอย่างจะเปลี่ยนไปจากการมาถึงของโมเดลภาษารูปแบบใหม่ที่ช่วยระบุเสียงวรรณยุกต์
สำหรับท่านที่เรียนและศึกษาหลายภาษาย่อมเข้าใจความแตกต่างของธรรมชาติในแต่ละภาษา โดยเฉพาะกับประเด็นและแนวคิดในด้านวรรณยุกต์ ที่แม้คนไทยจะได้เรียนรู้ทำความเข้าใจมาแต่เด็ก หากสำหรับชาติที่ใช้ภาษาที่ไม่มีวรรณยุกต์ นี่ถือเป็นเรื่องชวนฉงนยากต่อการทำความเข้าใจ
ด้วยเหตุนี้การพัฒนาเทคโนโลยีเกี่ยวข้องกับภาษาจึงมีข้อติดขัดในหลายด้าน เมื่อไม่สามารถทำความเข้าใจรูปแบบภาษาได้จึงทำให้การออกแบบโปรแกรมและระบบหลายส่วนติดขัด ทำให้เทคโนโลยีบางชนิดเราอาจมีข้อจำกัดในการใช้งานในฉบับภาษาไทยพอสมควร โดยเฉพาะเทคโนโลยีซับซ้อนอย่างการเชื่อมต่อและอ่านคลื่นสมอง
ล่าสุดมีการคิดค้นโมเดลภาษารูปแบบใหม่ที่ช่วยระบุวรรณยุกต์ได้แล้วก็จริง แต่คงต้องขยายความเพิ่มเติมต่อเทคโนโลยีและความยุ่งยากซับซ้อนเกี่ยวกับภาษาจากคลื่นสมองกันเสียหน่อย
เทคโนโลยีการอ่านคลื่นสมองที่ก้าวหน้าขึ้นทุกวัน
หลายท่านอาจรู้สึกว่าการเชื่อมต่อและอ่านคลื่นสมองเป็นเทคโนโลยีล้ำยุคและแปลกใหม่ แต่ความจริงการอ่านคลื่นสมองเป็นเทคโนโลยีที่มีการใช้งานมายาวนาน ทั้งในฐานะอุปกรณ์เพิ่มความสะดวก เครื่องมือช่วยเหลือ ไปจนอุปกรณ์การแพทย์
อุปกรณ์ที่สามารถเรียกเสียงฮือฮาเป็นวงกว้างย่อมต้องเป็น Neuralink กับการผ่าตัดฝังชิปคอมพิวเตอร์เข้าสู่สมองโดยตรงของ อีลอน มัสก์ จากคุณสมบัติในการเชื่อมโยงสมองของเราให้เชื่อมต่อกับคอมพิวเตอร์ได้ตลอดเวลา, บันทึกค่าสถิติทางสุขภาพ ไปจนใช้งานเพื่อรักษาโรคทางสมองและระบบประสาท จนได้รับการอนุมัติจาก FDA ให้ทดลองทางคลินิกในที่สุด
กระนั้นเดิมทีการใช้งานอุปกรณ์เชื่อมต่อคลื่นสมองกับคอมพิวเตอร์ เกิดขึ้นมาตั้งแต่เทคโนโลยี BCI หรือ Brain–computer interface ที่ใช้อุปกรณ์ตรวจจับสวมใส่หรือฝังลงในกะโหลกศีรษะ โดยจะทำการตรวจจับสัญญาณไฟฟ้าจากสมองเพื่อถ่ายทอดไปยังอุปกรณ์ภายนอกโดยตรง ไม่ผ่านการสั่งการของระบบประสาทและกล้ามเนื้อ
เดิมระบบ BCI ได้รับการออกแบบเพื่อใช้งานกับผู้พิการ ผู้มีความบกพร่องทางการพูด หรือผู้ป่วยติดเตียงเป็นหลัก หากให้ยกตัวอย่างผู้ที่ใช้อุปกรณ์นี้ในชีวิตประจำวันคือ สตีเฟน ฮอว์คิง นักวิทยาศาสตร์เลื่องชื่อผู้ป่วยโรคกล้ามเนื้ออ่อนแรง อุปกรณ์นี้ช่วยให้เขาทำการสื่อสารได้อีกครั้ง
แน่นอนการผู้พัฒนาเทคโนโลยีคลื่นสมองไม่ได้มีเพียงเท่านี้ ความพยายามในการพัฒนานำไปสู่การคิดค้น Neuroprosthesis อุปกรณ์สวมใส่ที่ช่วยแปลงสัญญาณจากสมองเป็นตัวอักษรแบบเรียลไทม์ ซึ่งครอบคลุมการใช้งานคำศัพท์เพื่อการสื่อสารผ่านภาษาอังกฤษกว่า 85%
จึงไม่ใช่เรื่องแปลกที่หลายคนต่างมองว่านี่เป็นอีกหนึ่งเทคโนโลยีแห่งอนาคตเช่นกัน กระนั้นก็ยังมีข้อจำกัดสำคัญที่ทำให้โมเดลภาษารูปแบบใหม่ที่ช่วยระบุวรรณยุกต์จำเป็น
ข้อจำกัดทางภาษาที่กีดขวางเทคโนโลยี
ในหัวข้อการสื่อสารส่วนใหญ่ย่อมต้องมีเรื่องภาษาเข้ามาเกี่ยวข้อง เราทราบดีว่าภาษาสากลที่ใช้งานกันทั่วโลกโดยเฉพาะในแวดวงเทคโนโลยีล้วนเป็นภาษาอังกฤษ เพื่อความสะดวกและง่ายต่อการสื่อสาร รวมถึงยังเป็นรากฐานการพัฒนาเทคโนโลยีและอุตสาหกรรมทั่วโลก
แน่นอนการเรียนรู้ทำความเข้าใจภาษาอังกฤษเป็นสิ่งหลีกเลี่ยงไม่ได้ในโลกปัจจุบัน กระนั้นภาษาที่ใช้งานกันบนโลกก็ไม่ได้มีเพียงภาษาอังกฤษ นำไปสู่ข้อจำกัดไม่เพียงด้านการสื่อสาร แต่ยังรวมถึงการพูดคุยและใช้งานโปรแกรมไปจนระบบเทคโนโลยีต่างๆ ด้วยความแตกต่างทางภาษาของแต่ละเชื้อชาติที่มีรายละเอียดค่อนข้างมาก
ถ้าจะให้พูดถึงเรื่องน่าฉงนในการเรียนภาษา คาดว่า หลักการผันเสียง วรรณยุกต์ น่าจะเป็นหนึ่งในด่านปราบเซียนที่ทำให้เกิดความสับสนงงงวย แม้สำหรับคนไทยที่เติบโตมากับการเรียนภาษาไทยที่มีรูปแบบเสียงมากมายจะไม่รู้สึกเป็นปัญหา แต่กับคนที่ไม่เคยเรียนรู้ระบบนี้มาก่อนจะปวดหัวเป็นอย่างยิ่ง
หากให้ยกตัวอย่างคลาสสิกในการเรียนภาษาไทยของชาวต่างชาติ ก็ต้องพูดถึงประโยค “ใครขายไข่ไก่” ซึ่งสามารถเขียนออกมาเป็นคำอ่านในภาษาอังกฤษในรูปแบบ “Khai Khai Khai Khai” ที่อย่าว่าแต่ชาวต่างชาติ แม้แต่คนไทยด้วยกันพอได้เห็นครั้งแรกยังเกิดอาการงุนงง จึงไม่ใช่เรื่องแปลกหากนำโปรแกรมจากภาษาอังกฤษมาใช้โดยตรงอาจก่อให้เกิดการสับสน
อีกทั้งภาษาที่มีการใช้งานวรรณยุกต์ก็ไม่ได้จำกัดแค่ภาษาไทย ยังมีภาษาจีน เวียดนาม ปัญจาบ ลาว ฮังการี ฯลฯ เมื่อคิดตามอัตราส่วนนับว่ามีประชากรอีกกว่าครึ่งโลกอยู่ภายใต้ระบบภาษาที่มีวรรณยุกต์ นี่จึงเป็นเหตุให้เทคโนโลยีบางส่วนมีข้อบกพร่องจำเป็นต้องได้รับการปรับปรุงแก้ไข โดยเฉพาะเทคโนโลยีที่มีความละเอียดอ่อนเป็นพิเศษอย่างการอ่านคลื่นสมอง
นำไปสู่การคิดค้นโมเดลภาษารูปแบบใหม่ที่ช่วยให้สามารถระบุเสียงวรรณยุกต์จากคลื่นสมอง
โมเดลภาษาที่ช่วยระบุเสียงวรรณยุกต์อย่างละเอียด
ประเทศที่ทำการคิดค้นเทคโนโลยีนี้คือทีมวิจัยชาวจีน หนึ่งในผู้ใช้งานภาษาที่มีวรรณยุกต์แหล่งใหญ่ที่สุดแห่งหนึ่งในโลก พวกเขาจึงทำการพัฒนาโมเดลภาษาที่ทำงานร่วมกับอุปกรณ์อ่านคลื่นสมอง เมื่อได้รับสัญญาณไฟฟ้าเพื่อสั่งการ ระบบจะแปลงออกมาเป็นภาษาจีนกลางโดยอัตโนมัติ
กลไกการทำงานของระบบนี้เกิดจาก การพัฒนาระบบตรวจจับแปลงภาษาจากคลื่นสมองขึ้นมาใหม่ เดิมระบบอ่านคลื่นสมองช่วยแกะภาษาอื่นที่ไม่มีวรรณยุกต์ได้ราบรื่นแต่ไม่สามารถแยกเสียงวรรณยุกต์ได้ดีนัก ทำให้เมื่อต้องการนำโปรแกรมนี้ไปใช้งานในภาษาที่มีระบบวรรณยุกต์จะเกิดข้อจำกัด
ด้วยเหตุนี้พวกเขาจึงทำการถอดรูปแบบการอ่านคลื่นสมองออกเป็น 2 ส่วน แบ่งเป็น พยางค์ฐาน(พยัญชนะ+สระ) กับ พยางค์วรรณยุกต์ ถอดรหัสแยกรูปแบบการสั่งออกจากกัน เพื่อให้สามารถระบุรายละเอียดของวรรณยุกต์ในแต่ละคำได้ชัดเจน จากนั้นเมื่อทำการป้อนข้อมูลเสร็จสิ้นระบบจึงนำทั้งสองส่วนเข้ามารวมกันแล้วนำมาประมวลผลเป็นคำในภายหลัง
ขั้นตอนในการพัฒนาโมเดลภาษานี้อาศัยเทคนิค electrocorticography (ECoG) หรือ การวัดคลื่นสมองโดยตรงผ่านขั้วไฟฟ้าที่ฝังอยู่ในสมอง อาศัยอาสาสมัคร 5 รายที่ต้องทำการผ่าตัดเนื้องอกสมองระหว่างรู้สึกตัว โดยจะนำขั้วไฟฟ้ามาวางทาบไว้บนสมองโดยตรง จากนั้นจึงลองให้ผู้ป่วยลองไล่วรรณยุกต์รูปแบบต่างๆ แล้วจึงนำคลื่นสมองเหล่านั้นมาวิเคราะห์
ผลลัพธ์ที่ได้คือข้อมูลที่ถูกนำมาป้อนให้กับโมเดลภาษาเพื่อการแปลงคลื่นสมองเป็นภาษาอย่างแม่นยำ ช่วยให้สามารถไล่เสียงวรรณยุกต์และระบุออกมาได้ชัดเจน กลายเป็นโมเดลภาษาที่สามารถถอดข้อความจากคลื่นสมองออกมา จากนั้นจึงนำมาสื่อความทั้งในส่วนของพยางค์ฐานและวรรณยุกต์ได้อย่างครบถ้วน
ทางทีมวิจัยคาดว่าโมเดลภาษาของพวกเขาจะสามารถใช้ในการรักษาผู้ป่วยโรค anarthria หรือ ภาวะไร้สมรรถภาพในการพูด อีกทั้งยังสามารถนำไปใช้งานกับเทคโนโลยี BCI อื่นๆ ช่วยให้การสื่อสารผ่านระบบคลื่นสมองแม่นยำและถ่ายทอดคำพูดจากภาษาที่มีวรรณยุกต์ได้เที่ยงตรงยิ่งขึ้น
นอกจากนี้โมเดลภาษาที่ได้รับการพัฒนาไม่ได้จำกัดการใช้งานแค่กับเพียงภาษาจีนกลาง แม้แต่ภาษาจีนท้อง่ถินอย่างแต้จิ๋ว กวางตุ้ง หรืออู๋ ก็สามารถใช้งานผ่านโมเดลภาษานี้ได้เช่นกัน หากได้รับการพัฒนาต่อเนื่อง ก็อาจสามารถนำไปปรับใช้กับภาษาอื่นอีกด้วย
นี่จึงถือเป็นใบเบิกทางสำคัญที่อาจช่วยให้เราสามารถเข้าถึงเทคโนโลยีอ่านคลื่นสมองได้มากขึ้นในอนาคต
แน่นอนนี่เป็นเพียงขั้นตอนระหว่างการพัฒนา การต้องเก็บข้อมูลผ่านสมองของผู้ป่วยผ่าตัดเนื้องอกในสมองออกจะเป็นเรื่องยากไปเสียหน่อย ในอนาคตหากมีแนวทางในการพัฒนาโมเดลภาษาโดยไม่ต้องพึ่งพาผู้ป่วยเนื้องอกสมองได้สำเร็จ เราอาจมีเทคโนโลยีคลื่นสมองใช้กันทั่วไปแบบที่เห็นกันในภาพยนตร์ก็เป็นได้
ที่มา
https://www.sti.chula.ac.th/knowledge/2936/
https://www.posttoday.com/international-news/695097
https://www.posttoday.com/post-next/687999
https://www.posttoday.com/innovation/1245
https://interestingengineering.com/science/chinese-synthesize-tonal-speech-using-neural-cues