Pathumma LLM โมเดล AI ฝีมือคนไทยที่รองรับและเข้าใจความเป็นไทย
ที่ผ่านมาเราอาจคุ้นเคยกับ Generative AI จากต่างประเทศ แต่วันนี้เราจะพาไปชมโมเดล AI ฝีมือคนไทยอย่าง Pathumma LLM ที่จะเป็นรากฐานไปสู่การพัฒนา AI ในอนาคต
ปัจจุบันการใช้งาน Generative AI เป็นเรื่องที่พบได้ทั่วไปจนกลายเป็นส่วนหนึ่งในชีวิตประจำวัน เริ่มมีการนำขีดความสามารถนี้มาปรับใช้กับอุปกรณ์อิเล็กทรอนิกส์ที่อยู่รอบตัว อย่างไรก็ตามโมเดล AI ที่เราคุ้นหูมักมาจากบริษัทไอทีชื่อดัง เช่น OpenAI, Google, Amazon ฯลฯ
แต่จะเป็นอย่างไรถ้ามีการพัฒนาโมเดล Generative AI สำหรับคนไทยโดยเฉพาะ
Pathumma LLM โมเดล AI ที่เข้าใจความเป็นไทย
ผลงานนี้เป็นของ กลุ่มวิจัยปัญญาประดิษฐ์ (AINRG) ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ(NECTEC) สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ(สวทช.) กับการพัฒนา Pathumma LLM โมเดล Generative AI ที่ถูกออกแบบให้มีความเข้าใจในภาษาไทยอย่างลึกซึ้ง
จุดเด่นสำคัญของ Pathumma LLM คือ การใช้งานภาษาไทย ตัวโมเดลได้รับการเทรนข้อมูลภาษาไทยโดยเฉพาะ รองรับการใช้งานภาษาไทยอย่างลึกซึ้งจึงมีความเข้าใจในหลายระดับ ทั้งทำภาษาราชการ ตัวเลขไทย บริบททางสังคม หรือภาษาถิ่นของแต่ละภูมิภาค และมีความรู้ความเข้าใจวัฒนธรรมไทยอย่างลึกซึ้ง
อันดับต่อมาคือ การทำความเข้าใจภาพ AI สามารถประมวลผลข้อมูลภาพ ช่วยให้สามารถแปลงตัวอักษรในภาพเป็นข้อความ จดจำวัตถุ วิเคราะห์ใบหน้า แยกแยะบุคคล ปรับปรุงคุณภาพรูปภาพ รวมถึงคุณสมบัติในการทำความเข้าใจคำพูดและเสียงพูดจากข้อมูลเสียงด้วยเช่นกัน
ปัจจุบัน Pathumma LLM อยู่ในช่วงระหว่างการพัฒนา โดยกำลังเพิ่มข้อมูลที่ใช้ในการเทรนและพารามิเตอร์เพื่อเสริมขีดความสามารถของ AI อย่างต่อเนื่อง พร้อมขอความร่วมมือจากทั้งหน่วยงานภาครัฐและเอกชนในการเข้าถึงฐานข้อมูลที่เปิดเผยได้ เพื่อยกระดับขีดความสามารถของตัวโมเดลให้ดียิ่งขึ้น
เป้าหมายของทีมวิจัยคือการยกระดับโมเดล AI นี้ให้กลายเป็นรากฐานแห่งวงการปัญญาประดิษฐ์ไทย
ความสำคัญในการพัฒนาโมเดล AI ของไทย
อันที่จริงถ้าพูดถึง AI Chatbot ไทยหลายท่านอาจได้ยินผ่านหูกันมาบ้าง เช่น Alice แชทบอทที่เน้นด้านข้อมูลธุรกิจ, Alisa AI ที่ถูกออกแบบเป็นผู้ช่วยส่วนตัว, AIYA สำหรับการขายและงานบริการลูกค้า ไปจน Botnoi แชทบอทคนไทยที่เคยได้รับรางวัลจาก LINE Bot Awards
จริงอยู่ AI เหล่านี้ได้รับการออกแบบและพัฒนาด้วยฝีมือคนไทย แต่ส่วนใหญ่ขับเคลื่อนและใช้งานโมเดลที่พัฒนาจากบริษัทต่างประเทศ ทำให้มีค่าใช้จ่ายในการพัฒนาและใช้งาน API ค่อนข้างสูง ต้องนำมาเทรนภาษาไทยและบริบทสังคมไทยเป็นจำนวนมาก ในระยะยาวจึงไม่ยั่งยืนและอาจทำให้บริษัทขนาดเล็กหรือสตาร์ทอัพเติบโตได้ยาก
อีกหนึ่งปัญหาที่เกิดขึ้นคือ โมเดล AI ส่วนใหญ่เป็นโมเดลปิด จริงอยู่นั่นเป็นเรื่องปกติในการหากำไรแก่บริษัท แต่สำหรับความก้าวหน้าและพัฒนาเทคโนโลยีในภาพรวมในระยะยาวจะเติบโตได้ยาก เสี่ยงต่อการปิดกั้นและผูกขาดทางเทคโนโลยีจนทำให้บริษัทที่มีขนาดเล็กกว่าแข่งขันได้ยาก
ด้วยเหตุนี้จึงได้มีการพัฒนา Pathumma LLM ที่เป็น AI สัญชาติไทยได้รับการพัฒนาโดยมีภาษาไทยเป็นหลัก จะช่วยลดระยะเวลาในการเทรนลงมาก ลดภาระในการปรับแต่งโมเดลให้เข้ากับองค์กร จึงสามารถนำไปประยุกต์และปรับแต่งให้เข้ากับการใช้งานในอุตสาหกรรมภายในประเทศได้สะดวก
การเป็นโอเพ่นซอร์สที่สามารถเข้าถึง ใช้งาน และนำไปต่อยอดได้ฟรี ยังเป็นผลดีต่อการพัฒนา AI ภายในประเทศ ช่วยให้การสร้างคอมมูนิตี้ในกลุ่มผู้พัฒนา AI ทำได้ง่ายขึ้น ช่วยลดความเหลื่อมล้ำทางเทคโนโลยีและสร้างผลกระทบเชิงบวกต่อภาคธุรกิจ ซึ่งจะเป็นรากฐานสำคัญต่อการพัฒนา AI ภายในประเทศต่อไป
Pathumma LLM จึงถือเป็นก้าวแรกที่มีความสำคัญต่อวงการ AI ของไทยต่อไป
สำหรับท่านที่สนใจในกลุ่มองค์กรหรือภาคธุรกิจสามารถติดต่อกับ กลุ่มวิจัยปัญญาประดิษฐ์ ของ NECTEC ได้โดยตรง ในส่วนผู้ใช้งานทั่วไปปัจจุบัน Pathumma LLM ยังไม่มีการเปิดให้บริการบนสมาร์ทโฟน แต่สามารถเข้าถึงได้ผ่านช่องทางเว็บไซต์ https://aiforthai.in.th/pathumma-llm/
ที่มา
https://www.nstda.or.th/home/news_post/s-and-t-implementation-pathumma-llm-ai/