พลิกโฉมการศึกษาผ่าน GenAI: ปลดล็อกความเป็นไปได้ใหม่ๆ ในการเรียนรู้ด้วย ChatGPT ตอนที่ 2

29 พฤศจิกายน 2023

เรื่อง: พ่อบ้านเล่างานวิจัย

ภาพประกอบ: พรภวิษย์ เพ็งเอียด

29 พฤศจิกายน 2023

เรื่อง: พ่อบ้านเล่างานวิจัย

ภาพประกอบ: พรภวิษย์ เพ็งเอียด

ทุกครั้งที่มีเทคโนโลยีระดับ ‘เปลี่ยนโลก’ เกิดขึ้น สถาบันการศึกษามักจะตอบสนองด้วยความกลัว ความไม่เข้าใจ ซึ่งก็เป็นเรื่องที่เข้าใจได้ไม่ยากจากประวัติศาสตร์พัฒนาการของเทคโนโลยี ช่วงที่เทคโนโลยีการวิทยุเป็นที่แพร่หลาย สื่อมวลชนก็ประโคมข่าวว่าโรงเรียนจะหมดความสำคัญแล้วเพราะนักเรียนสามารถเรียนผ่านการฟังวิทยุได้ ต่อมาเมื่อโทรทัศน์เป็นที่แพร่หลาย คนก็มองว่าโรงเรียนจะกลายเป็นอดีต เพราะใครก็เรียนทางไกลผ่านโทรทัศน์ได้ หลังจากนั้นคอมพิวเตอร์ อินเทอร์เน็ตก็ผ่านมาและสร้างกระแสคล้ายๆ กัน และถึงแม้ว่าเทคโนโลยีที่กล่าวมาทั้งหมดจะไม่สามารถแทนที่ครูและการศึกษาที่มีคุณภาพได้ ธรรมชาติของหน่วยงานการศึกษาที่เปลี่ยนแปลงช้าเพราะมีหน้าที่ถือกุญแจความคิดและทิศทางสังคมก็เต็มไปด้วยหน้าประวัติศาสตร์ที่หวาดระแวงการถูกแทนที่ด้วยเทคโนโลยีมาตลอด ซึ่งแรงต้านการเปลี่ยนแปลงนั้นบางครั้งก็มหาศาลและใช้เวลานานหลายทศวรรษกว่าที่เทคโนโลยีระดับเปลี่ยนโลกจะได้รับการต้อนรับเข้าสู่ห้องเรียน

นานแค่ไหนกว่าเทคโนโลยีจะเข้าไปในโรงเรียน

หนึ่งในเทคโนโลยีที่มีใช้กันแพร่หลายแต่ถูกห้ามใช้ในโรงเรียนหลายสิบปี คือเครื่องคิดเลข มันถูกคิดค้นและใช้กันแพร่หลายในภาคธุรกิจตั้งแต่ต้นทศวรรษ 1970s แต่โรงเรียนกลับคิดไม่ตกว่ามันจะอันตรายกับการเรียนรู้ของเด็กไหม ช่วงแรก ครู อาจารย์ ผู้ปกครอง และนักการศึกษามากมายร้องป่าวว่ามันจะมาทำลายสมองของเด็ก ทักษะทางคณิตศาสตร์จะสูญหายถ้าใครเอาเครื่องคิดเลขมาใช้ในโรงเรียน พอเข้ากลางทศวรรษ คณะกรรมการคณิตศาสตรศึกษาแห่งชาติของสหรัฐฯ ก็ออกรายงานข้อเสนอแนะว่า เด็กเกรด 8 (มัธยม 2 ในบ้านเรา) สามารถใช้เครื่องคิดเลขได้ หลังจากนั้นกรรมการอีกชุดหนึ่งก็มีข้อเสนอแนะว่าเด็กทุกชั้นสามารถใช้เครื่องคิดเลขได้ อีกหลายปีถัดมารัฐต่างๆ ในสหรัฐฯ ก็เริ่มปรับนโยบายให้การใช้เครื่องคิดเลขเป็นเรื่องจำเป็นในชั้นเรียน ด้วยเหตุผลว่าเครื่องมือนี้ช่วยให้เด็กสามารถแก้ไขปัญหาที่ซับซ้อนกว่าเดิม และจุดเปลี่ยนจริงๆ ก็มาถึงเมื่อ Scholastic Aptitude Test (SAT) ซึ่งเป็นข้อสอบมาตรฐานในการสมัครเข้ามหาวิทยาลัยในสหรัฐฯ มีการปรับปรุงครั้งใหญ่และยอมให้ใช้เครื่องคิดเลขได้เมื่อปี 1994 นั่นเอง

เครื่องคิดเลขคือหนึ่งในนวัตกรรมเปลี่ยนโลกที่แท้จริง มันช่วยให้อาชีพต่างๆ พัฒนาแบบก้าวกระโดด ไม่ว่าจะเป็นงานด้านวิศวกรรม การเงิน สามารถสร้างนวัตกรรมต่อยอดได้อีกมากมาย กลายเป็นอุปกรณ์ที่ทุกบริษัทห้างร้านจนถึงทุกครัวเรือนต้องมีติดไว้ แต่มันกลับต้องรอเกิน 2 ทศวรรษกว่าจะได้รับการยอมรับจากภาคการศึกษา

แล้ว GenAI ที่ว่ากันว่าจะ ‘เปลี่ยนโลก’ อีกครั้ง จะใช้เวลานานแค่ไหนกว่าจะเข้าไปเป็นส่วนหนึ่งของการเรียนรู้ในห้องเรียน?

AI เข้ามาในห้องเรียนหรือยัง

สักสิบปีที่แล้ว ถ้าใครบอกว่าเด็กไทยจะต้องเรียนออนไลน์กันทุกระดับชั้น คงมีแต่คนหัวเราะ แต่ตัวเร่งสำคัญที่ทำให้การเรียนออนไลน์กลายเป็นสิ่งจำเป็นก็คือวิกฤตโควิด-19 ก่อนหน้านั้นเด็กก็ใช้เทคโนโลยีกันมากมายกว่าผู้สอนอยู่แล้ว พอมีการระบาดของไวรัส โรงเรียนต้องปรับมาสอนออนไลน์กันทั่วโลก ครูอาจารย์ก็ต้องปรับตัวเช่นกัน ยิ่งกว่านั้นการเติบโตของบริการอินเทอร์เน็ตและแอปพลิเคชันต่างๆ ที่มีจุดมุ่งหมายเพื่อช่วยงานในภาคธุรกิจ ก็เข้ามาเป็นส่วนหนึ่งของชีวิตนักเรียน (แม้ครูจะรู้หรือไม่ก็ตาม) ก่อนยุค GenAI ก็มีบริการ AI เฉพาะทาง (Weak AI หรือ Narrow AI) มากมายที่นักเรียนใช้ผ่อนแรง ลดเวลาการทำงานอยู่แล้ว

สมมติถ้าผมสั่งงานให้เด็กเขียนเรียงความภาษาอังกฤษเกี่ยวกับข้อดีข้อเสียของโซเชียลมีเดีย เทคโนโลยียุคก่อน GenAI จะช่วยอะไรเด็กได้บ้าง? กรณีที่หนึ่ง เด็กที่ขี้เกียจและไม่ได้มีทักษะภาษามากนักก็อาจจะเริ่ม Google หาบทความภาษาไทย เอาเนื้อหาไปแปะใน Google Translate เพื่อแปลงเป็นภาษาอังกฤษแบบพิกลพิการแล้วตัดแปะมาส่งทันที แบบนี้ถ้าครูอาจารย์อ่านสักหน่อยก็จะรู้ว่าเด็กไม่ได้แปลเอง กรณีที่สอง เด็กที่เก่งกว่าและรู้เยอะสักหน่อย ทักษะภาษาอังกฤษพอได้ ก็อาจจะบทความภาษาอังกฤษแล้วเอาเนื้อหามาแปะที่ Quillbot ซึ่งเป็นบริการถอดความภาษา หรือ Paraphrasing Tool คือเป็น AI ที่สามารถเปลี่ยนรูปประโยคและเลือกสลับคำศัพท์ใกล้เคียงได้นั่นละครับ ส่งงานมาแบบนี้แม้ว่าครูอาจารย์จะมีซอฟต์แวร์คอยตรวจว่าเด็กลอกงานมาจากอินเทอร์เน็ต (Plagiarism Checker) ก็ตรวจไม่พบแล้วครับ เรื่องแบบนี้ครูอาจารย์ไม่ค่อยรู้ครับ ต้องถามนักเรียน (ฮา!)

สรุปก็คือ AI นั้นมาอยู่ในชีวิตเด็กนักเรียนนานแล้ว ใช้มากหรือน้อยก็ขึ้นอยู่กับทรัพยากร ความรู้และต้นทุนชีวิตที่เด็กมีนั่นเอง

GenAI สร้างปัญหาอะไรในภาคการศึกษา?

AI ธรรมดาที่ทำงานเฉพาะทางอย่างพวก Paraphrasing Checker ก็สร้างความปวดหัวให้การเรียนการสอนไม่น้อยแล้ว GenAI ที่สามารถผลิตเนื้อหาได้เอง ไม่มีทางโดนจับได้ว่าลอกใครมาก็ยิ่งจะเป็นปัญหาใหญ่แน่นอน บวกกับผู้เชี่ยวชาญมากมายออกมาฟันธงว่าเทคโนโลยี GenAI จะ ‘เปลี่ยนโลก’ กันจริงๆ ซะที สื่อมวลชนทั่วโลกก็ออกข่าวอวดสรรพคุณความสามารถของ GenAI กันเต็มไปหมด สิ่งเหล่านี้ทำให้ภาคการศึกษากลับมาอยู่ในโหมดตื่นตระหนกหวาดระแวงกันอีกครั้ง เพราะอัตราการพัฒนาของเทคโนโลยีนี้มันเร็วแบบที่ไม่เคยมีมาก่อนในประวัติศาสตร์ ในเวลาไม่ถึงครึ่งปี เมื่อ OpenAI ปล่อย ChatGPT ที่ทำงานด้วย LLM ในเวอร์ชั่น GPT-3.5 เมื่อเดือนพฤศจิกายน 2022 และต่อมาคือเวอร์ชั่น GPT-4 ประมาณเดือนมีนาคม 2023 นั้น มันสร้างปรากฏการณ์ทำคะแนนสอบจากข้อสอบมาตรฐานต่างๆ ได้สูงมากจนสถาบันการศึกษาเริ่มจะปาดเหงื่อ

รายงานจาก OpenAI บอกว่า GPT-4 (กราฟแท่งเขียว) ทำข้อสอบทางกฎหมายอย่าง Uniform Bar Exam ได้คะแนนอยู่ในช่วงเปอร์เซ็นต์ไทล์ที่ 90 หรือ LSAT ที่เปอร์เซ็นต์ไทล์ 88 ซึ่งคะแนนช่วงนี้ต่างจาก GPT-3.5 (กราฟแท่งน้ำเงิน) แบบไม่เห็นฝุ่น (เปอร์เซ็นต์ไทล์ที่ 10 และ 40 ตามลำดับ) ข้อสอบเข้าเรียนในระดับบัณฑิตศึกษาอย่าง Graduate Record Examination (GRE) Quantitative GPT-4 ก็ทำคะแนนได้เปอร์เซ็นต์ไทล์ที่ 80 ในขณะที่ GPT-3.5 ทำได้เปอร์เซ็นต์ไทล์ที่ 25 เท่านั้น ถ้าถอยมาดูในภาพรวมของความสามารถของ GPT-4 แท่งกราฟสีเขียวพุ่งทะลุแท่งกราฟสีน้ำเงินได้แทบทุกรายการ ยกเว้นข้อสอบบางรายการซึ่ง GPT-3.5 ทำได้ดีอยู่แล้วนั่นเอง

เด็กเริ่มใช้ GenAI ทำการบ้าน แล้วครูจะทำอย่างไร

ช่วงปีที่ผ่านมามีปรากฏการณ์สำคัญอีกเรื่องคือ ครูอาจารย์มหาวิทยาลัยสนใจเทคโนโลยี GenAI ได้มารวมตัวกันกลายเป็นชุมชนออนไลน์หลายแห่ง และหลายกลุ่มก็มีสมาชิกหลักหมื่นถึงหลักหลายแสนแล้ว ลักษณะการพูดคุยในช่วงแรกก็มีการแลกเปลี่ยน prompts กัน มี AI ตัวไหนช่วยลดงานธุรการที่ซ้ำซากได้บ้าง ไม่ว่าจะเป็นการสร้างสไลด์เตรียมสอน การถอดคำพูดจากคลิปเสียง การสร้างภาพประกอบบทเรียน ซึ่งสิ่งเหล่านี้ GenAI ทำได้หมดแล้ว แต่มีอีกกระแสที่เห็นอยู่อย่างต่อเนื่องคือ มีการแชร์ข้อมูลบริการ GenAI ต่างๆ ที่ช่วยตรวจว่าเรียงความนั้นเขียนด้วย AI หรือเปล่า หรือมีครูอาจารย์มาถามในกลุ่มว่าเด็กส่งงานที่ให้ ChatGPT เขียนให้ จะจัดการยังไงดี?

(ภาพจากกลุ่มเฟซบุ๊ก chatGPT for Teachers)

แน่นอนว่าถ้านักเรียนสั่งให้ ChatGPT เขียนเรียงความแล้วตัดแปะมาส่งโอกาสที่ครูจะจับได้ก็มีไม่น้อย ไม่ต่างกับตัดแปะจาก Google Translate แต่มันมีปัญหาอยู่สองประการคือ (1) เรื่องนโยบายหรือข้อกำหนดด้านจริยธรรมของโรงเรียนนั้นๆ ว่าได้มีการปรับปรุงวิธีการรับมือ GenAI ไว้หรือยัง เพราะโดยหลักการแล้วการใช้ GenAI ไม่ได้เข้าข่ายการคัดลอกงานวิชาการ (plagiarism) แต่ไปอยู่ในหมวดการโกงการบ้าน (cheating) เพราะเทียบได้กับการให้คนทำการบ้านแทนให้ แต่การจะพิสูจน์ว่าคนอื่นทำให้มันต้องมีหลักฐาน และนี่คือปัญหาที่ (2) คือเด็กที่พอมีความรู้เกี่ยวกับการใช้ GenAI สามารถสั่งงานแบบซับซ้อนขึ้นเพียงนิดเดียวหรือตรวจแก้งานเรียงความด้วยภาษาตัวเองบ้าง แค่นี้ก็ไม่เหลือหลักฐานแล้ว

เราจะรู้ได้อย่างไรว่า AI หรือมนุษย์เป็นผู้ผลิตงาน

ในปัจจุบันมีผู้ให้บริการหลายเจ้าอ้างว่าเครื่องมือที่ตัวเองมีสามารถ ‘วัดความเป็นมนุษย์’ จากเนื้อหาที่ผลิตขึ้นได้ โดยเครื่องมือส่วนใหญ่จะใช้หลักสองประการในการตรวจจับ คือ (1) Perplexity ซึ่งเป็นการประเมินภาษาในระดับประโยค และ (2) Burstiness ที่ประเมินภาษาในระดับภาพรวมของเนื้อหา

Perplexity ที่แปลว่าความงุนงง สับสนนี่ละครับ อย่างที่เล่าไปตอนต้นว่า GenAI จะเอาคำมาเรียงกันจากความน่าจะเป็น หรือการ ‘เดา’ เอาจากเนื้อหาที่ได้เรียนรู้ไว้ สมมุติว่าเราขึ้นต้นประโยคว่า “I couldn’t get to sleep last …” แล้วลองคิดว่าจะต่อเนื้อความยังไงโดยมีผลลัพธ์อยู่สองแบบคือ

I couldn’t get to sleep last night.

ประโยคแรกถือว่ามี perplexity ต่ำเพราะมันต่อคำแบบง่ายๆ และดูเป็นเหตุเป็นผลดี

I couldn’t get to sleep last summer on many nights because of how hot it was at that time.

ประโยคนี้ดูแปลก ดูหลุดไปจากการคาดเดา แบบนี้ถือว่ามี Perplexity ปานกลาง เมื่อประเมินดูประโยคแล้ว หากมี Perplexity ต่ำ ก็จะถูกตีความว่า ‘มีความเป็นไปได้’ ที่ประโยคนี้จะถูกเขียนโดย AI นั่นเอง

ถัดมาในระดับย่อหน้าหรือระดับเนื้อหาโดยรวม เครื่องตรวจจับ AI ก็จะใช้หลักการเดียวกันนี้ แต่เรียกว่า Burstiness ซึ่งวัดว่าประโยคที่ต่อเนื่องกันมีจังหวะการเขียนประโยคที่สั้นบ้าง ยาวบ้าง แตกต่างกันไปไหม คือถ้าประโยคมีความแปรปรวนเยอะก็มีความเป็นไปได้ที่จะถูกผลิตโดยมนุษย์ แต่ถ้าประโยคมีรูปแบบเดิมๆ จังหวะการเขียนคงที่ ก็จะถูกตีความว่า ‘มีความเป็นไปได้’ ที่ประโยคนี้จะถูกผลิตด้วย AI

เมื่อเอาสองเทคนิคมารวมกันก็พอจะบอกความน่าจะเป็นได้ แต่ปัญหาคือมันบอกได้แค่ ‘ความน่าจะเป็น’ เพราะในชีวิตจริงแล้วเราเขียนได้หลายแบบ ขึ้นอยู่กับทักษะและคลังศัพท์ และมีงานวิจัยยืนยันว่าเครื่องตรวจ AI ส่วนใหญ่จะรายงานผลบวกปลอม (false positive) ซึ่งหมายถึงการทึกทักเอาว่างานที่มนุษย์เขียนเป็นงานที่ AI เขียน ในบริบทของภาษาอังกฤษนั้น คนที่ซวยจริงๆ ก็คือคนที่ใช้ภาษาอังกฤษเป็นภาษาที่สอง เพราะเมื่อเอาเรียงความ TOEFL ที่วัดความรู้ภาษาอังกฤษแบบมาตรฐานมาผ่านเครื่องตรวจ AI หลายๆ เจ้าจะถูกตีว่าเขียนโดย AI มากถึง 60% ในขณะที่เรียงความที่เขียนโดยเจ้าของภาษาเครื่องตรวจ AI จะรายงานผลถูกต้องมากกว่า โดยนักวิจัยอธิบายว่าการวัดความเป็นมนุษย์ของเนื้อหาด้วย Perplexity และ Burstiness นี้ทำให้เกิดอคติกับคนใช้ภาษาอังกฤษเป็นภาษาที่สองซึ่งมีคลังศัพท์น้อยและเขียนรูปประโยคไม่ซับซ้อน

สรุปสั้นๆ ก็คือ ณ เวลานี้ยังไม่มี AI ที่ตรวจจับว่างานเขียนนั้นผลิตด้วย AI หรือไม่ และในทางทฤษฎีแล้วมันก็ทำไม่ได้ ซึ่งนี่คือปัญหาหลักที่เกิดกับวงการการศึกษาในตอนนี้ครับ

GenAI สร้างผลกระทบในภาคการศึกษาแบบที่เราไม่เคยประสบมาก่อนในช่วงหลายทศวรรษที่ผ่านมาและพัฒนาต่อเนื่องด้วยอัตราเร่งที่น่าตกใจ จากในช่วงแรกที่มี GenAI สร้างภาพและสร้างข้อความเท่านั้น ในช่วงเวลาไม่ถึงหนึ่งปีที่ผ่านมาความสามารถทั้งสองถูกผสมเข้าด้วยกัน ทำให้มันมองเห็นรูปภาพ อธิบายอารมณ์จากรูปหน้าคนได้ เขียนโค้ดภาษา Python และสอนเราทำการวิเคราะห์งานแบบนักวิทยาศาสตร์ข้อมูลได้แบบเป็นขั้นเป็นตอน สร้างรูปภาพได้จากคำอธิบาย และสอบผ่านข้อสอบมาตรฐานด้วยคะแนนอยู่ในช่วงเปอร์เซ็นต์ไทล์ที่ 80 ขึ้นไปได้ในหลายสาขาวิชา

ครู อาจารย์ และนักการศึกษาทั้งหลายต้องกลับมาคิดถึงความหมายที่แท้จริงของ ‘การเรียนรู้’ กันอีกครั้ง เราจะสื่อสารความสำคัญของการสร้างทักษะต่างๆ ได้อย่างไร ในเมื่อเด็กสามารถใช้ GenAI สร้างงานเหล่านั้นได้ภายในไม่กี่วินาที

และนี่คือสิ่งที่เราจะคุยกันในตอนสุดท้ายของซีรีย์ GenAI เทคโนโลยีเปลี่ยนโลกฯ นี้ครับ

อ้างอิง Part II

A Brief History of Calculators in the Classroom https://hackeducation.com/2015/03/12/calculators

Artificial Intelligence and the Future of Higher Education https://www.youtube.com/watch?v=29JtrGoGxoE

ChatGPT outperforms humans in emotional awareness evaluations https://doi.org/10.3389/fpsyg.2023.1199058

GPT detectors are biased against non-native English writers https://doi.org/10.1016/j.patter.2023.100779

How Do AI Detectors Work? | Methods & Reliability https://www.scribbr.com/ai-tools/how-do-ai-detectors-work/

Khanmigo, your AI guide: Get a glimpse of the future of learning. https://www.khanacademy.org/khan-labs

Research GPT-4 https://openai.com/research/gpt-4Sparks of Artificial General Intelligence: Early experiments with GPT-4 https://arxiv.org/abs/2303.12712