อายตนะในหุ่นยนต์
เมื่อ ปี พ.ศ. ๒๕๔๙ ผมได้เขียนบทความเรื่อง “อายตนะหุ่นยนต์” เป็นการเปรียบเทียบว่า เซนเซอร์ของหุ่นยนต์มีความเหมือนและแตกต่างจากอายตนะทั้ง ๖ ของมนุษย์อย่างไรบ้าง ในโอกาสที่มหาวิทยาลัยเทคโนโลยีพระจอมเกล้า ธนบุรี ได้เชิญผมบรรยายในหัวข้อนี้อีกทั้งการพัฒนาด้านเซนเซอร์ของหุ่นยนต์มีการพัฒนาไปมากในช่วงเวลาห้าปีที่ผ่านมา ผมจึงได้เพิ่มเติมรายละเอียดมากขึ้นในบทความนี้
เมื่อกล่าวถึงอายตนะทั้ง ๖ ของมนุษย์ ผู้ที่ศึกษาและประพฤติพุทธธรรมทราบดีว่าหมายถึง ตา หู จมูก ลิ้น กาย ใจ นั้นเป็นจุดเชื่อมต่อให้จิตรู้โลกภายนอก โดยเฉพาะใจหรือจิตนั้นเมื่อ “ผัสสะ” กับสิ่งแวดล้อมก่อให้เกิด “ธรรมารมณ์”: ความรู้สึกนึกคิดในอารมณ์ต่างๆทั้งดีและร้ายโลดแล่นเข้ามาเกาะกุมจิตใจเรา จิตยังทำหน้าที่ปรุงแต่ง “สังขาร” อีกด้วย ในส่วนนี้เป็นการผสมขบวนการรับรู้ (Perception) และขบวนการคิด–ตีความ (Cognition) เข้าด้วยกัน เซนเซอร์หุ่นยนต์ในระยะหลังก็มีการพัฒนาในทิศทางนี้เช่นเดียวกัน เราพบว่ามีการติดตั้งไมโครซิปไว้ที่ตัวเซนเซอร์เพื่อทำหน้าที่ตัดสัณญาณรบกวน (Noise & Disturbance) และทำการคำนวณพื้นฐาน (Primary Computation) ก่อนส่งผลไปที่หน่วยประมวลผลกลาง
ในแง่ของความละเอียดนั้น มีการพัฒนาขึ้นไปมาก ระบบตรวจสอบแกนหัวอ่านฮาร์ดดิสค์ (Head Stack Assembly: HGA) โดยใช้เทคโนโลยีตาหุ่นยนต์ ที่ทางสถาบันวิทยาการหุ่นยนต์ภาคสนาม (ฟีโบ้)พัฒนาขึ้นสำหรับขบวนการผลิตของบริษัทเวสท์เทิร์น ดิจิตอล นั้นมีความละเอียดสูงถึง 3/1000 นิ้ว และความเร็วในการประมวลผลเร็วมากในระดับมิลลิวินาทีครับ ผมเชื่อว่าระบบวิชั่นมีศักยภาพในขบวนการผลิตอย่างละเอียดมากขึ้นเป็นลำดับผมได้รับการยืนยันว่าความเชื่อผมถูกต้องจากผู้รับผิดชอบด้านเทคนิคของบริษัทฮัทชินสัน ซึ่งถือว่าเป็นบริษัทใช้ Full Automation สำหรับระบบการผลิต
ระบบตาคู่ (Stereo Vision) ทำให้หุ่นยนต์สามารถมองได้ใกล้เคียงกับตามนุษย์กล่าวคือ มองเห็นและคาดคะเนความลึกของภาพ (Depth)ได้ ในทางเทคโนโลยีการเคลื่อนที่นั้นเราต้องมีจำนวนเซ็นเซอร์เท่ากับจำนวนองศาอิสระ (Degree of Freedom)แต่ในกรณีของระบบตาคู่นั้นใช้ความเหลื่อมของอิมเมจของสัญญาณภาพด้านซ้ายและขวา มาคำนวณหาระยะลึกด้านที่สามของภาพได้ วิธีการเช่นนี้ก็เป็นการเเลียนแบบมาจากการทำงานของตามนุษย์เช่นกัน สมองจะทำหน้าที่ประมวลภาพซ้อนจนเรียนรู้ว่าวัตถุนั้นมีความลึกอยู่เทคนิคการควบคุมแบบป้อนกลับก็ได้นำข้อมูลจากสัญญาณภาพนี้ป้อนกลับเข้าสู่สมองกลหุ่นยนต์เพื่อให้ทราบว่าขณะนี้จุดที่สนใจอยู่ที่ใด และ เบื้องหน้ามีสิ่งกีดขวางอะไรอยู่เพื่อที่จะได้วางแผนการเคลื่อนที่–เคลื่อนไหวให้ไปถึงจุดหมายปลายทางตามเวลาที่กำหนด
ด้านอารมณ์ มนุษย์มีอารมณ์หลากหลายประเภท นักจิตวิทยาหลายท่านจึงได้เสนออารมณ์พื้นฐานขึ้นมา เช่น Dr. Paul Ekman ได้เสนอว่าอารมณ์พื้นฐานของมนุษย์มี 6 อารมณ์ ประกอบไปด้วย โกรธ (Anger), ขยะแขยง (Disgust), กลัว (Fear), ดีใจ (Happiness), เสียใจ (Sadness) และประหลาดใจ (Surprise) จากการศึกษาพบว่าอารมณ์เหล่านี้เป็นอารมณ์ที่ติดตัวมาตั้งแต่กำเนิดและอารมณ์เหล่านี้มีอยู่ในทุกชนชาติ ในขณะที่ Prof. Robert Plutchik ได้เสนออีก 2 อารมณ์เพิ่มเติม คือ ความคาดหวัง (Anticipation) และการยอมรับ (Acceptance) เมื่ออารมณ์พื้นฐานมีอยู่มากมาย นางสาว Cynthia Breazeal นักวิจัยที่ MIT จึงได้เสนอ 3D emotion space เพื่อเปลี่ยนอารมณ์เหล่านี้ให้มีพารามิเตอร์อยู่บน 3 แกน ประกอบไปด้วย arousal, valence และ stance ดังรูป
ในทางย้อนกลับจากทฤษฎีข้างต้น เราสามารถตีความจากอิมเมจของอารมณ์พื้นฐานและผสมผสานกับ “ระบบการเข้ารหัสกิริยาใบหน้า ที่ใช้จำแนกการแสดงสีหน้าของมนุษย์ โดยกำหนดให้ “หน่วยกิริยา”“action units (AUs)” เป็นการเคลื่อนไหวของกล้ามเนื้อมัดเดียวหรือเป็นกลุ่มกล้ามเนื้อ ที่ทำให้เกิดสีหน้าต่างๆ ตำแหน่งของ actuator ทำให้เราทราบถึงอารมณ์พื้นฐานทั้ง 6 ชนิดของ Ekman ได้อย่างชัดเจนชัดเจนขึ้น งานวิจัยพื้นฐานเหล่านี้อาจนำไปสู่การทำให้สมองหุ่นยนต์สามารถเข้าถึง “ธรรมารมณ์” ของมนุษย์หรือเพื่อนหุ่นยนต์ด้วยกันเองได้
เซนเซอร์ที่ผมเรียกว่าอายตนะหุ่นยนต์นี้ มีความสำคัญยิ่งสำหรับหุ่นยนต์ต้องทำงานและตอบสนองในสภาวะแวดล้อมและสถานการณ์ที่ไม่มี/ไม่ทราบข้อมูลล่วงหน้ามาก่อน รวมทั้งที่มีการเปลี่ยนแปลงอยู่ตลอดเวลา เป็นองค์ประกอบสำคัญที่ทำให้ หุ่นยนต์ชาญฉลาดขึ้น นักวิจัยหุ่นยนต์ตามสถาบันการศึกษาชั้นนำทั่วโลก จึงต้องทุ่มพละกำลังปัญญาคิดค้นและเพิ่มสมรรถนะของเซนเซอร์ ซึ่งเป็น “อายตนะ” ของหุ่นยนต์ ให้มีความแม่นยำและเชื่อถือได้ (Accuracy and Reliability) ทิศทางการพัฒนาระบบรับรู้ของหุ่นยนต์ก้าวหน้าไปใกล้เคียงกับมนุษย์มากขึ้น วิธีการหนึ่งคือประมวลผลจากหลายเซนเซอร์หลายตัว (Sensor Fusion) พร้อมๆกันในคราวเดียวกันเพื่อลดความเสี่ยงในกรณีที่มีเซนเซอร์ตัวใดตัวหนึ่งเสียหายทำงานไม่ได้หรือไม่ถูกต้อง อย่างน้อยที่สุดการใช้ค่าอ่านเฉลี่ยจากเซนเซอร์ประเภทเดียวกันหลายตัวนั้นช่วยลดความไวต่อสิ่งรบกวน (Less Sensitivity to Noise) ลงไปค่อนข้างมากเซนเซอร์ประเภท Passive ทำการตรวจสอบและอ่านค่าที่มีอยู่แล้วในสิ่งแวดล้อม อย่างไรก็ตาม ค่าบางอย่างจำเป็นต้องได้รับสัญญาณเหนี่ยวนำหรือได้รับพลังงานคลื่นแม่เหล็กไฟฟ้าจากแหล่งกำเนิด ชนิดหลังนี้จึงถูกเรียกว่า Active ไม่ว่าจะเป็นแบบใดก็ตาม สิ่งสำคัญในการประมวลผลกลางนั้นเราจำเป็นต้องออกแบบโครงสร้างเพื่อใช้รวมข้อมูล (Uniform Data Structure) โครงสร้างนี้ช่วยให้สมองกลสามารกคำนวณและตีความได้ (Interpretation)อย่างเป็นระบบ การ “รวม” ข้อมูลดังกล่าวนี้เองเป็นขบวนการที่แตกต่างจากการใช้เซนเซอร์โดยทั่วไป
การรวบรวมข้อมูลที่กระจัดกระจายให้อยู่ในรูปแบบที่พอจะตีความได้นี้ ดูเสมือนว่าหุ่นยนต์จะก้าวล้ำกว่ามนุษย์เสียอีก เพราะเขาสามารถบังคับให้ส่วนประมวลผลหยุดการปรุงแต่งเมื่อถึงขีดจำกัดสมองมนุษย์กลับทำเช่นนี้ได้ยากเพราะขาด “สติ” ตามรู้ไม่ทันกิเลส จึงเกิดอุปทานสร้างข้อมูลที่ไร้สาระและเจือด้วยอกุศลมากมาย จนเกิดอาการ “สำลักสารสนเทศ” จมกองทุกข์นั่นเอง