โครงข่ายประสาทเทียมและ AI: สิ่งที่ยากที่สุดคือการเข้าใจสิ่งที่เราต้องการ ปัญญาประดิษฐ์ โครงข่ายประสาทเทียมในระบบการเรียนรู้อัจฉริยะ

08.03.2022

เมื่อวันที่ 19 ธันวาคม ภายใต้กรอบของโครงการบรรยายของมูลนิธิ Yegor Gaidar, Mikhail Burtsev, Ph.D. ทำงานเหมือนสมองของมนุษย์ งานนี้ดำเนินไปโดยผู้สังเกตการณ์ทางเศรษฐกิจ บอริส โกรซอฟสกี รายละเอียดการบรรยายของผู้เชี่ยวชาญอยู่ในวิดีโอ Kommersant และสำเนารายงาน


มูลนิธิ Yegor Gaidar ด้วยการสนับสนุนด้านข้อมูลของ Kommersant ได้เปิดตัวหลักสูตรของโครงการบรรยาย "คณะเศรษฐศาสตร์" "เศรษฐศาสตร์แห่งอนาคต" หลักสูตรนี้รวมการบรรยายสี่ครั้งเกี่ยวกับเทคโนโลยีชั้นสูง ได้แก่ สกุลเงินดิจิตอล บล็อคเชน ปัญญาประดิษฐ์และโครงข่ายประสาทเทียม บิ๊กดาต้า

การบรรยายครั้งแรกของวัฏจักร "เศรษฐศาสตร์แห่งอนาคตที่จะมาถึง" ซึ่งอุทิศให้กับ cryptocurrencies เกิดขึ้นเมื่อวันที่ 21 พฤศจิกายน รายละเอียดเพิ่มเติม - ในเนื้อหา "Kommersant" “สกุลเงินดิจิทัล: เศรษฐกิจใหม่ หรือ พีระมิดใหม่”.

การบรรยายครั้งที่ 2 จัดขึ้นเมื่อวันที่ 5 ธันวาคม และมุ่งเป้าไปที่การนำปัญญาประดิษฐ์มาใช้ รายละเอียดเพิ่มเติม - ในเนื้อหา "Kommersant" "คนกับเครื่องจักร - พันธมิตรที่ทำกำไรหรือการแข่งขันที่ดุเดือด?".

Transcript ของการบรรยาย


เมื่อฉันได้รับเชิญไปบรรยาย ฉันชอบชื่อวัฏจักรนี้มาก - "เศรษฐกิจแห่งอนาคต" ฉันทำงานกับโครงข่ายประสาทเทียมมากว่าสิบปี แต่ในช่วงสองหรือสามปีที่ผ่านมา มักมีความรู้สึกว่าอนาคตกำลังมาถึงอย่างหลีกเลี่ยงไม่ได้ ในเรื่องนี้ ชื่อของวัฏจักรสะท้อนถึงสิ่งที่ฉันต้องการจะพูดได้อย่างสมบูรณ์แบบและสิ่งที่เราสามารถพูดคุยได้หลังจากการบรรยาย ดังนั้น ฉันวางแผนที่จะบอกคุณเกี่ยวกับโครงข่ายประสาทเทียม และวิธีที่พวกเขาใช้ในปัจจุบันเพื่อสร้างระบบอัจฉริยะ มันยังระบุด้วยว่า "พวกเขาจะเปลี่ยนชีวิตเราได้อย่างไร" แต่เราสามารถพูดคุยเกี่ยวกับสิ่งนี้ได้ในแบบโต้ตอบมากขึ้น เพราะที่นี่ ฉันคิดว่า คำถามเปิดอยู่ ตัวฉันเองสนใจในโอกาสที่คุณเห็นว่าฉันไม่เห็น

เริ่มจากสิ่งที่เป็นปัญญาประดิษฐ์ มาลองกำหนดหัวข้อที่เรากำลังพูดถึงกัน คำจำกัดความคลาสสิกของปัญญาประดิษฐ์คือการสร้างเครื่องจักรบางเครื่องที่จะมีสติปัญญาเทียบเท่ากับของมนุษย์ แต่คำถามก็เกิดขึ้น: ทำไมเราถึงทำเช่นนี้? ทำไมสังคมถึงทำเช่นนี้?สำหรับฉันที่นี่ดูเหมือนว่ามีสองด้าน ด้านแรกคือเป้าหมายที่นำไปใช้ ซึ่งเป็นสิ่งแรกที่อยู่ในใจเมื่อเราได้ยินเกี่ยวกับปัญญาประดิษฐ์ เราต้องการผู้ช่วยที่จะช่วยเสริมสติปัญญาตามธรรมชาติของเรา ซึ่งช่วยให้เราแก้ปัญหาบางอย่างได้ วิธีที่เครื่องคิดเลขทำให้ชีวิตของเราง่ายขึ้นอย่างมาก ทำให้เราทำสิ่งที่คิดว่าฉลาดมากเมื่อร้อยปีก่อนได้ เช่น การคูณ การบวก การหารจำนวนมาก เป็นบรรพบุรุษของปัญญาประดิษฐ์ ด้านที่สอง - หากเรามองว่าปัญญาประดิษฐ์เป็นโครงการวิจัยพื้นฐาน ในความเป็นจริง เนื่องจากเราต้องการสร้างเครื่องจักรที่เทียบได้กับสติปัญญาของบุคคล เราย่อมตั้งคำถามกับตัวเองอย่างหลีกเลี่ยงไม่ได้: ปัญญามนุษย์คืออะไร อย่างที่ Richard Feynman พูดไว้ "เพื่อให้เข้าใจอะไรบางอย่าง ฉันต้องรู้วิธีสร้างมันขึ้นมา" ดังนั้นที่นี่ ในแง่หนึ่ง การสร้างปัญญาประดิษฐ์ทำให้เราเข้าใจการทำงานของปัญญาประดิษฐ์ได้ดีขึ้น และในแง่นี้ เราเจาะเข้าไปในสาขาปรัชญา นั่นคือ เราจัดการกับธรรมชาติของมนุษย์ บุคคลทำงานอย่างไร เขามีแรงจูงใจอย่างไร เหตุใดเขาจึงประพฤติไม่ทางใดก็ทางหนึ่ง นั่นคือน่าสนใจมากจากมุมมองของการวิจัย สำหรับฉันดูเหมือนว่าสิ่งเหล่านี้เป็นเหตุผลหลักว่าทำไมเราถึงมีส่วนร่วมในปัญญาประดิษฐ์

มาดูกันว่าเราจะสร้างปัญญาประดิษฐ์โดยทั่วไปได้อย่างไร ลองนึกภาพว่าคุณเป็นผู้จัดโครงการปัญญาประดิษฐ์ คุณจะเริ่มด้วยอะไร มีตัวเลือกอะไรบ้าง? อย่างแรกคือการแตกหัว เราสำรวจว่าสมองที่ประกอบด้วยเซลล์ประสาทแก้ปัญหาอย่างไร จากนั้น ทำความเข้าใจหลักการว่าส่วนประกอบเหล่านี้โต้ตอบกันอย่างไร เราจึงสร้างอัลกอริธึมที่ใช้งานได้ นั่นคือ เราจะสร้างแบบจำลองของสมองจากเซลล์ประสาท และจากนั้น เราจะได้รับโครงข่ายประสาทเทียม วิธีที่สองคือการเข้าใจว่าความฉลาดคืออะไร เราสามารถพาคนที่แก้ปัญหาทางปัญญาและตรวจสอบกระบวนการได้ พวกเขาทำอย่างไร ใช้กลอุบายอะไร พวกเขามีช่วงเวลาใด เช่น การพิสูจน์ทฤษฎีบททางคณิตศาสตร์ จากนั้นเราจะพยายามสร้างแบบจำลองบางอย่างสำหรับการแก้ปัญหาทางปัญญา จัดระเบียบ และพยายามเรียกใช้บนคอมพิวเตอร์เพื่อให้เกิดผลลัพธ์ทางปัญญาแบบเดียวกัน นี่เป็นสองแนวทางหลักในการที่ผู้คนโดยทั่วไปใช้ปัญญาประดิษฐ์: วิธีแรกใช้การสร้างแบบจำลองระบบชีวภาพของสมอง และวิธีที่สองใช้เหตุผลของมนุษย์ นี่คือสิ่งที่เรียกว่า "ปัญญาประดิษฐ์เชิงสัญลักษณ์" และจนกระทั่งเมื่อเร็ว ๆ นี้เรียกว่า "ปัญญาประดิษฐ์แบบดั้งเดิม" หรือ "ปัญญาประดิษฐ์" แต่วันนี้มีการเปลี่ยนแปลงจากแนวคิดของ "ปัญญาประดิษฐ์เชิงสัญลักษณ์" เป็นแนวคิดของ "โครงข่ายประสาทเทียม" ”

โดยสังเขปประวัติความเป็นมาของการวิจัยเช่นปัญญาประดิษฐ์โดยทั่วไป ในช่วงกลางศตวรรษที่ผ่านมา Norbert Wiener ได้คิดค้นวิทยาศาสตร์ที่เรียกว่าไซเบอร์เนติกส์ เป็นวิทยาศาสตร์ที่พยายามทำให้เป็นทางการและสร้างแบบจำลองขององค์กร ในขณะที่แยกแบบจำลองขององค์กรออกจากสารตั้งต้นที่องค์กรนี้สามารถเปิดเผยได้ กล่าวคือสามารถเป็นองค์กรของเซลล์ในร่างกายสามารถเป็นองค์กรของคนในสังคมหรือองค์กรของสิ่งประดิษฐ์ทางกลบางชนิดที่ปัญญาประดิษฐ์ก่อตัวขึ้น ดังนั้น การเกิดขึ้นของปัญญาประดิษฐ์จึงเริ่มต้นด้วยไซเบอร์เนติกส์ ด้วยการสร้างเครื่องจักรหุ่นยนต์ที่สามารถแก้ปัญหาบางอย่างได้ พวกเขาสามารถไปที่แสงหรือในทางกลับกันหลบเลี่ยงแสงไปรอบ ๆ สิ่งกีดขวาง เมื่อคอมพิวเตอร์ปรากฏขึ้น สิ่งนี้เปิดโอกาสสำหรับการเกิดปัญญาประดิษฐ์ในรูปแบบที่เราเห็นกันในปัจจุบัน - เป็นโปรแกรมบางประเภทที่ควบคุมคอมพิวเตอร์และสามารถให้คำตอบที่มีความหมายได้ ตัวอย่างเช่น ความพยายามอย่างมากในการใช้อัลกอริธึมปัญญาประดิษฐ์ในการแก้ปัญหาในทางปฏิบัติแสดงให้เห็นว่าเราสามารถแก้ปัญหาง่ายๆ บางอย่างได้อย่างรวดเร็วแม้ในคอมพิวเตอร์ดั้งเดิมที่ปรากฏในช่วงกลางทศวรรษ 1950 และต้นทศวรรษ 1960 หนึ่งในความสำเร็จที่รู้จักกันดีในเวลานั้นคือโปรแกรมทฤษฎีลอจิกซึ่งบนพื้นฐานของสัจพจน์สามารถพิสูจน์ทฤษฎีบททั้งหมดของเรขาคณิตของโรงเรียนได้

ผู้คนมีความคาดหวังสูงมาก เราสามารถพูดได้ว่ามีปัญญาประดิษฐ์มากมาย กองทัพและรัฐบาลทุ่มเงินจำนวนมาก ส่งผลให้สิ่งที่เราเรียกว่า "ปีทองของปัญญาประดิษฐ์" ในขณะเดียวกัน ปัญญาประดิษฐ์โครงข่ายประสาทเทียมของเรากำลังพัฒนาในเงามืด อย่างไรก็ตาม หากเราอ่านคำทำนายของนักวิจัยชั้นนำในขณะนั้น เราจะเห็นว่าในทศวรรษ 1960 พวกเขากล่าวว่าในอีก 10 ปีข้างหน้า คอมพิวเตอร์จะทำหน้าที่เหมือนคนทั่วไปได้ ทุกคนกล่าวคำกล่าวดังกล่าวเป็นประจำ และเป็นที่เข้าใจได้ว่าทำไมพวกเขาถึงได้รับเงินจำนวนมาก ใครจะปฏิเสธที่จะมีหุ่นยนต์ที่ในสิบปีจะทำทุกอย่างที่คนทำ? ในเรื่องนี้ เป็นที่เข้าใจได้ว่าทำไมการวิจัยปัญญาประดิษฐ์จึงถูกระงับ เมื่อคนที่ให้เงินไม่เห็นสิ่งที่พวกเขาสัญญาไว้อีกสิบปีต่อมา พวกเขาตัดสินใจว่าเงินทั้งหมดว่างเปล่าและปิดบังเงินทุนไว้

อย่างไรก็ตามเรื่องนี้มีการพัฒนาอัลกอริธึมและแนวทางในการแก้ปัญหาจำนวนมากพอสมควร และกลายเป็นว่าใช้ได้ในพื้นที่แคบๆ บางแห่ง ปรากฎว่าเป็นไปได้ที่จะสร้างระบบผู้เชี่ยวชาญตามข้อมูลอินพุตและข้อเท็จจริงที่อธิบายสถานะของระบบและตัวอย่างเช่นการวินิจฉัยโรคบางอย่าง เป็นผลให้พวกเขากลับไปสู่ปัญญาประดิษฐ์ชั่วขณะหนึ่ง แต่ระบบเองก็ไม่ได้ใช้กันอย่างแพร่หลาย นั่นคือ เราสามารถปิดสาขาวิชาได้หลายวิชา และจากนั้นการพัฒนาก็ถึงเพดาน ในเวลาเดียวกัน ความสนใจในโครงข่ายประสาทเทียมได้ฟื้นคืนชีพขึ้นมา โมเดลต่างๆ ของการคำนวณแบบกระจายขนานทุกรูปแบบได้เกิดขึ้น เป็นต้น และที่นี่ เราได้รับผลลัพธ์ที่แตกต่างกันในการจัดกลุ่มและหน่วยความจำเครือข่ายประสาทเทียม แต่การศึกษาเหล่านี้ส่วนใหญ่ยังคงอยู่ในกรอบของห้องปฏิบัติการวิจัย

นับตั้งแต่ปลายทศวรรษ 1990 และจนกระทั่งเมื่อไม่นานนี้เป็นเวลา 20 ปี เราได้เห็นสถานการณ์ที่ซบเซาเช่นนี้ เมื่อคำว่า "ปัญญาประดิษฐ์" เลิกใช้โดยนักวิทยาศาสตร์ทั่วไป เชื่อกันว่าถ้ามีคนบอกว่าเขาทำงานด้านปัญญาประดิษฐ์ นี่อาจไม่ใช่นักวิทยาศาสตร์มืออาชีพ แต่เป็นนักคิดมือสมัครเล่นที่กระตือรือร้นที่พยายามจะเขียนอะไรบางอย่าง นั่นคือคน ๆ หนึ่งไม่สามารถยอมรับได้แม้ว่าเขาจะมีส่วนร่วมในปัญญาประดิษฐ์ก็ตาม แต่เขาก็มีปัญญาประดิษฐ์ ดังนั้นจึงเริ่มเรียกว่าแมชชีนเลิร์นนิง การเรียนรู้ของเครื่องหมายความว่าอย่างไร มันเป็นแนวทางปฏิบัติ สมมติว่าเรามีชุดวิธีการ - สถิติทางคณิตศาสตร์ วิธีการปรับให้เหมาะสม และอื่นๆ เราจะใช้สิ่งเหล่านี้เพื่อแก้ปัญหาในทางปฏิบัติ และเราจะเรียกการเรียนรู้ของเครื่องทั้งหมดนี้ ในเวลาเดียวกัน ปัญหาการใช้งานที่น่าสนใจมากมายได้รับการแก้ไข และยังคงดำเนินต่อไปจนถึงปี 2555 แต่ ในปี 2012 มีคำศัพท์ที่ยอดเยี่ยมปรากฏขึ้น - "การเรียนรู้อย่างลึกซึ้ง"

ปรากฎว่าตั้งแต่กลางทศวรรษ 2000 โครงข่ายประสาทเทียมเริ่มมีประสิทธิภาพอีกครั้งและแสดงผลได้ดีในห้องปฏิบัติการ มีงานการจัดหมวดหมู่รูปภาพเมื่อมีรูปภาพหลายล้านภาพและหนึ่งพันหมวดหมู่ และคุณต้องพิจารณาจากรูปภาพว่าเป็นของหมวดหมู่ใด ดังนั้นในปี 2010 อัลกอริทึมที่ดีที่สุดสำหรับการจัดหมวดหมู่ดังกล่าวจึงให้ข้อผิดพลาดประมาณ 27% แต่ระหว่างปี 2010 ถึง 2012 ข้อผิดพลาดนี้ลดลงอย่างมาก นั่นคืออัลกอริธึมในเชิงคุณภาพในการแก้ปัญหานี้ และหากบุคคลจัดประเภทรูปภาพในชุดใดชุดหนึ่งอย่างไม่ถูกต้องใน 5% ของกรณี อัลกอริทึมก็สร้างข้อผิดพลาด 4.5% และตอนนี้ก็มีแล้ว 3% ความก้าวหน้าอย่างรวดเร็วในพื้นที่นี้เกิดจากการที่วิธีการโครงข่ายประสาทเทียมถูกนำมาใช้เป็นครั้งแรก จากนั้นทุกโซลูชันที่ปรับปรุงผลลัพธ์ของปีที่แล้วก็ขึ้นอยู่กับโครงข่ายประสาทเทียม ทำไมพวกเขาถึงเรียกว่าลึกเราจะเรียนรู้ในภายหลัง

แล้วโครงข่ายประสาทเทียมคืออะไร? ลองคิดดูสิ เริ่มต้นด้วยการดูว่าโครงข่ายประสาทธรรมชาติทำงานอย่างไร โดยปกติสมองของหนูทดลอง C57black6 ได้รับการศึกษาเพื่อสิ่งนี้ - เช่นหนูดำ บริเวณหนึ่งของสมองเรียกว่าฮิปโปแคมปัส ทำไมเธอถึงน่าสนใจ? ความจริงที่ว่านี่เป็นพื้นที่ที่หน่วยความจำเป็นตอนขึ้นอยู่กับมาก ฮิปโปแคมปัสมีอนุภูมิภาคเรียกว่า dentate fascia ช่วยให้คุณรับรู้บริบทที่ใกล้เคียงกัน และที่น่าสนใจที่สุดคือการสร้างเซลล์ประสาทเกิดขึ้นในบริเวณนี้ นั่นคือเซลล์ประสาทเกิดที่นั่นตลอดชีวิตในสัตว์ที่โตเต็มวัย การอ้างว่าเซลล์ประสาทไม่สร้างใหม่นั้นผิดจริง - ในสมองของมนุษย์และสัตว์อื่นๆ เซลล์ประสาทจะแบ่งตัวและเติบโต

เซลล์ประสาทแต่ละเซลล์ของชั้นแกรนูลของร่องฟัน dentate คืออะไร? เซลล์ประสาทประกอบด้วยสามส่วน: ร่างกายของเซลล์ที่ยืดออก ต้นไม้ dendritic ที่รับสัญญาณจากเซลล์อื่น และกระบวนการบางที่เรียกว่าแอกซอน ซึ่งช่วยให้ส่งข้อมูลไปยังเซลล์อื่นได้ สิ่งนี้เกิดขึ้นได้อย่างไร? ต้นไม้เดนไดรต์มีกระบวนการที่เรียกว่าหนาม ที่ปลายหนามเหล่านี้เป็นไซแนปส์ สารเคมีที่เรียกว่าสารสื่อประสาทถูกปล่อยออกมาจากซอน ถุงน้ำที่บรรจุสารสื่อประสาทเชื่อมต่อกับเมมเบรนและถูกขับออกสู่พื้นที่นอกเซลล์ เพื่อให้รู้สึกถึงสัญญาณนี้ เราจำเป็นต้องมีอีกเซลล์หนึ่งเพื่อรับโมเลกุลเคมีเหล่านี้และสัมผัสได้ถึงโมเลกุลเหล่านี้ ในการทำเช่นนี้จะมีการสร้างไซแนปส์ที่เรียกว่าระหว่างเซลล์ซึ่งเป็นตราประทับซึ่งโมเลกุลการยึดเกาะของเซลล์พิเศษเชื่อมต่อเยื่อหุ้มเซลล์สองเซลล์ มีการแทรกตัวรับไว้ที่นี่ด้วย - นี่คือโมเลกุลที่ช่วยให้คุณระบุได้ว่ามีสารเคมีบางชนิดอยู่ ดังนั้น สารเคมีบางชนิดจึงถูกปล่อยเข้าสู่ช่องว่าง synaptic ระหว่างเยื่อหุ้มทั้งสอง โมเลกุลที่อยู่บนเยื่อหุ้มเซลล์ประสาท postsynaptic จะรู้สึกถึงสารนี้ และสัญญาณจะถูกส่งเข้าไปภายในเซลล์ สัญญาณจากส่วนต่างๆ ของต้นไม้เดนไดรต์ของเราจะถูกรวบรวมไว้ที่ร่างกาย ตัวอย่างเช่น เซลล์อาจตัดสินใจว่าควรส่งสัญญาณไปยังเซลล์อื่นๆ ที่อยู่ในสมอง

ลองนึกภาพว่า 80 พันล้านเซลล์ในสมองของคุณส่งสัญญาณทางเคมีถึงกันและกัน และคุณรู้สึก เช่น ความสุขที่ได้แต่งกลอน หรือคุณกำลังเพลิดเพลินกับท่วงทำนองที่สวยงาม หรือคุณตกหลุมรักใครสักคน ทั้งหมดนี้ถูกกำหนดโดยปฏิสัมพันธ์ระหว่างเซลล์เหล่านี้ และเมื่อคุณเรียนรู้สิ่งใหม่ ความทรงจำของคุณเกี่ยวกับสิ่งใหม่นี้และความรู้ที่คุณได้รับจะถูกเก็บไว้ในผู้ติดต่อ กล่าวคือ เซลล์เสริมสร้างการติดต่อซึ่งกันและกัน ปรับเปลี่ยนพวกเขา และด้วยเหตุนี้ เราจึงสามารถเรียนรู้ จดจำบางสิ่งบางอย่าง รู้สึก และควบคุมพฤติกรรมของเราได้

ทีนี้มาลองจำลองสมองของเรากัน รูปแบบของเซลล์ประสาทที่ง่ายที่สุดและดั้งเดิมที่สุดจะมีลักษณะอย่างไร ด้านบนมีต้นไม้เดนไดรต์ มีอินพุตของอัลกอริทึมของเราด้วย ค่า X1, X2 X3, X4 และ X5 ถูกนำไปใช้กับอินพุต ตัวเลขดังกล่าวเป็นสัดส่วนกับปริมาณสารสื่อประสาทที่เซลล์อื่นโยนมาที่เรา เป็นที่ชัดเจนว่าเซลล์บางเซลล์ในแต่ละครั้งสามารถขับสารนี้ออกไปได้มากขึ้น บางส่วนก็น้อยลง ดังนั้น ในแต่ละครั้ง X1, X2 X3, X4 และ X5 เหล่านี้อาจแตกต่างกัน แต่หากต้องการสัมผัสโมเลกุลเหล่านี้ เราจำเป็นต้องมีตัวรับที่อยู่อีกด้านหนึ่ง เพราะถ้ามีตัวรับเป็นศูนย์ ไม่ว่าสารเคมีนี้จะถูกโยนมาที่เรามากแค่ไหน เซลล์ของเราก็จะไม่รู้สึกอะไรเลย ในการสร้างแบบจำลองความไวต่อสารนี้ เราอธิบายมันโดยใช้สัมประสิทธิ์ W ค่านี้เรียกว่าน้ำหนักพันธะ ดังนั้น หากค่ามีขนาดใหญ่และน้ำหนักมาก เราจะคูณค่าเหล่านั้นและรับอิทธิพลอย่างมากจากข้อมูลนี้ในกิจกรรมของเรา หากสัญญาณทางเคมีที่ส่งถึงเราเป็นศูนย์ แม้ว่าจะมีไซแนปส์ที่ดีในที่อื่น ข้อมูลนี้จะไม่ส่งผลต่อกิจกรรมของเราแต่อย่างใด ในทางกลับกัน ด้วยสารสื่อประสาทในปริมาณที่เท่ากัน การป้อนข้อมูลที่มีน้ำหนักมากกว่าจะมีผลอย่างมากต่อกิจกรรมของเซลล์ประสาทของเรา

นั่นคือเรากำลังทำอะไรอยู่? เราพิจารณาว่าข้อมูลที่ป้อนเข้ามามีอิทธิพลต่อกิจกรรมของเรามากน้อยเพียงใด เราเพียงแค่นำ สรุป คูณแต่ละค่าด้วยน้ำหนัก และคำนวณผลรวม จากนั้นเราต้องหาค่า Y โดยปกติในแมชชีนเลิร์นนิง สิ่งที่เราได้รับเป็นอินพุตในโปรแกรมเรียกว่า X และสิ่งที่เราได้เป็นเอาต์พุตคือ Y ในการคำนวณ Y เราทำการแปลงและคำนวณฟังก์ชันของผลรวมของ ผลกระทบเพื่อจำลองการกระทำของธรณีประตูของเซลล์ประสาท นั่นคือ จนกว่าขีดจำกัดการรับแสงของเราจะเกิน เซลล์ประสาทของเราจะไม่ทำงาน เมื่อกิจกรรมทั้งหมดนี้เกินขีดจำกัด ขึ้นอยู่กับฟังก์ชัน - เรียกว่าฟังก์ชันการเปิดใช้งาน - เราสามารถปรับเกณฑ์ได้ เช่น โดยออฟเซ็ต ซึ่งปกติเรียกว่า W ในกรณีนี้ เราสามารถคำนวณผลลัพธ์ที่เซลล์ประสาทของเราจะได้รับโดยปกติ หากเกินเกณฑ์ที่เราพูดถึง ค่าของ Y จะมีมาก ดี หรือมีแนวโน้มเป็นหนึ่ง และถ้ามันเล็ก มันจะเป็นลบหนึ่ง หรือศูนย์ หรือไป ถึงลบอนันต์ขึ้นอยู่กับว่าเราจะเลือกฟังก์ชั่นการเปิดใช้งาน

โอเค เราเข้าใจดีว่าเซลล์ประสาทเดี่ยวคืออะไร แต่สมองไม่ได้ประกอบด้วยเซลล์ประสาทเพียงเซลล์เดียว เรามี 80 พันล้าน และเมาส์มีหลายร้อยล้าน ตอนนี้เราต้องรวมเซลล์ประสาทเหล่านี้เป็นเครือข่าย เกิดอะไรขึ้นกับเรา? เมื่อเราหมกมุ่นอยู่กับโลกรอบตัวเรา ถ้าเราดูระบบการมองเห็น เราก็มีแท่ง กรวย เซลล์ที่กระตุ้นด้วยแสง ซึ่งขึ้นอยู่กับว่าแสงกระทบพวกมันมากน้อยเพียงใด แบบจำลองกิจกรรมของพวกมัน โดยธรรมชาติแล้ว สัญญาณเหล่านี้จะถูกส่งผ่านสายโซ่ที่ลึกและลึกเข้าไปในสมอง และสมองก็พยายามที่จะฟื้นฟูภาพของโลกที่ล้อมรอบเรา ดังนั้นเราจึงมีเลเยอร์อินพุตของเครือข่ายของเราและมีเลเยอร์ที่ซ่อนอยู่ นั่นคือ คุณกำลังเดินไปตามถนน ข้ามถนน หันหลังกลับ ก็พบว่ามีรถวิ่งเข้ามาหาคุณ คุณได้รับสัญญาณ ไปที่เลเยอร์ที่ซ่อนอยู่ โมเดลโลกของคุณทำงานได้ และคาดการณ์ว่ารถจะชนคุณถ้าคุณไม่เร่งความเร็วหรือเด้งกลับ และมีองค์ประกอบการส่งออก นี่คือเซลล์ประสาทสั่งการที่ควบคุมการเคลื่อนไหวของคุณ พวกเขานำไปสู่การเปลี่ยนแปลงพฤติกรรม - คุณไม่เดินอย่างสงบ แต่พยายามกระโดดไปด้านข้างหรือเขย่ากำปั้นที่คนขับนั่นคือคุณทำบางอย่าง ดังนั้นเราจึงสร้างโครงข่ายประสาทหลายชั้นจากเซลล์ประสาทของเรา ยิ่งมีชั้นมากเท่าไหร่ก็ยิ่งลึกเท่านั้น ดังนั้น เครือข่ายลึกคือเครือข่ายเหล่านั้นซึ่งมีมากกว่าห้า อาจเป็นหลายร้อยชั้น และเซลล์ประสาทจำนวนมาก นี่คือวิธีที่เราตัดสินใจ

เรามาลดความซับซ้อนของงานกันเล็กน้อยโดยใช้ตัวอย่างการจัดหมวดหมู่รูปภาพ เรามองมันอย่างไร? เรามีภาพ เราจะใช้อะไรกับอินพุตของโครงข่ายประสาทเทียมของเรา? เราจะส่งรายละเอียดของพิกเซล นั่นคือถ้าเรามีรูปภาพ 10x10 ก็จะมี 100 พิกเซล สมมติว่าเรามีสีแดง สีเขียว และสีน้ำเงิน - ตามลำดับ เรามี 300 ค่า: X1, X2 - สูงสุด X300 สมมติว่าเรากำลังแก้ปัญหา: เรามีภาพจำนวนมาก และสำหรับธุรกิจของเรา เราต้องแยกแมวออกจาก Dunno เราข้ามแมว แต่เราไม่ข้าม Dunno เพราะแมวต้องจับหนูในห้องใต้ดิน และ Dunno สามารถทำลายระบบประปาได้ เรากำลังสร้างระบบเฝ้าระวังวิดีโอที่เราป้อนรูปภาพเป็นอินพุต และมีเอาต์พุตสองช่อง - ระบบควรส่งออก 1 หาก Dunno และ 0 หากเป็น cat

อะไรเป็นตัวกำหนดการทำงานที่ถูกต้องของเครือข่าย โดยปกติแล้ว ฟังก์ชันการเปิดใช้งานจะได้รับการแก้ไข ดังนั้นเราจึงมีขีดจำกัดและ W - นี่คือน้ำหนัก ในตอนแรกเมื่อเรามีรูปถ่าย เราไม่ทราบว่าน้ำหนักใดสอดคล้องกับวิธีแก้ปัญหาที่ถูกต้องในเครือข่ายนี้ เราจำเป็นต้องเลือกตุ้มน้ำหนักเหล่านี้ในลักษณะที่ข้อผิดพลาดในการแยกแยะ Dunno ออกจากแมวน้อยที่สุด ที่นี่เรามาดูกันว่าโครงข่ายประสาทเทียมแตกต่างจากการเขียนโปรแกรมมาตรฐานอย่างไร เพราะถ้าการเขียนโปรแกรมเป็นมาตรฐาน เราจะเข้าหางานนี้ในฐานะโปรแกรมเมอร์ด้านไอที: “ใช่ ฉันต้องคิดให้ออกว่า cat แตกต่างจาก Dunno อย่างไร จากนั้นฉันจะเขียนโปรแกรมที่จะมองหาสัญญาณเหล่านี้ของแมวหรือ Dunno ในภาพและใช้เงื่อนไข - นี่คือแมว นี่คือ Dunno - คำนวณฟังก์ชันนี้ เราว่าเราไม่อยากรู้ว่าแมวแตกต่างจาก Dunno อย่างไรเราไม่สนใจ เราจะสร้างอัลกอริธึมการเรียนรู้พิเศษที่จะสร้างฟังก์ชันที่จะแก้ปัญหาของเรา เช่น เราไม่ได้เขียนโปรแกรมด้วยมือของเรา แต่เราฝึกโปรแกรมเพื่อให้ได้ฟังก์ชันที่เราต้องการ

เราจะทำได้อย่างไร? เรามีตัวอย่างบางชุด เรียกว่า ตัวอย่างการฝึก ยิ่งตัวอย่างมาก ยิ่งดี ตัวอย่างเช่น เรามี Dunno 10,000 รูปและแมว 10,000 รูปที่เราถ่ายรูปไปแล้วและเรารู้ล่วงหน้าว่าแมวอยู่ที่ไหนและ Dunno อยู่ที่ไหน จากภาพเหล่านี้ เราต้องการเลือกน้ำหนักในลักษณะที่เมื่อเรามีภาพแมวและ Dunno ใหม่ๆ ที่เราไม่เคยเห็น ระบบยังสามารถแยกแยะระหว่างภาพเหล่านี้ได้ เราทำแบบนี้ อันดับแรก เราตั้งค่าน้ำหนักเหล่านี้แบบสุ่มและเริ่มป้อนรูปภาพไปยังอินพุต คุณคิดว่าผลลัพธ์จะเป็นอย่างไรหากเราตั้งค่าน้ำหนักแบบสุ่ม? คุณสามารถเรียกมันว่าระเบียบ ระบบจะสุ่มชื่อคำตอบ และที่นี่เราจะไปยังส่วนที่น่าสนใจที่สุดของโครงข่ายประสาทเทียม ซึ่งเรียกว่าอัลกอริธึมการแพร่กระจายกลับ (backpropagation)

เราจะเปลี่ยนน้ำหนักได้อย่างไร? เราสามารถเปลี่ยนแปลงได้ด้วยวิธีต่อไปนี้ เราส่งรูปภาพ คำนวณกิจกรรมทั้งหมดของเซลล์ประสาททั้งหมด อันดับแรกในชั้นหนึ่ง จากนั้นในอีกชั้นหนึ่ง และต่อไปเรื่อยๆ ในชั้นกลางทั้งหมด จนกระทั่งถึงผลลัพธ์ ที่ทางออก เรามีคำตอบว่า Dunno อยู่ที่ไหน และแมวอยู่ที่ไหน เราเปรียบเทียบคำตอบที่โครงข่ายประสาทเทียมให้กับคำตอบที่เรามีนั้นเป็นความจริง เพราะเรารู้คำตอบของภาพในชุดซ้อมแล้ว และคำนวณข้อผิดพลาด ตัวอย่างเช่น หากเรามี 0.5 ที่เอาต์พุต แต่เราต้องการหน่วย ดังนั้น เรามีข้อผิดพลาดเป็นลบ 0.5 นั่นคือเราเหมือนเดิมโดยบอกว่าเราขาดลบ 0.5 เพื่อที่จะให้คำตอบที่ถูกต้องสำหรับผลลัพธ์นี้ หรือในทางกลับกัน หากเรามีผลผลิตน้อยเกินไป และเราต้องการเพิ่มมัน เราก็จะมีข้อผิดพลาดเชิงบวก จากนั้นเราต้องคำนึงถึงการมีส่วนร่วมของน้ำหนักต่อข้อผิดพลาดนี้ด้วย ตอนนี้เราจำเป็นต้องค้นหาว่าเซลล์ประสาททั้งสองนี้และน้ำหนักสองอันส่งผลต่อการมีส่วนร่วมในข้อผิดพลาดอย่างไร เราสามารถตั้งสมมติฐานอะไรในการคำนวณส่วนต่างได้ เราต้องเปลี่ยนน้ำหนักแต่ละรายการเป็นจำนวนเท่าใด อันที่จริง อันดับแรก เราเห็นกิจกรรมของเซลล์ประสาทเหล่านี้ และประการที่สอง น้ำหนัก และเราสามารถคำนวณได้ว่าเซลล์ประสาทใดมีส่วนทำให้เกิดข้อผิดพลาดนี้ ตัวอย่างเช่น ถ้าเซลล์ประสาทนี้ไม่ทำงาน มันก็เท่ากับศูนย์ ก็ไม่มีส่วนทำให้เกิดข้อผิดพลาดนี้ ในทางกลับกัน ยิ่งเซลล์ประสาททำงานมากเท่าไหร่ เซลล์ประสาทก็จะยิ่งมีส่วนสนับสนุนมากขึ้นเท่านั้น แต่ถ้าพวกมันเคลื่อนไหวเท่ากัน ตัวที่มีน้ำหนักมากกว่าก็มีส่วนทำให้เกิดข้อผิดพลาดมากขึ้น ดังนั้น การเปลี่ยนแปลงน้ำหนักควรเป็นสัดส่วนกับตัวมันเอง บวกกับสัดส่วนกับกิจกรรมของเซลล์ประสาทจากเลเยอร์ก่อนหน้า และสัดส่วนกับอนุพันธ์ของฟังก์ชันการกระตุ้นของเรา ทำไมอนุพันธ์จึงมีความสำคัญ? เพราะเราทั้งเพิ่มและลดน้ำหนักได้ และเพื่อที่จะไปในทิศทางที่ถูกต้อง เราต้องคำนึงถึงอนุพันธ์ด้วย

ดังนั้น ก่อนที่เราจะเกิดข้อผิดพลาดเฉพาะกับผลลัพธ์ ตอนนี้เราได้คำนวณข้อผิดพลาดสำหรับเลเยอร์แรกของโครงข่ายประสาทเทียมของเราแล้ว คำถามคือ เราจะคำนวณข้อผิดพลาดสำหรับเลเยอร์ถัดไปได้อย่างไร เราใช้วิธีการเดียวกันนี้จนกว่าจะถึงตุ้มน้ำหนักตัวแรกๆ ดังนั้น ข้อผิดพลาดของเราจึงดูเหมือนจะกระจายไปทั่วโครงข่ายประสาทเทียม และน้ำหนักก็ได้รับการแก้ไขแล้ว อัลกอริธึมนี้เรียกว่าวิธี backpropagation เนื่องจากข้อผิดพลาดแพร่กระจายจากเอาต์พุตไปยังจุดเริ่มต้น และเป็นอัลกอริธึมที่ทรงพลังมาก(วิธีการแพร่กระจายกลับข้อผิดพลาด - “b”) เนื่องจากมันถูกประดิษฐ์ขึ้นในต้นปี 1970 และตั้งแต่นั้นมาโครงข่ายประสาทเทียมทั้งหมดก็ได้รับการฝึกอบรมด้วยอัลกอริธึมนี้เท่านั้น นั่นคือทุกอย่างที่ฉันจะบอกในวันนี้ได้รับการฝึกฝนโดยอัลกอริทึมที่ทำงานบนหลักการเดียวกันโดยทั่วไป อย่างที่ฉันพูด โครงข่ายประสาทเทียมเกิดขึ้นในปี 1950 แต่ต้องใช้เวลายี่สิบปีในการประดิษฐ์อัลกอริทึมนี้ และต้องใช้เวลาอีกยี่สิบหรือสามสิบปีในการเรียนรู้อย่างลึกซึ้งจึงเกิดขึ้น พวกเขามีปัญหาของตัวเอง สถาปัตยกรรมทั้งหมดที่คุณจะเห็นในวันนี้นั้นซับซ้อนมาก พวกเขาทั้งหมดได้รับการฝึกฝนโดยอัลกอริธึมการแพร่กระจายกลับ ที่ซับซ้อนที่สุดพยายามจำลองเครื่องทัวริงนั่นคือเพื่อสร้างคอมพิวเตอร์สากลบนเครือข่ายประสาท

เหตุใดโครงข่ายประสาทเทียมจึงมีประสิทธิภาพในทันใด ปรากฎว่าวิธีโครงข่ายประสาทเทียมสูญเสียวิธีการทางสถิติแบบคลาสสิกหากมีข้อมูลเพียงเล็กน้อย หากคุณมี Dunno สิบภาพและแมวสิบภาพ การใช้โครงข่ายประสาทเทียมก็ไม่มีประโยชน์ คุณจะไม่สามารถฝึกอบรมพวกเขาได้และคุณจะไม่สามารถได้งานที่มีคุณภาพดี อย่างไรก็ตาม หากคุณมี Dunnos 10,000 ตัวและแมว 10,000 ตัว โครงข่ายประสาทเทียมจะเอาชนะอัลกอริธึมที่สร้างขึ้นด้วยวิธีการแบบคลาสสิก 15 ปีที่แล้ว ไม่มีใครมีพลังประมวลผลมากพอที่จะสร้างและประมวลผลโครงข่ายประสาทเทียมขนาดใหญ่ และไม่มีข้อมูลจำนวนมากพอที่จะฝึกฝน นั่นเป็นเหตุผลที่ไม่มีใครรู้ว่าหากคุณสร้างเครือข่ายให้ลึกและให้ข้อมูลมากขึ้น คุณจะได้ผลลัพธ์ที่น่าประทับใจ แต่ตัวเร่งกราฟิกดูเหมือนจะคำนวณเกมในแบบเรียลไทม์ และปรากฎว่าสามารถใช้ในการฝึกอบรมโครงข่ายประสาทเทียมได้ เนื่องจากการดำเนินการดังกล่าวจะคูณกันในเมทริกซ์ ซึ่งขนานกันเป็นอย่างดีกับตัวเร่งความเร็วเหล่านี้ และสิ่งนี้นำไปสู่การปฏิวัติโครงข่ายประสาทเทียม ซึ่งตอนนี้เราจะเรียนรู้เกี่ยวกับ

มีสามพื้นที่หลักในด้านการเรียนรู้อย่างลึกซึ้ง นี่คือทิศทางที่เกี่ยวข้องกับการมองเห็นของคอมพิวเตอร์ซึ่งโครงข่ายประสาทเทียมพยายามมองเห็นบางสิ่งในโลกภายนอก ทิศทางที่เกี่ยวข้องกับการทำนายลำดับ ซึ่งโครงข่ายประสาทเทียมพยายามทำความเข้าใจว่าเกิดอะไรขึ้นในโลกรอบตัวพวกเขา และที่เรียกว่าการเรียนรู้แบบเสริมกำลัง ที่ซึ่งโครงข่ายประสาทเทียมเรียนรู้บางอย่างแล้วจัดการ ลองพิจารณาแต่ละคน

ในคอมพิวเตอร์วิทัศน์ อัลกอริธึมหลักเรียกว่าโครงข่ายประสาทเทียม (convolutional neural network) การปรับเปลี่ยนโครงข่ายประสาทเทียมนี้คืออะไร? คุณมีสองฟังก์ชัน - f และ g ฟังก์ชันการบิดของฟังก์ชันทั้งสองนี้คือคุณเพียงแค่เลื่อนฟังก์ชันทั้งสองนี้ที่สัมพันธ์กันด้วยจำนวนหนึ่ง คูณค่าทั้งหมดและเพิ่มเข้าไป ดังนั้น ถ้าคุณมีขั้นบันไดและสามเหลี่ยมและพวกมันไม่ตรงกัน ฟังก์ชันการบิดจะเท่ากับศูนย์ เพราะฟังก์ชันเหล่านี้มีค่าเท่ากับศูนย์นอกพื้นที่นี้ แต่มีช่วงของค่ากะบางช่วงที่คุณมีค่าสูงสุดของฟังก์ชันการบิดเมื่อตรงกันมากที่สุด จากจุดนี้ เป็นที่ชัดเจนว่าเราจะใช้สิ่งนี้เพื่อวิเคราะห์ภาพได้อย่างไร คุณมีรูปภาพและมีรูปแบบบางอย่างที่คุณต้องการค้นหาในภาพนี้ นั่นคือ คุณมีตัวอย่างเช่น Dunno หรือแมว และคุณต้องการค้นหาว่าแมวตัวนี้มีตาอยู่ที่ใด คุณสามารถเข้ารหัสรูปแบบความสว่างที่ดูเหมือนตา แล้วสแกนทั้งภาพด้วยรูปแบบนี้ อันที่จริง คุณกำลังคำนวณการบิดของภาพด้วยรูปแบบตา ดังนั้น ในส่วนนั้นของภาพที่คล้ายกับรูปแบบที่คุณต้องการมากที่สุด ฟังก์ชันการบิดของคุณจะเป็นค่าสูงสุด ที่นั่น คุณจะสามารถสร้างแผนที่รูปภาพ ซึ่งค่าสูงสุดจะอยู่ในพื้นที่ที่มีรูปแบบของคุณอยู่พอดี

ลองนึกภาพว่าคุณต้องการจดจำภาพที่ซับซ้อนซึ่งมีคุณลักษณะมากมาย คุณกำลังทำอะไรอยู่? อันที่จริง คุณมีมันเป็นเซลล์ประสาทเดียว เซลล์ประสาทมีอินพุต 9 รายการ เอาต์พุต น้ำหนัก รูปแบบของคุณมีน้ำหนัก อินพุตเป็นค่าความสว่างของคุณจริงๆ คุณคูณน้ำหนักด้วยอินพุตของเซลล์ประสาทนี้ บวกกันแล้วได้ค่า ค่านี้คือผลลัพธ์ของเซลล์ประสาทของคุณ ซึ่งเป็นค่าการบิดที่คุณต้องการได้ ดังนั้น คุณจึงสร้างเซลล์ประสาทจำนวนมาก โดยสุ่มกำหนดน้ำหนักให้กับเซลล์เหล่านี้ นั่นคือในขั้นต้น เมื่อคุณแก้ปัญหา คุณไม่รู้ว่าสัญญาณใดที่จะช่วยให้คุณแยกแยะแมวจาก Dunno ได้ โดยพื้นฐานแล้ว คุณรู้ว่าแมวมีลาย และ Dunno มีหมวก สำหรับงานอื่น ๆ จะมีสัญญาณอื่น ๆ และคุณต้องการอัลกอริธึมสากลที่จะค้นหาคุณสมบัติเหล่านั้นที่จะให้ข้อมูลมากที่สุดสำหรับการแยกสองหมวดหมู่ ดังนั้น คุณจึงสร้างเครือข่ายดังกล่าวโดยให้งานการจดจำเป็นอินพุต ตามลำดับ คุณมีจำนวนเซลล์ประสาทที่เกิดการบิดเบี้ยวอินพุตจำนวนหนึ่ง แต่ละคนสร้างแผนที่คุณลักษณะของตนเอง จากนั้นจะมีการดำเนินการบางอย่างในการบีบอัดแผนที่คุณลักษณะเหล่านี้ จากนั้นแผนที่คุณลักษณะเหล่านี้จะถูกป้อนไปยังเซลล์ประสาทที่บิดเบี้ยวอื่นๆ และพวกมันจะมองหาคุณลักษณะที่มีอยู่แล้วในแผนที่คุณลักษณะเหล่านี้ ดังนั้นเราจึงสามารถดำเนินการนี้ได้หลายครั้ง โดยค่อยๆ มองหาสัญญาณของระดับนามธรรมที่สูงขึ้นเรื่อยๆ จากนั้นแมปคุณลักษณะเหล่านี้จะถูกป้อนเข้าสู่เครือข่ายฟีดฟอร์เวิร์ดที่เชื่อมต่ออย่างสมบูรณ์ ซึ่งสัญญาณของเราจะถูกส่งจากอินพุตไปยังเซลล์ประสาทเอาต์พุต และในตอนท้าย เรามีตัวแยกประเภท ดังนั้น อย่างง่าย ๆ ก็คือ การจัดเรียงโครงข่ายประสาทเทียม

วันนี้เราทำอะไรได้บ้างกับเครือข่าย convolutional ที่น่าสนใจที่สุด? ขั้นแรก เราสามารถโลคัลไลซ์วัตถุได้ นั่นคือโครงข่ายประสาทเทียมสามารถกำหนดสิ่งที่อยู่ในกรอบใดกรอบหนึ่งได้ ประการที่สอง เราสามารถทำเครื่องหมายและแบ่งภาพได้ ประการที่สาม อัลกอริทึมสามารถกำหนดเพศและอายุของบุคคลได้ นั่นคือถ้าเรามีตัวอย่างมากมายเกี่ยวกับผู้คนในเพศและวัยที่แตกต่างกัน และเราฝึกโครงข่ายประสาทของเราให้ทำนายอายุและเพศของคน มันก็จะทำนายอายุและเพศของคนจากภาพ ประการที่สี่ มันสามารถกำหนดอารมณ์ของบุคคลได้ถ้าเรามีชุดข้อมูลการฝึกอบรมที่มีป้ายกำกับซึ่งเรารู้ว่าอารมณ์ของบุคคลนั้นเป็นอย่างไร นี่เป็นแอพที่ยอดเยี่ยม ตอนนี้นักพัฒนาทุกคนสามารถสมัครใช้บริการ Microsoft Cloud อัปโหลดรูปภาพ และบริการนี้จะทำให้คุณมีอารมณ์หรืออายุตามเพศได้ภายในสองนาที นั่นคือเทคโนโลยีที่ทุกคนสามารถใช้ในผลิตภัณฑ์ของตนได้

คุณสามารถทำสิ่งที่น่าสนใจอื่นๆ แน่นอนว่าคุณคงเคยได้ยินเกี่ยวกับแอป Prisma มาบ้างแล้ว เราจะทำอะไรกับมันได้บ้าง? เราสามารถถ่ายโอนรูปแบบของภาพหนึ่งไปยังเนื้อหาของอีกภาพหนึ่งได้ นี่คือสิ่งที่เลเยอร์ convolutional ของเราช่วยให้เราทำได้ เราสามารถค้นหาว่าคุณลักษณะต่างๆ มีความสัมพันธ์กันอย่างไรในหนึ่งภาพ จากนั้นจึงโอนความสัมพันธ์ของคุณลักษณะนั้นไปยังเนื้อหาของอีกภาพหนึ่ง มีตัวอย่างวิธีการทาสีมหาวิหารเซนต์เบซิลใต้โคกโลมา เครื่องมือด่วนดังกล่าวที่นักออกแบบสามารถผสมผสานแนวคิดสองแบบเข้าด้วยกันได้ ตัวอย่างเช่น เราสามารถสอนโครงข่ายประสาทให้อ่านริมฝีปากได้ หากเรามีคำบรรยายและวิดีโอที่มีผู้พูด เราสามารถแสดงคำพูดของเขาในข้อความและสร้างโครงข่ายประสาทเทียมที่คาดเดาข้อความได้ หากคุณมีวิดีโอที่ไม่มีเสียง แต่คุณสามารถดูได้ว่าบุคคลนั้นกำลังพูดอย่างไร คุณสามารถกู้คืนข้อความได้โดยอัตโนมัติ

แต่กลายเป็นว่าคุณสามารถทำสิ่งที่บ้าๆ บอๆ ได้มากกว่านี้อีก มีแนวทางดังกล่าว - เครือข่ายการแข่งขันแบบกำเนิด (เครือข่ายปฏิปักษ์กำเนิด - GAN) นี่คือเครือข่ายประสาทประเภทหนึ่งที่ใช้ตัวเข้ารหัสอัตโนมัติ - เมื่อเราเข้ารหัสรูปภาพในครั้งแรกแล้วกู้คืน เราสามารถใช้พวกมันเพื่อฝึกโปรแกรมสร้างภาพที่ซับซ้อนได้ นั่นคือ ขั้นแรก เราแปลงรูปภาพเป็นการแสดงแบบซ่อนบางประเภทจากเลเยอร์ที่ซ่อนอยู่ภายในของเรา ซึ่งเรียกว่าส่วนเข้ารหัส จากนั้นเราป้อนการแสดงแทนที่ซ่อนอยู่ของเราไปยังอินพุตของตัวถอดรหัส และสร้างภาพขึ้นมา เราสามารถถ่ายภาพใบหน้าของชายที่ใส่แว่นได้สามภาพ สำหรับแต่ละภาพ เราจะมีภาพที่ซ่อนอยู่ภายในโครงข่ายประสาทเทียมของเรา มันจะเป็นเวกเตอร์บางส่วนในพื้นที่ภาพบางส่วน ตอนนี้เราจะบวกเวกเตอร์สามตัวนี้และค่าเฉลี่ย คุณจะได้ภาพผู้ชายใส่แว่นธรรมดาๆ จากนั้นเราถ่ายภาพชายสามภาพโดยไม่ใส่แว่น ป้อนภาพที่ซ่อนอยู่ของพวกมันไปยังอินพุตของโครงข่ายประสาทเทียม หาค่าเฉลี่ยเวกเตอร์ - และรับภาพโดยเฉลี่ยของชายที่ไม่สวมแว่น ผู้หญิงที่ไม่ใส่แว่นเราก็ทำได้เช่นกัน รวมแล้ว เราได้เวกเตอร์สามตัว ตอนนี้เราสามารถเอาเวกเตอร์ของผู้ชายที่ใส่แว่น ลบเวกเตอร์ของผู้ชายที่ไม่มีแว่น และเพิ่มเวกเตอร์ของผู้หญิงที่ไม่ใส่แว่น เราจะป้อนเวกเตอร์ที่เราได้รับไปยังตัวถอดรหัส และเครือข่ายของเราจะสร้างภาพของผู้หญิงที่สวมแว่นตา แม้ว่าเธอจะไม่เคยเห็นภาพนี้ก็ตาม อาจมีตัวเลือก - แว่นตาที่มีความสว่างต่างกันผู้หญิงคนนั้นแตกต่างจากที่เราเพิ่มเล็กน้อย แต่โดยทั่วไปแล้วเอฟเฟกต์นั้นน่าสนใจมาก

เมื่อไม่กี่สัปดาห์ก่อน ที่การประชุม NIPS InVideo ได้นำเสนอการพัฒนาเทคโนโลยีนี้ ซึ่งคุณสามารถสร้างภาพโดยเฉลี่ยของคนดังเหล่านี้โดยพิจารณาจากคุณสมบัติของคนดังและแม้แต่การสังเคราะห์วิดีโอกับคนเหล่านี้ อันที่จริง คุณสามารถสร้างบุคลิกสังเคราะห์บางอย่างที่จะปรากฏในซีรีส์หรือภาพยนตร์ของคุณได้ วิธีนี้ช่วยให้คุณประหยัดเงินได้มากเพราะไม่ต้องจ่ายเงินให้กับนักแสดงจริงๆ

งานต่อไปคือโครงข่ายประสาทที่เกิดซ้ำ พวกเขาสามารถทำนายลำดับได้ ในการทำนายลำดับ เราจำเป็นต้องรู้ประวัติบางอย่าง ในโครงข่ายนิวรัลมาตรฐาน เรามี X ที่อินพุต มีเลเยอร์หนึ่งของโครงข่ายประสาทเทียม มีเอาต์พุต และข้อมูลจะถูกกระจายโดยตรงตลอดเวลา หากเราใช้การนับเวลาอื่น โครงข่ายประสาทเทียมของเราจะลืมสิ่งที่รู้ในการนับครั้งก่อน แต่เพื่อให้สามารถทำนายได้ เราแค่ต้องการโครงข่ายประสาทเทียมเพื่อจำหลายครั้ง ทำอย่างไร? โดยปกติสิ่งนี้จะแก้ไขได้ดังนี้: เรานำเอาท์พุตของโครงข่ายประสาทเทียมของเราสำหรับเวลาก่อนหน้าและป้อนค่าเหล่านี้ไปยังอินพุตของมันไปยังเลเยอร์ของโครงข่ายประสาทเทียม มีบางอย่างเกิดขึ้นในเวลา T แต่ไม่ใช่แค่สิ่งที่ T มอบให้เธอเมื่อครู่เท่านั้น แต่ยังรวมถึงสิ่งที่ตัวเธอเองมอบให้ในเวลา T-1 ด้วย ดังนั้นเราจึงป้อนเวกเตอร์สองตัวขนานกันทันที และจากสิ่งนี้ เราคำนวณค่าเอาต์พุตสำหรับเวลา T ปรากฎว่าโครงข่ายประสาทเทียมสามารถถ่ายทอดสิ่งที่ "คิด" ไว้ก่อนหน้านี้ให้ตัวเองได้ ช่วยให้คุณบันทึกข้อมูลการเข้าสู่ระบบครั้งก่อนได้ โครงข่ายประสาทเทียมประเภทนี้เรียกว่า เกิดซ้ำ เนื่องจากมีการเชื่อมต่อแบบวนซ้ำ หากเราแก้ไขปัญหานี้โดยตรง โครงข่ายประสาทที่เกิดซ้ำจะไม่ได้ผลดีนัก เพราะเมื่อเราปรับใช้การวนซ้ำแบบย้อนกลับ เราจะเพิ่มเลเยอร์ของโครงข่ายประสาทเทียมของเราจริง ๆ ตั้งแต่เวลา 0 โครงข่ายประสาทเทียมของเราจะดำดิ่งลงลึกขึ้นเรื่อย ๆ - เมื่อถึงเวลา 100 โครงข่ายประสาทเทียมของเราจะลึก 100 ด้วย เนื่องจากข้อผิดพลาดแพร่กระจายไปในทิศทางตรงกันข้ามจึงกระจายไปทั่วเครือข่ายของเราและจางหายไป ดังนั้นโครงข่ายประสาทเทียมของเราจึงเรียนรู้ได้ไม่ดีนัก เนื่องจากทุกครั้งที่มีการคูณด้วยค่าสัมประสิทธิ์บางอย่าง และข้อผิดพลาดของเราจะค่อยๆ จางหายไป

เพื่อกำจัดการสลายตัวของการไล่ระดับสีนี้ ในปี 1997 นักวิจัย Jurgen Schmidhuber เสนอให้แทนที่เซลล์ประสาทหนึ่งเซลล์ด้วยเครือข่ายย่อยของเซลล์ประสาทห้าเซลล์ นั่นคือตอนนี้เลเยอร์โครงข่ายประสาทเทียมประกอบด้วย "หน่วย" มาจำลองเซลล์หน่วยความจำกันเถอะ เรามีค่าบางค่าที่เก็บไว้ในเซลล์นี้ มีเซลล์ประสาทที่สามารถควบคุมความจริงที่ว่าเราสามารถเขียนบางสิ่งลงในเซลล์หน่วยความจำนี้ อ่านบางสิ่งจากเซลล์นั้นและนำมันออกมา ในกรณีนี้ การควบคุมเซลล์จะดำเนินการทีละชุดโดยเซลล์ประสาทของตัวเอง น้ำหนักของเซลล์ประสาทเหล่านี้ได้รับการฝึกฝนเช่นกัน - และนี่คือความงามทั้งหมดของสถาปัตยกรรมที่เป็นผล เมื่อเราสร้างโครงข่ายประสาทเทียมขนาดใหญ่จากเซลล์เหล่านี้ พวกเขาทั้งหมดจะได้รับการฝึกโดยใช้อัลกอริธึมการแพร่กระจายกลับ นั่นคือ อัลกอริทึมของเรายังคงเหมือนเดิม แม้ว่าเครือข่ายของเราจะซับซ้อนขึ้นมาก

ทำให้สามารถสร้างระบบการแปลภาษาด้วยคอมพิวเตอร์ได้ เมื่อหนึ่งปีที่แล้ว Google ได้เปลี่ยนระบบการแปลภาษาด้วยเครื่องเก่าด้วยโครงข่ายประสาทเทียมที่ดีกว่ามาก เมื่อเทียบกับเวอร์ชันแปลภาษาด้วยเครื่องของ Google ปี 2015 เวอร์ชันเก่า การแปลโดยมนุษย์ได้รับคะแนนที่สูงกว่ามาก แต่เมื่อเทียบกับอัลกอริธึมโครงข่ายประสาทเทียมแบบใหม่ของ Google ที่ใช้อยู่ในปัจจุบัน คะแนนการแปลโดยมนุษย์นั้นเทียบเคียงได้ อันที่จริง คุณใช้การแปลทุกวัน เมื่อคุณให้คะแนนบางอย่างในการค้นหา สัญญาณที่สำคัญที่สุดอันดับสองและสามในแง่ของทรัพยากรที่คุณได้รับในผลการค้นหาในหน้าแรกจะถูกกำหนดโดยโครงข่ายประสาทเทียมด้วย ตัวแทนของ Google แสดงกราฟที่โครงการภายในใช้โครงข่ายประสาทเทียมและการเรียนรู้เชิงลึกทุกปี หากในปี 2555 มีหนึ่งหรือสองโครงการ วันนี้มีประมาณ 5,000 โครงการอันที่จริง โครงข่ายประสาทเทียมเป็นเทคโนโลยีที่คุณใช้ทุกวัน แม้ว่าคุณจะไม่สงสัยเลยก็ตาม บางคนที่ทำสิ่งนี้ได้ประกาศว่าโครงข่ายประสาทเทียมและปัญญาประดิษฐ์เป็นไฟฟ้าใหม่ ในแง่ที่ว่านี่คือเทคโนโลยีที่เราใช้โดยไม่สังเกตแต่ได้เข้ามาในชีวิตเราอย่างแน่นหนา

เราสามารถบรรลุผลอะไรกับโครงข่ายประสาทที่เกิดขึ้นอีกเหล่านี้? ฉันจะแสดงผลลัพธ์ที่ทำให้ฉันประหลาดใจ ถ้ามีคนบอกฉันหนึ่งเดือนก่อนหน้าว่าสิ่งนี้เป็นไปได้ และนั่นเป็นช่วงฤดูร้อนปี 2015 ฉันจะตอบว่า ฉันทำงานเกี่ยวกับโครงข่ายประสาทมาสิบปีแล้ว ฉันไม่จำเป็นต้องเล่าเรื่องในเทพนิยาย แต่เมื่อเรานำโครงข่ายประสาทมาเอง ฝึกมัน และเห็นผลที่ได้รับ เราจึงมั่นใจว่าเป็นกรณีนี้จริงๆ เราแก้ปัญหาการสร้างแบบจำลองภาษา อย่างเป็นทางการ นี่คืองานของการทำนายสัญลักษณ์ถัดไป ตัวอย่างเช่น เรามีข้อความมากมายโดยดอสโตเยฟสกี เราป้อนเครือข่ายประสาทของเรา 100 อักขระ (ตัวอักษร รวมทั้งการเว้นวรรคและเครื่องหมายวรรคตอน) จากผลงานของดอสโตเยฟสกี และหน้าที่ของมันคือทำนายอักขระตัวต่อไป เราสามารถนำสัญลักษณ์นี้ไปใช้กับอินพุตอีกครั้งและคาดเดาอันถัดไปได้ เป็นต้น แต่เราไม่ต้องการทดลองกับดอสโตเยฟสกี ดังนั้นเราจึงนำคำบรรยายสำหรับซีรีส์นี้ ประมาณ 10 ล้านคำจาก The Vampire Chronicles และเรื่องอื่นๆ จากเนื้อหานี้ เครือข่ายเรียนรู้ที่จะทำนายสัญลักษณ์ต่อไปนี้

ภารกิจคือ: มี 100 อักขระ คุณต้องทำนาย 101 เราโพสต์อินเทอร์เฟซบนอินเทอร์เน็ตซึ่งคุณสามารถพิมพ์วลีเริ่มต้น และโครงข่ายประสาทเทียมพยายามดำเนินการต่อ ฉันได้เลือกผลลัพธ์ที่น่าสนใจที่สุด ผู้ชายคนนั้นเขียนว่า: "คุณโง่" นั่นคือตัวอักษรเหล่านี้ทั้งหมดช่องว่างระหว่าง "s" และ "g" เช่นเดียวกับการป้อนบรรทัดจะถูกป้อนเข้าสู่อินพุตของโครงข่ายประสาทเทียม และเธอทำนายสัญลักษณ์ต่อไป: "K" นั้นใหญ่ เราป้อน "K" นี้เป็นอินพุต โดยจะคาดคะเนอักขระถัดไป "a" เราป้อน "a" เป็นอินพุต ฯลฯ - ด้วยเหตุนี้เราจึงได้วลีที่สร้างขึ้น: "สวัสดี" เป็นอย่างไร เมื่อเราวิเคราะห์คำตอบนี้ มันดูสมเหตุสมผลอย่างยิ่ง นอกจากนี้ยังมีคุณสมบัติ: ทำไมโครงข่ายประสาทเทียมถึงทักทาย? หากนี่คือจุดเริ่มต้นของบทสนทนา ก็มีเหตุผลที่พวกเขาจะไม่ขึ้นต้นด้วยวลี "คุณโง่" ดังนั้นโครงข่ายประสาทเทียมกล่าวว่า: "สวัสดี" และคำว่า "สวัสดี" ถูกยกมาทำให้ชัดเจนว่าคำนี้ไม่ได้หมายถึงตัวเอง ดังนั้นแม้ว่าโครงข่ายประสาทเทียมของเราจะไม่มีปริญญาด้านภาษาศาสตร์ แต่ก็มีความรู้ภาษารัสเซียอย่างลึกซึ้ง

ตัวอย่างอื่น. ฉันพยายามกำหนดบริบทที่ซับซ้อนมากขึ้นเพื่อให้โครงข่ายประสาทเทียมตอบได้ยาก ถาม: ช่างเป็นค่ำคืนที่วิเศษจริงๆ มันไม่ได้เป็น?" เป็นลำดับอักขระที่ค่อนข้างยาว สองประโยค ช่องว่างมากมาย เครื่องหมายคำถาม นี่คือคำตอบของเธอ: “คุณคิดว่าฉันจะจำสิ่งนี้ได้จริงหรือ” ที่นี่ไม่มีอะไรเกี่ยวกับตอนเย็น คำตอบคือคำถามสำหรับคำถาม แต่ถ้าเราพยายามตีความ มันก็สมเหตุสมผลดี นั่นคือถ้าตอนเย็นวิเศษก็เข้าใจว่าคนที่บอกเรื่องนี้จะต้องการจดจำ ดังนั้นคำตอบของโครงข่ายประสาทเทียม และแยกจากกันว่าเธอ (โครงข่ายประสาทเทียม - "b") ยังใส่เครื่องหมายวรรคตอนอย่างถูกต้องและไม่ทำผิดพลาดในคำพูด และแม้ว่าเราจะไม่ได้ใส่กฎของภาษารัสเซีย พจนานุกรมของคำ ไม่มีพื้นฐานทางไวยกรณ์ เราให้โครงข่ายประสาทเทียมเพียงลำดับของอักขระเท่านั้น สำหรับฉันดูเหมือนว่าในสภาพเช่นนี้การออกคำตอบดังกล่าวเป็นเพียงปรากฏการณ์ที่น่าอัศจรรย์ ฉันยังสงสัยว่าเธอจะสร้างสิ่งนี้ได้อย่างไร

อีกหนึ่งตัวอย่าง มีบทสนทนาที่มีชีวิตชีวาเกิดขึ้นที่นี่ ผู้ชาย: "คุณมันโง่" เครื่องจักร: "แล้วทำไมคุณถึงสนใจ?" ผู้ชาย: “เพราะผมต้องอยู่กับคุณ!” แมชชีน: "คุณไม่ได้เป็นเช่นนั้นเลย!" ผู้ชาย: "คุณโกรธเคือง?" รถ: “เอ่อ..” ให้ฉันแสดงตัวอย่างงานของเธออีกตัวอย่างหนึ่ง มนุษย์: "มันตลก แต่คุณเป็นแค่โปรแกรม และคุณจะไม่มีวันคิดได้" เครื่องจักร: "แน่นอน ประเด็นคือตอนนี้ไม่ใช่เวลาที่ดีที่สุด" ทุกอย่างสมเหตุสมผลใช่ไหม แต่นี่คือการตีความของคุณ เราไม่รู้ว่าโครงข่ายประสาทเทียมหมายถึงอะไร ทั้งหมดมาจากซีรีส์

และตอนนี้ - เกี่ยวกับความหลากหลายที่โครงข่ายประสาทเทียมสร้างขึ้น โดยหลักการแล้ว โครงข่ายประสาทเทียมนี้เป็นรูปแบบข้อความความน่าจะเป็น มันให้ความน่าจะเป็นของอักขระตัวถัดไป แต่ไม่ใช่ว่าอักขระตัวต่อไปจะเป็นอย่างไร และเราสามารถเลือกตามความน่าจะเป็นนี้ได้ ด้วยวิธีนี้ เราสามารถสร้างลำดับต่างๆ ได้ ในกรณีหนึ่ง เราจะเลือกตัวอักษรหนึ่งตัวสำหรับข้อมูลเดียวกัน ในอีกกรณีหนึ่ง อีกตัวหนึ่ง . เราส่งประโยคไปที่อินพุต: "ตอนนี้อลิซมีความสุขแล้ว"และเราขอให้โครงข่ายประสาทดำเนินต่อไป คาดการณ์ว่าลำดับนี้จะดำเนินต่อไปอย่างไร ทุกๆที่ความต่อเนื่องเริ่มต้นด้วยคำว่า "เธอ" นั่นคือโครงข่ายประสาทตามที่เป็นอยู่ซึ่งจับสิ่งที่อยู่ที่นี่เกี่ยวกับอลิซและ "ความสุข" เพศของเรื่องที่เป็นปัญหา มีบางอย่างในคำตอบบางอย่างที่สัมพันธ์กับการที่เธอมีความสุข ตัวอย่างเช่น: "เธอดูดีมาก" หรือเธออยู่ในคอนเสิร์ต เธอจึงมีความสุข ไม่ว่าเธอจะสวยหรือเธอกำลังมีความรัก ดังนั้นเธอจึงมีความสุข หรือ "เธอกำลังตกอยู่ในอันตราย" เห็นได้ชัดว่าคนที่มีความสุขมักจะตกอยู่ในสถานการณ์อันตรายมากกว่าคนที่ไม่มีความสุข เราสามารถสรุปได้เช่นนั้น หรือตัวอย่างเช่น: "อลิซกำลังมีปัญหา" ที่นี่เราเห็นว่าน้ำเสียงเปลี่ยนไปแล้ว: “แต่เธอไม่รู้ว่าคุณเป็นใคร” หรือ “แต่เธอเปลี่ยนชีวิตของเธอ” หรือ “เธอจะไม่ฆ่าใครเลย” เมื่อเธอมีปัญหา มีบางอย่างรบกวนคำตอบอยู่แล้ว บันทึกเหล่านี้มาจากไหนเราไม่รู้ นั่นคือด้วยเหตุผลบางอย่าง โครงข่ายประสาทเทียมได้แทรกบันทึกย่อเหล่านี้ จากคำบรรยาย มีเครื่องหมายหมายเหตุ

แต่เห็นได้ชัดว่าคำบรรยายยังคงเกี่ยวกับผู้หญิงมากกว่า เพราะเธอตอบเมล็ดพันธุ์ของผู้หญิงอย่างมีความหมายมากกว่า และน่าจะมีสถิติไม่เพียงพอสำหรับผู้ชาย จอห์นมีความสุขในขณะนี้ - "ใช่ ที่สนามแต่ละแห่ง 800 ปอนด์", "อาชญากรรมนับพันองศาในการแข่งขัน", "ตั้งใจจะให้ตัวเองโยนทุกอย่างเข้าที่จริงๆ" นั่นคือความหมายของคำตอบได้รับความเดือดร้อนอย่างมากแม้ว่าข้อเสนอจะคล้ายคลึงกันในขั้นต้น แต่ “จอห์นเจอปัญหา” ยากจริงๆ: “พวกหมูกำลังจะไปสตาร์ลิงค์ซิตี้”, “และเมื่อเขากลับมา ผมก็โยนมันเข้าไปในออฟฟิศ”, “เขาไม่เหมือนเดิมเมื่อปีที่แล้ว”, “เหนือธรรมชาติ” เกียรติของท่านไม่ใช่เรา”

ไม่รู้ว่าประทับใจขนาดไหน ประทับใจมาก การคาดคะเนของฉันอาจเป็นได้ว่าโครงข่ายประสาทเทียมสามารถเรียนรู้คำศัพท์ห้าตัวอักษรและเล่นตามลำดับแบบสุ่ม แต่ภายใต้การคาดการณ์ว่าเธอจะสามารถสร้างวลีที่ยาวเหยียดโดยไม่มีข้อผิดพลาดที่สามารถตีความได้อย่างมีความหมาย ฉันจะบอกตรงๆ ว่าไม่เคยสมัครรับข้อมูล

ให้ฉันพูดอย่างรวดเร็วเกี่ยวกับสิ่งที่ทุกคนกังวลเมื่อเร็ว ๆ นี้ การเรียนรู้การเสริมแรงโครงข่ายประสาทเทียม นี่เป็นแนวทางที่จำเป็นในการเรียนรู้การดำเนินการบางอย่างจากตัวแทน การกระทำแต่ละอย่างของเอเจนต์จะเปลี่ยนสภาพแวดล้อม ในงานก่อนหน้านี้ เราคาดการณ์ไว้ แต่ไม่ได้มีอิทธิพลต่องานเอง เราไม่ได้มีอิทธิพลในทางใด ๆ ต่อภาพที่เราจัดประเภท เราไม่ได้มีอิทธิพลต่อลำดับที่เราสร้างขึ้นในทางใดทางหนึ่ง และงานของเราถูกกำหนดไว้ดังนี้: เราต้องการมีอิทธิพลต่อข้อมูลที่เรามีเพื่อนำไปสู่สถานะเป้าหมายที่เราต้องการ ตัวแทนเป็นวิชาบางอย่างที่อาจส่งผลต่อสิ่งแวดล้อม เราไม่ทราบวิธีแก้ปัญหาการฝึกอบรมตัวแทนนี้ แต่เรารู้ว่าอะไรดีอะไรไม่ดี ดังนั้น ในช่วงเวลาเหล่านั้นเมื่อตัวแทนบรรลุเป้าหมายที่เราตั้งไว้ต่อหน้าเขา เราสามารถให้จำนวนหนึ่งแก่เขาได้ ซึ่งเราเรียกว่ารางวัลหรือการเสริมกำลัง ดังนั้น เราจำเป็นต้องได้รับอัลกอริทึมที่จะเรียนรู้ การกระทำดังกล่าวตามลำดับและโดยรางวัล ซึ่งจะทำให้รางวัลสูงสุดในสถานการณ์ที่กำหนด

ในปี 2559 บทความได้รับการตีพิมพ์ในวารสาร Nature ซึ่งอธิบายอัลกอริธึมที่เป็นสากลซึ่งได้รับการสอนให้เล่นเกม Atari และได้ขึ้นปกนิตยสาร Nature ถ้าคุณรู้ว่าธรรมชาติเป็นสัปดาห์ที่ได้รับการยอมรับและมีชื่อเสียงมากที่สุดแห่งหนึ่งในโลกของวิทยาศาสตร์ที่ตีพิมพ์บทความทางวิทยาศาสตร์อย่างแท้จริง หากคุณตีพิมพ์บทความใน Nature อำนาจของคุณในหมู่นักวิทยาศาสตร์จะเพิ่มขึ้นอย่างมาก แน่นอนว่ามีข้อยกเว้น แต่โดยพื้นฐานแล้ว ผลงานที่สำคัญมากจากมุมมองของวิทยาศาสตร์ถูกตีพิมพ์ที่นั่น กำหนดงานอย่างไร? เรามีเกมอาตาริ 49 เกม เราป้อนรูปภาพจากเกมเหล่านี้ไปยังอินพุตของโครงข่ายประสาทเทียมของเรา แต่ไม่ได้อธิบายกฎใดๆ ทั้งสิ้น เราจะเรียนรู้โครงข่ายประสาทเดียวกันในเกมต่างๆ และต้องการให้มันเรียนรู้ได้ดีในทุกเกม แต่มีโครงข่ายประสาทเพียงเส้นเดียว และปรับให้เข้ากับเกมเฉพาะในกระบวนการเรียนรู้เท่านั้น เราไม่พรีออเดอร์อะไรเลย

ดังนั้นเราจึงมีภาพที่เข้าสู่เครือข่ายประสาทของเรา แต่คุณทุกคนรู้ว่าเครือข่ายแบบหมุนวนคืออะไร - ฉันบอกคุณเมื่อครึ่งชั่วโมงที่แล้ว Convolutional neural network จะแปลงรูปภาพ แยกคุณลักษณะ และที่เอาต์พุตของโครงข่ายประสาทเทียม จะออกการดำเนินการที่ควบคุมจอยสติ๊ก ดังนั้นคำสั่งจากจอยสติ๊กจะถูกส่งไปยังเครื่องจำลองเกมและควบคุมพฤติกรรมของเกม เมื่อคุณได้คะแนน ตัวแทนของคุณจะได้รับการเสริมกำลัง และหน้าที่ของตัวแทนคือการเพิ่มคะแนนเหล่านั้น นั่นคือเราไม่ได้บอกเขาโดยตรงว่าจะเลือกการกระทำอะไร แต่ในขณะที่เขาเพิ่มคะแนนเราบอกว่านี่เป็นสิ่งที่ดี และภารกิจคือการฝึกอัลกอริธึมนี้ ตัวอย่างเช่น โครงข่ายประสาทเทียมควบคุมเรือดำน้ำ ภารกิจ: ปลา - ทำลาย นักดำน้ำ - หยิบและเป็นครั้งคราวเมื่อออกซิเจนหมด ลอยขึ้นและเติมออกซิเจน โครงข่ายประสาทเทียมไม่ประสบความสำเร็จเสมอไป บางครั้งมันก็ตาย แต่ปรากฎว่าผลลัพธ์นี้ไม่เพียงแต่พบการรู้จำทางวิทยาศาสตร์และขึ้นปก Nature เท่านั้น แต่ยังได้รับจากการเริ่มต้นใช้งาน และเมื่อสองสามเดือนก่อนเผยแพร่ Google ได้ซื้อสตาร์ทอัพนี้ ในเวลาเดียวกัน จากผลลัพธ์ของการเริ่มต้นครั้งนี้ มีเพียงสิ่งที่พวกเขาตีพิมพ์ในวารสาร Nature คุณคิดว่า Google ซื้อสตาร์ทอัพนี้มาเพื่อเงินเท่าไหร่? สำหรับ 600 ล้าน

คำถามต่อไป. อะไรที่เชื่อมโยง Garry Kasparov และ Lee Sedol แชมป์โก ​​(เกม.-"ข")? ใช่ไหม. พวกเขาทั้งคู่พ่ายแพ้ต่อปัญญาประดิษฐ์ DeepBlue เอาชนะ Kasparov ในปี 1997 และแชมป์ Go พ่ายแพ้เมื่อปีที่แล้ว ทำไมถึงเป็นอย่างนั้น? จนกระทั่งเมื่อไม่นานนี้ Go ถูกมองว่าเป็นเกมที่ยากมาก นี่เป็นเพราะจำนวนตัวเลือกที่ต้องแยกออกเพื่อคำนวณผลลัพธ์ที่เป็นไปได้ทั้งหมดของเกม และอธิบายโดยปัจจัยการแยกสาขาที่เรียกว่า นั่นคือจำนวนสถานะเกมที่เป็นไปได้ที่เราสามารถเปลี่ยนจากสถานะเกมปัจจุบันโดยดำเนินการที่อนุญาตในเกม สำหรับหมากรุก ตัวประกอบการแตกแขนงเฉลี่ยอยู่ที่ประมาณ 35 และใน Go ตัวประกอบการแตกแขนงนี้คือ 250 ดังนั้น คุณคงเข้าใจว่าเมื่อเราลงลึกลงไป เราจะคูณด้วยตัวเลขนี้ทุกครั้ง และเป็นที่แน่ชัดว่าในทันที เราได้รับตัวเลือกจำนวนมากอย่างรวดเร็ว ซึ่งเกินจำนวนอนุภาคในจักรวาลที่สังเกตได้ และไม่สามารถแจกแจงพวกมันได้ จำเป็นต้องมีวิธีอื่นในการแก้ปัญหานี้ หากในหมากรุกเราสามารถคำนวณตัวเลือกสำหรับตำแหน่งจำนวนมากและรู้การเคลื่อนไหวที่ต้องทำเพื่อที่จะชนะหรือไม่แพ้อย่างโง่เขลา ใน Go นั้นยากกว่ามาก หลายคนบอกว่าคุณต้องมีสัญชาตญาณเพื่อรับรู้ทุกสถานการณ์

การเริ่มต้นแบบเดียวกันกับที่ซื้อด้วยเงิน 600 ล้านดอลลาร์ปรากฏขึ้นอีกครั้งบนหน้าปกของ Nature ในอีกหนึ่งปีต่อมา ตอนนี้เขาเสนออัลกอริธึมที่เมื่อดูที่กระดานแล้วสามารถประเมินได้ว่าตำแหน่งนี้ดีแค่ไหน กล่าวคือ คาดการณ์ได้เร็วพอ คุณสามารถรวมการคาดคะเนนี้กับอัลกอริธึมการค้นหาแบบต้นไม้ และใช้โครงข่ายประสาทเทียมเพื่อประเมินตำแหน่งและเปิดเผยเฉพาะตำแหน่งที่ชนะมากที่สุด ดังนั้นคุณไม่ได้ทำการค้นหาอย่างสมบูรณ์ แต่อยู่ใต้ต้นไม้ที่มีแนวโน้มมากที่สุดในขณะนี้ อัลกอริทึมนี้เป็นเวอร์ชันของ AlphaGo (เวอร์ชัน AlphaGo Fan ได้รับการเผยแพร่ในบทความ) - และเอาชนะ Lee Sedol ใน Go ในตอนนั้น โปรแกรม Go เล่นในระดับมือสมัครเล่นที่ดี แต่ไม่ใช่มืออาชีพ ในการฝึกเวอร์ชันนี้ ต้องใช้ GPU 176 ตัวในคลัสเตอร์แบบกระจาย และเธอเอาชนะแชมป์ยุโรปด้วยคะแนน 5:0

จากนั้นโปรแกรมเวอร์ชันดัดแปลงก็ปรากฏขึ้น - AlphaGoLee เธอใช้หน่วยประมวลผลเทนเซอร์ 48 ชิ้น ซึ่งเป็นประเภทของ TPU แต่ได้รับการดัดแปลงเป็นพิเศษสำหรับโครงข่ายประสาทเทียม เธอเอาชนะลี เซดอล 4-1 จากนั้นก็มี AlphaGoMaster บน 4 TPU ซึ่งเอาชนะผู้เล่นมืออาชีพด้วยคะแนน 60:0 แท้จริงหนึ่งเดือนที่ผ่านมาโปรแกรม AlphaGoZero ปรากฏขึ้นซึ่งใน 4 TPUs บนคอมพิวเตอร์หนึ่งเครื่อง (ไม่ใช่ในคลัสเตอร์อีกต่อไป) เอาชนะเวอร์ชันของโปรแกรมที่เอาชนะ Lee Sedol ด้วยคะแนน 100:0 และด้วยคะแนน 89:11 - เวอร์ชันของ AlphaGoMaster เวอร์ชันถัดไปเผยแพร่เมื่อไม่กี่วันก่อน - AlphaZero อีกครั้ง เธอเล่นกับ AlphaGoZero บน TPU สี่ตัวด้วยคะแนน 60:40 โปรแกรม AlphaGoLee เวอร์ชันแรกได้รับการฝึกฝนเกี่ยวกับเกมจริงเป็นครั้งแรก นั่นคือฐานข้อมูลของเกมถูกนำมาใช้และโปรแกรมเรียนรู้ที่จะเล่นเหมือนคนในนั้น แต่โปรแกรม AlphaGoZero และ AlphaZero - ทำไมต้องเป็นศูนย์ เพราะพวกเขาไม่ได้ใช้ข้อมูลใด ๆ จากบุคคลเลย พวกเขาเรียนรู้ได้อย่างไร? พวกเขาแค่เล่นกับตัวเองและเรียนรู้จากเกมของพวกเขา และได้รับการฝึกฝนมาอย่างดี

ตอนนี้มีคำถาม ทำไม Google ถึงซื้อสิ่งนี้ เธอใช้อัลกอริธึมนี้ ซึ่งใช้สำหรับเกม และนำไปใช้กับปัญหาในการควบคุมการระบายความร้อนของศูนย์ข้อมูล ตอนนี้ ในขณะที่การควบคุมโครงข่ายประสาทเทียมเปิดอยู่ ปริมาณการใช้จะลดลง เมื่อปิด มันจะกลับสู่ระดับเดิม โดยเฉลี่ยแล้วประหยัดได้ประมาณ 40% Google มีศูนย์ข้อมูลจำนวนมากเพื่อให้มั่นใจในคุณภาพของบริการ และสำหรับศูนย์ข้อมูลดังกล่าวเพื่อประหยัดไฟฟ้า 40% และสำหรับศูนย์ข้อมูล โดยทั่วไปแล้ว ไฟฟ้าถือเป็นรายการต้นทุนหลัก ซึ่งสำคัญมาก ฉันไม่รู้ว่ามันจ่ายออกไปหรือไม่ แต่อย่างน้อยก็ส่วนสำคัญบางทีก็ได้รับการชดใช้คืน

ตลอดประวัติศาสตร์ของปัญญาประดิษฐ์นั้น ปัญญาประดิษฐ์มีขึ้นและลง และวันนี้เราอยู่ในจุดสูงสุดของการโฆษณาด้านปัญญาประดิษฐ์แบบใหม่ ซึ่งทุกคนเชื่อว่าปัญญาประดิษฐ์คือ "ไฟฟ้าใหม่" เป็นต้น บางทีความตื่นเต้นนี้อาจบรรเทาลงในไม่ช้า แต่ตอนนี้คือจุดสูงสุด ทำไมคนในห้องนี้เยอะจัง ส่วนใหญ่ไม่รู้ว่า deep learning คืออะไร แต่ก็ยังมาอีก เห็นได้ชัดว่าหัวข้อนี้มาจากส่วนอื่นของชีวิตและดึงดูดผู้คนที่นี่ ความสนใจสูงสุดเกิดจากการที่อัลกอริธึมโครงข่ายประสาทที่รู้จักกันมาช้านาน เนื่องมาจากบิ๊กดาต้าและความสามารถในการคำนวณขนาดใหญ่ ได้เริ่มแก้ปัญหาเหล่านั้นที่ไม่สามารถแก้ไขได้มาก่อน และให้ผลลัพธ์ที่น่าสนใจมากที่สามารถนำไปปฏิบัติได้ในหลายด้าน ของเศรษฐกิจ

ดังนั้นสิ่งที่เราทำในพื้นที่นี้? ในห้องปฏิบัติการของเรา เรากำลังดำเนินโครงการที่สนับสนุนโดย National Technology Initiative ซึ่งเป็นความคิดริเริ่มของประธานของเราที่พยายามเปลี่ยนบางส่วนของเศรษฐกิจของเราจากวัตถุดิบไปสู่เทคโนโลยีชั้นสูง ด้านหนึ่งความคิดริเริ่มนี้เชื่อมโยงกับการสนับสนุนจากธุรกิจที่เป็นนวัตกรรม และในทางกลับกัน กับโครงสร้างพื้นฐานสำหรับธุรกิจที่เป็นนวัตกรรมใหม่เหล่านี้ ดังนั้น ภายใต้กรอบของความคิดริเริ่มด้านเทคโนโลยีระดับชาตินี้ Phystech ซึ่งได้รับการสนับสนุนทางการเงินจาก Sberbank กำลังดำเนินโครงการ และเป้าหมายของโครงการคือการพัฒนาอัลกอริธึมสำหรับการเรียนรู้ของเครื่องลึกและความฉลาดของเครื่องจักรในรูปแบบของแพลตฟอร์มเทคโนโลยีบางอย่างสำหรับการดำเนินการสนทนาเป้าหมายกับผู้ใช้โดยอัตโนมัติ

วันนี้ เรามีสาขาวิชาเศรษฐศาสตร์ทั้งหมดที่เกี่ยวข้องกับการสื่อสารด้วยข้อความผู้คนใช้อุปกรณ์มือถือและจำนวนผู้ใช้ Messenger บนแพลตฟอร์มมือถือมีเกินจำนวนผู้ใช้โซเชียลมีเดียแล้ว ซึ่งหมายความว่าผู้คนจำนวนมากในการสื่อสารดำเนินการในรูปแบบข้อความ แต่ในขณะเดียวกัน ไม่มีเครื่องมือที่ดีสำหรับบริษัทที่จะสื่อสารกับผู้ใช้ในโลกนี้มีคำขอจำนวนมากสำหรับการแก้ปัญหา เมื่อบริษัทสามารถติดต่อคุณได้ ช่วยเหลือคุณหรือแก้ปัญหาบางอย่างผ่านการแชท ในทางกลับกัน โซลูชันเหล่านั้นสำหรับการสร้างระบบการสนทนาที่มีอยู่จนกระทั่งเมื่อเร็วๆ นี้ไม่ได้ผลมากนัก เพราะพวกเขาอิงจากสคริปต์โค้ดบางตัวที่โปรแกรมเมอร์ให้มา และสคริปท์เหล่านี้ตามที่ปรากฏ มีขนาดไม่ดีและไม่สามารถอธิบายได้ ความหลากหลายของชีวิตการสนทนาของเรา ต่างคนต่างแสดงความคิดต่างกัน มีสถานการณ์ต่างกัน และทั้งหมดนี้เป็นเรื่องยากมากที่จะรับรู้และคาดการณ์ล่วงหน้า แต่ดังที่เราได้เห็น โครงข่ายประสาทเทียมจัดการกับความไม่แน่นอนดังกล่าวได้ดีมาก พวกเขาสามารถสร้างการตอบสนองที่คล้ายกับการตอบสนองของมนุษย์ พวกเขาสามารถแปลเครื่องได้ ดังนั้นจึงมีความหวังว่าเราจะสามารถใช้เทคโนโลยีโครงข่ายประสาทเทียมเพื่อแก้ปัญหาบางอย่างในการสร้างอินเทอร์เฟซการสนทนาเป็นอย่างน้อย

ดังนั้น เป้าหมายของโครงการนี้คือการสร้างแพลตฟอร์มแบบเปิดที่บริษัทต่างๆ สามารถใช้เพื่อสร้างผลิตภัณฑ์ในพื้นที่นี้ได้ นั่นคือ เราสร้างเทคโนโลยี มอบให้กับบริษัทต่างๆ และพูดว่า: "เราจะสนับสนุนคุณ เราจะช่วยให้คุณใช้เทคโนโลยีนี้ และคุณ ได้โปรด ทำธุรกิจของคุณและมีส่วนร่วมในเศรษฐกิจ" ใครคือผู้มีส่วนได้ส่วนเสียในโครงการของเรา? จากมุมมองของ NTI บริษัทเหล่านี้เป็นบริษัทในตลาดที่มีเทคโนโลยีสูง ตัวอย่างเช่น Sberbank ซึ่งต้องการใช้เทคโนโลยีนี้เป็นพื้นฐานในการสร้างโซลูชันสำหรับบริการบางอย่างโดยอัตโนมัติ เช่น ศูนย์บริการทางโทรศัพท์หรือบริการสนับสนุน นี่คือ Phystech ซึ่งมีความสนใจในการพัฒนาความสามารถด้านปัญญาประดิษฐ์ในตัวเอง เป็นนักวิจัยและนักพัฒนาที่ต้องการเครื่องมือในการสร้างตัวแทนการสนทนาที่ชาญฉลาดเหล่านี้อย่างรวดเร็ว

เราเริ่มโครงการนี้ในฤดูร้อนนี้และตั้งชื่อว่า iPavlov เพื่อเป็นเกียรติแก่ Ivan Petrovich Pavlov นักประสาทวิทยาชาวรัสเซียผู้โด่งดังที่ศึกษาปฏิกิริยาตอบสนองแบบมีเงื่อนไข นั่นก็คือสมอง ดังนั้น ผลลัพธ์หลักสองประการของกิจกรรมของเราในแง่ของเทคโนโลยีคือ ห้องสมุดเปิด ซึ่งเราเรียกว่า DeepPavlov และนี่เป็นเพียงชุดเครื่องมือสำหรับการสร้างระบบโต้ตอบ เช่นเดียวกับชุดบริการ Sberbank ที่พวกเขาจะรวมเข้ากับ ผลิตภัณฑ์บางอย่าง เช่น ผู้ช่วยด้านการเงิน เรามีการวิจัย เรามีการพัฒนาห้องสมุดของเรา มีแอปพลิเคชันของห้องสมุดนี้สำหรับกรณีธุรกิจเฉพาะบางกรณี เราต้องการทำอะไร? เราต้องการสร้างชุดบล็อกโครงข่ายประสาทเทียม ซึ่งเราสามารถรวบรวมตัวแทนต่างๆ สำหรับงานที่แตกต่างกัน ตัวอย่างเช่น ตัวแทนที่สามารถทำงานเฉพาะ เช่น จองตั๋ว หรือตัวแทนที่สามารถตอบคำถามในหัวข้อใดหัวข้อหนึ่ง หรือตัวแทนที่สามารถสนทนาต่อไปได้ จากนั้นจึงนำสารเหล่านี้มารวมกันสำหรับแต่ละพื้นที่เพื่อแก้ปัญหาได้อย่างเหมาะสมที่สุด นี่คือวิธีที่เราวางแผนที่จะนำสถาปัตยกรรมไปใช้ในแง่ของโครงข่ายประสาทเทียมและเนื้อหาเชิงสำรวจ และในด้านหนึ่ง ไลบรารีของเราประกอบด้วยส่วนประกอบสำหรับการสร้างบอทเหล่านี้ ในทางกลับกัน เรามีเครื่องมือ Bildert ซึ่งเราสามารถรวบรวมตัวแทนการสนทนาจากบอทเหล่านี้ มีตัวเชื่อมต่อที่เชื่อมต่อเรากับผู้ส่งสาร และมีข้อมูลที่เราฝึกอบรม นั่นคือมันเป็นชุดเครื่องมือที่คุณสามารถพัฒนาและนำโซลูชันดังกล่าวไปใช้

อาจเป็นไปได้ว่าจะเสร็จสิ้น ขอบคุณทุกคน

Evgeniya Chernysheva


กุญแจสู่ความสำเร็จในการพัฒนาปัญญาประดิษฐ์คือประสาทวิทยาศาสตร์ นักวิทยาศาสตร์พยายามที่จะทำซ้ำการทำงานของสมองของมนุษย์ได้อย่างไรและอะไรคือลักษณะเฉพาะของการทำงานของโครงข่ายประสาทเทียม - ในเนื้อหา "นักอนาคต"

ประสาทชีววิทยาและปัญญาประดิษฐ์

“อนาคตของปัญญาประดิษฐ์อยู่ในประสาทวิทยาศาสตร์” ผู้ก่อตั้ง Google DeepMind, Ph.D. ในประสาท . กล่าว เดมิส ฮาสซาบีส (Demis Hassabis) ในบทความที่ตีพิมพ์ในวารสาร Neuron Khasabis เปิดตัว DeepMind บริษัท ในลอนดอนเพื่อสร้าง อะนาล็อกทางเทคนิคของความฉลาดของมนุษย์และในปี 2014 Google ซื้อบริษัทของเขาด้วยเงินกว่า 500 ล้านดอลลาร์ ปีที่แล้ว AlphaGo ซึ่งเป็นโปรแกรมที่พัฒนาโดย DeepMind เอาชนะแชมป์โลกในเกมตรรกะของ Go ร่วมกับ OpenAI สถาบันวิจัย AI ที่ไม่แสวงหากำไรสนับสนุนโดย อีลอน มัสก์ บริษัทยังทำงานเพื่อสร้างเครื่องจักรที่มีความสามารถทางปัญญาขั้นสูงขึ้นอีกด้วย

อัลกอริธึมปัญญาประดิษฐ์ของ DeepMind ทั้งหมดนั้นใช้แนวคิดที่ค้นพบครั้งแรกในสมองของเราเอง การเรียนรู้เชิงลึกและการเรียนรู้แบบเสริมกำลัง - สองเสาหลักของ AI สมัยใหม่ - เป็นผลมาจากการแปลแบบจำลองของการเชื่อมต่อทางประสาททางชีววิทยาของสมองมนุษย์เป็นภาษาของคณิตศาสตร์ที่เป็นทางการ การเรียนรู้อย่างลึกซึ้งอันที่จริงเป็นเพียงชื่อใหม่สำหรับแนวทางปัญญาประดิษฐ์ที่มีมานานกว่า 70 ปีแล้วและเรียกว่าโครงข่ายประสาทเทียม โครงข่ายประสาทเทียมถูกเสนอครั้งแรกในปี พ.ศ. 2487 Warren McCullough (วอร์เรน แมคคัลล็อก) และ วอลเตอร์ พิทส์ (วอลเตอร์ พิตต์) นักวิจัยสองคนจากมหาวิทยาลัยชิคาโก ซึ่งในปี ค.ศ. 1952 ได้ก่อตั้งสิ่งที่บางครั้งเรียกว่าภาควิชาวิทยาศาสตร์การรู้คิดแห่งแรก

โครงข่ายประสาทเทียมเป็นงานวิจัยหลักทั้งในด้านประสาทวิทยาและวิทยาการคอมพิวเตอร์จนถึงปี พ.ศ. 2512 แต่แล้วความสนใจในเครือข่ายเหล่านี้ก็หายไป ในช่วงทศวรรษ 1980 เทคโนโลยีเริ่มฟื้นคืนชีพ แต่กลับตกอยู่ในอุปราคาอีกครั้งในทศวรรษแรกของศตวรรษใหม่ และกลับมาเกือบจะในทันที ในช่วงที่สอง สาเหตุหลักมาจากพลังการประมวลผลที่เพิ่มขึ้นของชิปกราฟิก

ไดอะแกรมของอุปกรณ์โครงข่ายประสาทเทียม

คุณสมบัติของโครงข่ายประสาทเทียม

โครงข่ายประสาทเทียมเป็นเครื่องมือการเรียนรู้ของเครื่องที่คอมพิวเตอร์เรียนรู้การทำงานเฉพาะโดยการวิเคราะห์ตัวอย่างการฝึกอบรม ตามกฎแล้ว ตัวอย่างเหล่านี้จะติดป้ายกำกับไว้ล่วงหน้าด้วยตนเอง ตัวอย่างเช่น ระบบการจดจำวัตถุสามารถจัดเก็บภาพที่ติดแท็กของรถยนต์ บ้าน ถ้วย ฯลฯ ได้หลายพันภาพ และสามารถค้นหารูปแบบภาพและคุณลักษณะในรูปภาพเหล่านั้นเพื่อเชื่อมโยงกับแท็กเฉพาะ พูดง่ายๆ ก็คือ สิ่งที่เกิดขึ้นในเด็กก็เช่นเดียวกัน ตัวอย่างเช่น เด็กถูกแสดงวัตถุสีแดงต่างกัน เพื่อที่ในอนาคตเขาจะสามารถเชื่อมโยง "ป้ายกำกับ" นี้กับวัตถุสีแดงทั้งหมดได้อย่างอิสระ

อย่างไรก็ตาม เพื่อที่จะพัฒนาแม้แต่อะนาล็อกทางเทคนิคระยะไกลของการเชื่อมต่อของสมองของเรา จำเป็นต้องมีการสร้างกลไกที่ซับซ้อน โครงข่ายประสาทเทียมประกอบด้วยโหนดประมวลผลข้อมูลที่เรียบง่ายแต่เชื่อมต่อถึงกันอย่างแน่นหนาเป็นพันหรือล้านโหนด ซึ่งมักจะจัดเป็นชั้นๆ เครือข่ายประเภทต่างๆ แตกต่างกันไปตามจำนวนเลเยอร์ จำนวนการเชื่อมต่อระหว่างโหนด และจำนวนโหนดในแต่ละเลเยอร์ โครงข่ายประสาทเทียมสมัยใหม่ส่วนใหญ่จัดเป็นชั้นๆ ของโหนด ซึ่งข้อมูลจะเคลื่อนที่ไปในทิศทางเดียวเท่านั้น แต่ละโหนดสามารถเชื่อมต่อกับโหนดหลาย ๆ โหนดในเลเยอร์พื้นฐานที่โหนดรับข้อมูล และไปยังโหนดหลาย ๆ โหนดในเลเยอร์ด้านบนที่มันส่งข้อมูลไป


ตัวอย่างการฝึกอบรมเครือข่าย

สำหรับการเชื่อมต่อขาเข้าแต่ละครั้ง โหนดจะกำหนดตัวเลขที่เรียกว่า "น้ำหนัก" เมื่อเครือข่ายทำงาน โหนดจะได้รับข้อมูลอีกรายการหนึ่งจากพวกเขา อีกจำนวนหนึ่งแล้วคูณด้วยน้ำหนักที่ให้ไว้ แล้วบวกค่าที่ได้รับจากอินพุตทั้งหมดเข้าด้วยกัน ได้ตัวเลขหนึ่งตัว หากตัวเลขเกินเกณฑ์ โหนดจะ "เริ่มทำงาน" ซึ่งในโครงข่ายประสาทเทียมสมัยใหม่มักจะหมายถึงการส่งหมายเลข - ผลรวมของอินพุตที่ถ่วงน้ำหนัก - ในการเชื่อมต่อขาออกทั้งหมด

ในโหมดการฝึก น้ำหนักและขีดจำกัดของโครงข่ายประสาทเทียมในขั้นต้นจะถูกตั้งค่าเป็นค่าสุ่ม ข้อมูลการฝึกจะถูกป้อนเข้าสู่ชั้นล่าง - เลเยอร์อินพุต - และผ่านชั้นต่อมา คูณและเพิ่มจนกว่าจะถึงเลเยอร์เอาต์พุต ระหว่างการฝึก น้ำหนักและเกณฑ์จะปรับอย่างต่อเนื่องจนกว่าข้อมูลการฝึกที่มีป้ายกำกับเดียวกันจะให้ผลลัพธ์ที่ใกล้เคียงกัน

อนาคตอยู่ที่นี่แล้ว

ผลลัพธ์ที่น่าประทับใจของการปรับปรุงการทำงานของโครงข่ายประสาทเทียมและการแพร่กระจายของการใช้เทคโนโลยีไม่ได้จำกัดอยู่เพียงชัยชนะของการวิจัยในห้องปฏิบัติการของ AlphaGo และ AI หากคุณยังคงเชื่อมโยงวลี "เครื่องเรียนรู้ด้วยตนเอง" กับโลกแห่งนิยายวิทยาศาสตร์และความสยองขวัญเกี่ยวกับการจลาจลของหุ่นยนต์ ก็ยินดีต้อนรับสู่อนาคต

ในช่วงไม่กี่ปีที่ผ่านมา ระบบปัญญาประดิษฐ์ที่มีประสิทธิภาพสูงสุด ในด้านต่างๆ เช่น การขับขี่อัตโนมัติ การรู้จำคำพูด คอมพิวเตอร์วิทัศน์ และการแปลอัตโนมัติ ได้รับการพัฒนาขึ้นด้วยโครงข่ายประสาทเทียม เราอาจไม่ได้สังเกตมันด้วยตัวเอง แต่โครงข่ายประสาทเทียมที่เรียนรู้ด้วยตนเองนั้นฝังแน่นในชีวิตประจำวันของเราแล้ว ตัวอย่างเช่น การแปลที่เสนอให้คุณในฟีด Facebook จะไม่ดำเนินการโดยอัตโนมัติอีกต่อไปโดยการค้นหาแต่ละคำในพจนานุกรม ตอนนี้บริษัทได้เปิดตัวโครงข่ายประสาทเทียมที่แปลประโยคทั้งหมด ทำให้ข้อความมีความสอดคล้องกันมากขึ้นเรื่อยๆ ความแม่นยำของการแปลในโซเชียลเน็ตเวิร์กเพิ่มขึ้น 11% แล้ว


แบบจำลองเซลล์ประสาทถูกประมวลผลในแอปพลิเคชัน Prisma

คลื่นความสนใจในเทคโนโลยีของชาวรัสเซียที่แยกจากกันนั้นเกิดจากการปรากฏตัวของแอปพลิเคชั่น Prizma ซึ่งเปลี่ยนภาพถ่ายธรรมดาให้มีความคล้ายคลึงกันของงานศิลปะที่มีชื่อเสียง ไม่สำคัญหรอกว่าคุณจะใช้แอปพลิเคชั่นนี้หรือในทางกลับกัน รู้สึกงุนงงเกี่ยวกับการละเมิดโดยผู้ใช้โซเชียลเน็ตเวิร์ก - มันคุ้มค่าที่จะสังเกตความคิดสร้างสรรค์ของผู้สร้าง ลักษณะเฉพาะของเครื่องมือประมวลผลภาพที่ดูเหมือนธรรมดาคือโปรแกรมทำงานบนพื้นฐานของโครงข่ายประสาทเทียม โดยใช้รูปแบบของรูปแบบการวาดภาพต่างๆ เพื่อสร้าง "ผลงานชิ้นเอก" ใหม่

อย่างไรก็ตาม แม้แต่โครงข่ายประสาทเทียมแบบธรรมดาที่สุดก็ใช้หน่วยความจำจำนวนมากและใช้พลังงานจำนวนมาก ดังนั้น จึงมักจะทำงานบนเซิร์ฟเวอร์ในระบบคลาวด์ ซึ่งรับข้อมูลจากเดสก์ท็อปหรืออุปกรณ์พกพา แล้วส่งผลการวิเคราะห์กลับ .

เพื่อแก้ปัญหานี้ เมื่อปีที่แล้ว Vivienne Sze ผู้ช่วยศาสตราจารย์ด้านวิศวกรรมไฟฟ้าและวิทยาการคอมพิวเตอร์ที่สถาบันเทคโนโลยีแมสซาชูเซตส์ และเพื่อนร่วมงานของเธอได้แนะนำชิปคอมพิวเตอร์ตัวใหม่ที่ประหยัดพลังงานซึ่งปรับให้เหมาะสมสำหรับโครงข่ายประสาทเทียม ซึ่งอาจช่วยให้ระบบปัญญาประดิษฐ์อันทรงพลังทำงานในพื้นที่ได้ บนมือถือ. .

นอกจากนี้ พวกเขาได้พัฒนาวิธีการวิเคราะห์ที่สามารถกำหนดพลังงานที่โครงข่ายประสาทกินเมื่อใช้งานบนฮาร์ดแวร์บางประเภท จากนั้นจึงใช้เทคโนโลยีนี้ในการประเมินวิธีการใหม่ในการเลี่ยงผ่านเครือข่ายประสาทเทียม เพื่อให้สามารถทำงานบนอุปกรณ์พกพาได้อย่างมีประสิทธิภาพมากขึ้น

อย่างไรก็ตาม Hassabis โต้แย้งว่านี่ยังไม่เพียงพอ เป้าหมายที่นักวิจัยตั้งไว้ในขณะนี้คือการสร้าง AI สากลที่มีความสามารถในการคิด ให้เหตุผล และเรียนรู้ได้อย่างรวดเร็วและยืดหยุ่น ซึ่งเป็นปัญญาประดิษฐ์ที่สามารถเข้าใจโลกแห่งความจริงและจินตนาการถึงโลกที่ดีขึ้นได้

เพื่อให้บรรลุสิ่งนี้ จำเป็นต้องศึกษาการทำงานของจิตใจมนุษย์ให้ละเอียดยิ่งขึ้น เนื่องจากเป็นหลักฐานเพียงอย่างเดียวที่แสดงว่าระบบอัจฉริยะนั้นเป็นไปได้ในหลักการ

ปัญหาการเรียนรู้ AI

อัลกอริธึมการเรียนรู้ของเครื่องได้รับการปรับแต่งโดยใช้โครงสร้างทางคณิตศาสตร์บางอย่างทั้งนี้ขึ้นอยู่กับงานเฉพาะ ในตัวอย่างกว่าล้านตัวอย่าง โครงข่ายประสาทเทียมเรียนรู้ที่จะปรับแต่งการเชื่อมต่อจนกว่าจะถึงสถานะในอุดมคติที่ช่วยให้ทำงานด้วยความแม่นยำสูงสุด

เนื่องจากแต่ละอัลกอริธึมได้รับการปรับแต่งให้เหมาะกับปัญหาโดยเฉพาะ การฝึกอบรมใหม่สำหรับปัญหาใหม่มักจะลบการเชื่อมต่อที่สร้างไว้ก่อนหน้านี้ ดังนั้นเมื่อ AI เรียนรู้งานใหม่ มันจะเขียนทับงานก่อนหน้าทั้งหมด

ภาวะที่กลืนไม่เข้าคายไม่ออกของการเรียนรู้อย่างต่อเนื่องเป็นเพียงปัญหาหนึ่งในปัญญาประดิษฐ์ คนอื่นยังไม่ได้กำหนดไว้อย่างชัดเจน แต่บางทีพวกเขาจะจริงจังมากขึ้นในการสร้างความคิดที่ยืดหยุ่นและสร้างสรรค์เช่นเรา

ตัวอย่างเช่น ปัญหาของการรับรู้ที่เป็นตัวเป็นตน - ตามที่ Hassabis อธิบายคือความสามารถในการสร้างความรู้และความคิดเชิงนามธรรมโดยอาศัยปฏิสัมพันธ์ทางประสาทสัมผัสที่เป็นอิสระกับโลก เป็นสามัญสำนึกชนิดหนึ่งที่ผู้คนมี สัญชาตญาณที่อธิบายยาก แต่มีประโยชน์อย่างยิ่งในการจัดการกับปัญหาในแต่ละวันที่เราเผชิญ

การเขียนโปรแกรมลักษณะเช่นจินตนาการนั้นยากยิ่งขึ้นไปอีก นี่คือจุดที่ AI ซึ่งถูกจำกัดไว้สำหรับงานหนึ่งๆ เท่านั้น แย่จริงๆ Hassabis กล่าว จินตนาการและนวัตกรรมขึ้นอยู่กับแบบจำลองที่เราสร้างขึ้นเกี่ยวกับโลกของเราแล้ว และจินตนาการถึงสถานการณ์ใหม่ๆ จากสิ่งเหล่านี้ สิ่งเหล่านี้เป็นเครื่องมือในการวางแผนที่ทรงพลังมาก แต่การวิจัยสำหรับ AI ยังอยู่ในช่วงเริ่มต้น

นักวิทยาศาสตร์ตั้งข้อสังเกตว่าเมื่อแก้ปัญหาการทำงานของโครงข่ายประสาทเทียม พวกเขาจะหันไปใช้ชีววิทยาและสรีรวิทยาของสิ่งมีชีวิต ดังนั้น การค้นพบเมื่อเร็วๆ นี้แสดงให้เห็นว่าฮิบโปแคมปัส ซึ่งเป็นส่วนหนึ่งของระบบลิมบิกของสมองที่มีหน้าที่ในการจดจำ จะ "สูญเสีย" ประสบการณ์และความทรงจำของเราไปอย่างรวดเร็วระหว่างพักผ่อนและนอนหลับ วิธีนี้ช่วยให้สมองสามารถ “เรียนรู้ใหม่จากความสำเร็จและความล้มเหลวในอดีต” Hassabis กล่าว

นักวิจัย AI ได้นำแนวคิดนี้มาใช้และรวมเวอร์ชันพื้นฐานไว้ในอัลกอริธึม และผลลัพธ์ที่ได้คือโครงข่ายประสาทเทียมที่ทรงพลังและเรียนรู้จากประสบการณ์ พวกเขาเปรียบเทียบสถานการณ์ปัจจุบันกับเหตุการณ์ก่อนหน้าที่เก็บไว้ในหน่วยความจำและดำเนินการที่นำไปสู่ความสำเร็จหรือรางวัลก่อนหน้านี้

แต่สิ่งที่ดีที่สุดยังมาไม่ถึง

การถือกำเนิดขึ้นของเครื่องมือสร้างภาพสมองและวิศวกรรมชีวภาพทางพันธุกรรมช่วยให้มองเห็นวิธีที่โครงข่ายประสาทชีวภาพจัดระเบียบและรวมกันเพื่อแก้ปัญหาอย่างที่ไม่เคยเกิดขึ้นมาก่อน ในขณะที่นักประสาทวิทยาทำงานเพื่อแก้ "รหัสประสาท" ซึ่งเป็นการคำนวณพื้นฐานที่ช่วยให้สมองทำงานต่อไป นักวิจัย AI มีชุดเครื่องมือในการศึกษาเพิ่มขึ้น

เป็นที่น่าสังเกตว่าไม่ใช่แค่ AI เท่านั้นที่ต้องเรียนรู้จากนักประสาทวิทยาอีกมาก แต่ยังมีประโยชน์ร่วมกันอีกด้วย ประสาทวิทยาศาสตร์สมัยใหม่ในเครื่องมือสร้างภาพที่ทรงพลังและออปโตเจเนติกส์ทั้งหมดเพิ่งเริ่มเข้าใจว่าโครงข่ายประสาทสนับสนุนระดับสติปัญญาที่สูงขึ้นได้อย่างไร

"นักประสาทวิทยามักมีแนวคิดที่ค่อนข้างคลุมเครือเกี่ยวกับกลไกเบื้องหลังแนวคิดที่พวกเขาศึกษา" ฮัสซาบิสกล่าว เนื่องจากการวิจัย AI นั้นใช้คณิตศาสตร์ที่เข้มงวด จึงสามารถแนะนำวิธีที่จะอธิบายแนวคิดที่คลุมเครือเหล่านี้ในสมมติฐานในชีวิตจริงได้

แน่นอนว่าไม่น่าเป็นไปได้ที่ AI และสมองจะทำงานในลักษณะเดียวกันเสมอไป แต่เราสามารถมอง AI ว่าเป็นประสาทวิทยาศาสตร์เชิงประยุกต์ได้ Hassabis กล่าว การเปรียบเทียบอัลกอริธึม AI กับสมองของมนุษย์ "สามารถให้ข้อมูลเชิงลึกเกี่ยวกับความลึกลับที่ลึกที่สุดของจิตใจ"

ว่ากันว่า 47% ของทั้งหมด
งานอาจเป็นแบบอัตโนมัติภายใน 20 ปีข้างหน้า ตัวขับเคลื่อนหลักของกระบวนการนี้คือการใช้ปัญญาประดิษฐ์ซึ่งทำงานกับข้อมูลขนาดใหญ่เพื่อทดแทนบุคคลที่มีประสิทธิภาพมากขึ้น

เครื่องจักรสามารถแก้ไขกระบวนการที่ก่อนหน้านี้เป็นความรับผิดชอบของมนุษย์ได้มากขึ้นเรื่อยๆ นอกจากนี้ ยังทำได้ดีกว่าและถูกกว่าในหลายกรณี German Gref พูดถึงความหมายของตลาดแรงงานในเดือนกรกฎาคมปีนี้ โดยพูดคุยกับนักศึกษาของ Baltic Federal University กันต์:

“เราหยุดจ้างทนายความที่ไม่รู้ว่าจะทำอย่างไรกับโครงข่ายประสาทเทียม<...>คุณเป็นนักเรียนของเมื่อวาน เพื่อนนักกฎหมาย ลืมอาชีพของคุณไปซะ ปีที่แล้วทนายความ 450 คนที่เตรียมฟ้องในประเทศของเรากลายเป็นอดีตไปแล้ว พวกเขาถูกลดหย่อนลง โครงข่ายประสาทเทียมของเราเตรียมคำแถลงการเรียกร้องได้ดีกว่านักกฎหมายที่ได้รับการฝึกอบรมจาก Baltic Federal University เราจะไม่จ้างพวกเขาอย่างแน่นอน”

ต่อเนื่องครอบคลุม #เทคโนอนาคต ทีมงาน สอท. ได้เตรียมทุกอย่างที่ คุณจำเป็นต้องรู้ในการดำดิ่งสู่โครงข่ายประสาทเทียมครั้งแรก: วิธีการจัดเรียง เหตุใดบริษัทจำนวนมากขึ้นเรื่อยๆ จึงนิยมใช้โครงข่ายประสาทเทียมกับพนักงาน และสิ่งที่เทคโนโลยีนี้มีศักยภาพในการเพิ่มประสิทธิภาพกระบวนการต่างๆ

ปัญญาประดิษฐ์ แมชชีนเลิร์นนิง และโครงข่ายประสาทเทียม: อะไรคือความแตกต่าง

โครงข่ายประสาทเทียมเป็นวิธีหนึ่งในการนำไปปฏิบัติ ปัญญาประดิษฐ์ (AI).

มีพื้นที่กว้างใหญ่ในการพัฒนา AI - การเรียนรู้ของเครื่อง. เธอศึกษาวิธีการสร้างอัลกอริธึมที่สามารถเรียนรู้ได้ด้วยตัวเอง นี่เป็นสิ่งจำเป็นหากไม่มีวิธีแก้ไขปัญหาที่ชัดเจน ในกรณีนี้ เป็นการง่ายกว่าที่จะไม่ค้นหาวิธีแก้ปัญหาที่ถูกต้อง แต่ให้สร้างกลไกที่จะช่วยหาวิธีในการค้นหา

#อ้างอิง บทความจำนวนมากมีคำว่า "ลึก" - หรือ "ลึก" - การเรียนรู้. เป็นที่เข้าใจกันว่าเป็นอัลกอริธึมการเรียนรู้ของเครื่องที่ใช้ทรัพยากรการคำนวณจำนวนมาก ในกรณีส่วนใหญ่ สามารถเข้าใจได้ง่ายๆ ว่าเป็น "โครงข่ายประสาทเทียม"

เพื่อไม่ให้สับสนในแนวคิดของ "ปัญญาประดิษฐ์" "แมชชีนเลิร์นนิง" และ "การเรียนรู้เชิงลึก" เราขอแนะนำให้ดูที่การสร้างภาพการพัฒนา:

#น่าสนใจ ปัญญาประดิษฐ์ (AI) มีสองประเภท: อ่อนแอ (เน้นแคบ) และแข็งแกร่ง (ทั่วไป) AI ที่อ่อนแอได้รับการออกแบบมาเพื่อทำรายการงานที่แคบ นี่คือผู้ช่วยเสียง Siri และ Google Assistant และตัวอย่างอื่น ๆ ทั้งหมดที่เราให้ไว้ในบทความนี้ ในทางกลับกัน AI ที่แข็งแกร่งสามารถทำงานของมนุษย์ได้ ในขณะนี้ การนำ AI ที่แข็งแกร่งมาใช้นั้นเป็นไปไม่ได้ มันเป็นแนวคิดแบบยูโทเปีย

โครงข่ายประสาททำงานอย่างไร

โครงข่ายประสาทจำลองการทำงานของระบบประสาทของมนุษย์ ซึ่งเป็นคุณลักษณะหนึ่งของความสามารถในการเรียนรู้ด้วยตนเองจากประสบการณ์ที่ผ่านมา ดังนั้นทุกครั้งที่ระบบทำผิดพลาดน้อยลง

เช่นเดียวกับระบบประสาทของเรา โครงข่ายประสาทเทียมประกอบด้วยองค์ประกอบการคำนวณที่แยกจากกัน - เซลล์ประสาทที่อยู่หลายชั้น ข้อมูลที่ป้อนเข้าของโครงข่ายประสาทเทียมจะผ่านการประมวลผลตามลำดับที่แต่ละชั้นของเครือข่าย ในเวลาเดียวกัน เซลล์ประสาทแต่ละเซลล์มีพารามิเตอร์บางอย่างที่สามารถเปลี่ยนแปลงได้ขึ้นอยู่กับผลลัพธ์ที่ได้รับ - นี่คือการฝึกอบรมของเครือข่าย

สมมติว่างานของโครงข่ายประสาทเทียมคือการแยกแยะแมวออกจากสุนัข ในการตั้งค่าโครงข่ายประสาทเทียม จะมีการป้อนรูปภาพที่มีลายเซ็นของแมวและสุนัขจำนวนมาก โครงข่ายประสาทเทียมจะวิเคราะห์ลักษณะเด่น (รวมถึงเส้น รูปร่าง ขนาด และสี) ในรูปภาพเหล่านี้ และสร้างแบบจำลองการจดจำที่ลดเปอร์เซ็นต์ของข้อผิดพลาดให้เหลือน้อยที่สุดเมื่อเทียบกับผลการอ้างอิง

รูปด้านล่างแสดงกระบวนการของโครงข่ายประสาทเทียม ซึ่งมีหน้าที่ในการจดจำหมายเลขรหัสไปรษณีย์ที่เขียนด้วยมือ


ประวัติโครงข่ายประสาทเทียม

แม้ว่าโครงข่ายประสาทเทียมจะได้รับความสนใจเมื่อไม่นานมานี้ แต่ก็เป็นหนึ่งในอัลกอริธึมการเรียนรู้ของเครื่องที่เก่าแก่ที่สุด รุ่นแรกของเซลล์ประสาทที่เป็นทางการ คือ เซลล์โครงข่ายประสาทเทียม เสนอโดย Warren McCulloch และ Walter Pitts ในปี 1943

และในปี 1958 Frank Rosenblatt ได้พัฒนาโครงข่ายประสาทเทียมเครื่องแรก แม้จะเรียบง่าย แต่ก็สามารถแยกแยะได้ เช่น วัตถุในพื้นที่สองมิติ

Mark I Perceptron - เครื่อง Rosenblatt

ความสำเร็จครั้งแรกดึงดูดความสนใจของเทคโนโลยีมากขึ้น แต่แล้วอัลกอริธึมการเรียนรู้ของเครื่องอื่นๆ เริ่มแสดงผลได้ดีขึ้น และโครงข่ายประสาทเทียมก็จางหายไปในเบื้องหลัง คลื่นลูกต่อไปที่น่าสนใจเกิดขึ้นในปี 1990 หลังจากที่ไม่ค่อยมีใครรู้จักเกี่ยวกับโครงข่ายประสาทเทียมจนถึงปี 2010

ทำไมโครงข่ายประสาทกลับมานิยมอีกครั้ง

จนถึงปี 2010 ไม่มีฐานข้อมูลขนาดใหญ่พอที่จะฝึกเครือข่ายประสาทในเชิงคุณภาพเพื่อแก้ปัญหาบางอย่าง ซึ่งส่วนใหญ่เกี่ยวข้องกับการจดจำภาพและการจำแนกประเภท ดังนั้นโครงข่ายประสาทเทียมจึงมักทำผิดพลาด: พวกเขาสับสนระหว่างแมวกับสุนัข หรือที่แย่กว่านั้นคือ รูปภาพของอวัยวะที่แข็งแรงพร้อมรูปภาพของอวัยวะที่ได้รับผลกระทบจากเนื้องอก

แต่ในปี 2010 ฐานข้อมูล ImageNet ปรากฏขึ้นซึ่งมีภาพ 15 ล้านภาพใน 22,000 หมวดหมู่ ImageNet มีขนาดใหญ่กว่าฐานข้อมูลภาพที่มีอยู่หลายเท่าและนักวิจัยทุกคนสามารถเข้าถึงได้ ด้วยปริมาณข้อมูลดังกล่าว โครงข่ายประสาทเทียมสามารถสอนให้ตัดสินใจได้โดยปราศจากข้อผิดพลาด


ขนาดของ ImageNet เทียบกับฐานข้อมูลภาพอื่นๆ ที่มีอยู่ในปี 2010

ก่อนหน้านั้น ปัญหาอีกประการหนึ่งที่มีนัยสำคัญไม่น้อยขัดขวางการพัฒนาโครงข่ายประสาทเทียม: วิธีการสอนแบบเดิมไม่ได้ผล แม้ว่าจำนวนเลเยอร์ในโครงข่ายประสาทเทียมจะมีบทบาทสำคัญ แต่วิธีการฝึกอบรมเครือข่ายก็มีความสำคัญเช่นกัน วิธีการเข้ารหัสแบบย้อนกลับที่ใช้ก่อนหน้านี้สามารถฝึกเฉพาะเลเยอร์สุดท้ายของเครือข่ายได้อย่างมีประสิทธิภาพ กระบวนการเรียนรู้ใช้เวลานานเกินไปสำหรับการใช้งานจริง และชั้นลึกของโครงข่ายประสาทเทียมที่ซ่อนไว้ทำงานไม่ถูกต้อง

ผลลัพธ์ในการแก้ปัญหานี้ในปี 2549 ทำได้โดยนักวิทยาศาสตร์อิสระสามกลุ่ม อย่างแรก เจฟฟรีย์ ฮินตันใช้การฝึกเครือข่ายล่วงหน้าโดยใช้เครื่อง Boltzmann โดยฝึกแต่ละเลเยอร์แยกกัน ประการที่สอง Yan LeKan เสนอให้ใช้โครงข่ายประสาทเทียมเพื่อแก้ปัญหาการจดจำภาพ ในที่สุด Joshua Bengio ได้พัฒนาตัวเข้ารหัสอัตโนมัติแบบเรียงซ้อนซึ่งอนุญาตให้ใช้เลเยอร์ทั้งหมดในเครือข่ายประสาทเทียมระดับลึก

ตัวอย่างความสำเร็จของการประยุกต์ใช้โครงข่ายประสาทเทียมในธุรกิจ

ยา

ทีมนักวิจัยจากมหาวิทยาลัยนอตติงแฮมได้พัฒนาอัลกอริธึมการเรียนรู้ด้วยเครื่องสี่ชุดเพื่อประเมินความเสี่ยงของผู้ป่วยต่อโรคหัวใจและหลอดเลือด ข้อมูลจากผู้ป่วยชาวอังกฤษ 378,000 คนถูกนำมาใช้ในการฝึกอบรม ปัญญาประดิษฐ์ที่ผ่านการฝึกอบรมกำหนดความเสี่ยงของโรคหัวใจได้อย่างมีประสิทธิภาพมากกว่าแพทย์จริง ความแม่นยำของอัลกอริธึมอยู่ระหว่าง 74 ถึง 76.4 เปอร์เซ็นต์ (ระบบแปดปัจจัยมาตรฐานที่พัฒนาโดย American College of Cardiology ให้ความแม่นยำเพียง 72.8%)

การเงิน

บริษัทประกันภัยของญี่ปุ่น Fukoku Mutual Life Insurance ได้ลงนามในสัญญากับ IBM ตามเขา พนักงานของบริษัทญี่ปุ่น 34 คนจะถูกแทนที่ด้วยระบบ AI ของ IBM Watson Explorer AI. โครงข่ายประสาทเทียมจะตรวจสอบใบรับรองแพทย์หลายหมื่นฉบับ และพิจารณาถึงจำนวนการเข้ารับการรักษาในโรงพยาบาล การผ่าตัด และปัจจัยอื่นๆ เพื่อกำหนดเงื่อนไขการประกันของลูกค้า Fukoku Mutual Life Insurance เชื่อว่าการใช้ IBM Watson จะเพิ่มประสิทธิภาพการทำงานได้ถึง 30% และจ่ายเองภายในสองปี

การเรียนรู้ของเครื่อง ช่วยระบุกรณีที่อาจเกิดการทุจริตในด้านต่างๆ ของชีวิตเครื่องมือที่คล้ายกันนี้ใช้ ตัวอย่างเช่น PayPal ซึ่งเป็นส่วนหนึ่งของการต่อสู้กับการฟอกเงิน บริษัทจะเปรียบเทียบธุรกรรมนับล้านรายการและตรวจพบรายการที่น่าสงสัยในหมู่พวกเขา เป็นผลให้ธุรกรรมฉ้อโกงของ PayPal อยู่ที่ 0.32% ต่ำสุดตลอดกาล ในขณะที่มาตรฐานในภาคการเงินอยู่ที่ 1.32%

ความต่อเนื่องของบันทึกการวิเคราะห์สามารถดูได้ที่ลิงค์:

งานวิจัยด้านปัญญาประดิษฐ์อีกด้านคือโครงข่ายประสาทเทียม พวกมันได้รับการออกแบบให้คล้ายกับโครงข่ายประสาทธรรมชาติของระบบประสาทของมนุษย์

โครงข่ายประสาทเทียม

Dr. Robert Hecht-Nielsen ผู้ประดิษฐ์เครื่องประสาทคอมพิวเตอร์เครื่องแรก ให้แนวคิดเกี่ยวกับโครงข่ายประสาทเทียมดังนี้ “โครงข่ายประสาทเทียมเป็นระบบคอมพิวเตอร์ที่ประกอบด้วยองค์ประกอบการประมวลผลที่เรียบง่ายและเชื่อมต่อถึงกันสูงจำนวนหนึ่ง ซึ่งประมวลผลข้อมูลโดยการตอบสนองแบบไดนามิก อิทธิพลภายนอก”

โครงสร้างพื้นฐานของโครงข่ายประสาทเทียม (ANN)

แนวคิดของ ANN มีพื้นฐานมาจากความเชื่อที่ว่าเป็นไปได้ที่จะเลียนแบบการทำงานของสมองมนุษย์โดยการสร้างการเชื่อมต่อที่จำเป็นโดยใช้ซิลิกอนและสายไฟ เช่น เซลล์ประสาทและเดนไดรต์ที่มีชีวิต

สมองของมนุษย์ประกอบด้วยเซลล์ประสาทจำนวน 1 แสนล้านเซลล์ที่เรียกว่าเซลล์ประสาท พวกมันเชื่อมต่อกับเซลล์หลายพันเซลล์ด้วยซอน เดนไดรต์ได้รับสิ่งกระตุ้นจากสภาพแวดล้อมภายนอกหรือสัญญาณจากอวัยวะรับความรู้สึก อินพุตเหล่านี้สร้างแรงกระตุ้นไฟฟ้าที่เดินทางอย่างรวดเร็วผ่านโครงข่ายประสาทเทียม เซลล์ประสาทสามารถส่งข้อความไปยังเซลล์ประสาทอื่น ๆ ซึ่งอาจส่งข้อความนั้นต่อไปหรือไม่ส่งข้อความเลย


โครงข่ายประสาทเทียมประกอบด้วยหลายโหนดที่เลียนแบบเซลล์ประสาททางชีววิทยาของสมองมนุษย์ เซลล์ประสาทเชื่อมต่อกันและมีปฏิสัมพันธ์ซึ่งกันและกัน โหนดสามารถรับอินพุตและดำเนินการอย่างง่ายกับข้อมูลได้ จากการดำเนินการเหล่านี้ ข้อมูลจะถูกถ่ายโอนไปยังเซลล์ประสาทอื่น เอาต์พุตสำหรับแต่ละโหนดเรียกว่าการเปิดใช้งาน

แต่ละลิงค์จะสัมพันธ์กับน้ำหนัก ANN สามารถเรียนรู้ได้ ซึ่งดำเนินการโดยการเปลี่ยนค่าน้ำหนัก รูปต่อไปนี้แสดง ANN อย่างง่าย:

ประเภทของโครงข่ายประสาทเทียม

โทโพโลยีโครงข่ายประสาทเทียมมีสองประเภท - ฟีดฟอร์เวิร์ดและฟีดแบ็ค

การไหลของข้อมูลเป็นทิศทางเดียว บล็อกส่งข้อมูลไปยังหน่วยอื่น ๆ ที่ไม่ได้รับข้อมูล ไม่มีการวนรอบความคิดเห็น พวกเขามีอินพุตและเอาต์พุตคงที่


ที่นี่อนุญาตการวนซ้ำข้อเสนอแนะ

โครงข่ายประสาทเทียมทำงานอย่างไร

โทโพโลยีแสดงวงจร แต่ละลูกศรแสดงถึงการเชื่อมต่อระหว่างเซลล์ประสาทสองเซลล์ และชี้ทางสำหรับการไหลของข้อมูล การเชื่อมต่อแต่ละครั้งมีน้ำหนัก ซึ่งเป็นจำนวนเต็มที่ควบคุมสัญญาณระหว่างเซลล์ประสาททั้งสอง

หากเครือข่ายให้ผลลัพธ์ที่ "ดี" และ "ที่ต้องการ" ก็ไม่จำเป็นต้องปรับน้ำหนัก อย่างไรก็ตาม หากเครือข่ายสร้างเอาต์พุตหรือข้อผิดพลาดที่ "ไม่ดี" หรือ "ไม่ต้องการ" ระบบจะปรับน้ำหนักเพื่อปรับปรุงผลลัพธ์ที่ตามมา

แมชชีนเลิร์นนิงในโครงข่ายประสาทเทียม

ANN สามารถเรียนรู้ได้และต้องได้รับการฝึกอบรม มีกลยุทธ์การเรียนรู้หลายอย่าง

การฝึกอบรม - รวมครูที่ป้อนตัวอย่างการฝึกอบรมไปยังเครือข่ายที่ครูรู้คำตอบ เครือข่ายเปรียบเทียบผลลัพธ์กับคำตอบของครูและปรับน้ำหนัก

การเรียนรู้โดยไม่ได้รับการดูแลเป็นสิ่งจำเป็นเมื่อไม่มีตัวอย่างการฝึกอบรมพร้อมคำตอบที่ทราบ ตัวอย่างเช่น ในปัญหาการจัดกลุ่ม เช่น การแบ่งชุดขององค์ประกอบออกเป็นกลุ่มตามเกณฑ์บางอย่าง

การเรียนรู้การเสริมกำลังเป็นกลยุทธ์ที่อิงจากการสังเกต เครือข่ายตัดสินใจโดยการสังเกตสภาพแวดล้อม หากการสังเกตเป็นลบ เครือข่ายจะปรับน้ำหนักเพื่อให้สามารถทำการตัดสินใจที่จำเป็นต่างๆ ได้

อัลกอริธึมการแพร่กระจายกลับ

เครือข่ายเบย์เซียน (BN)

โครงสร้างเหล่านี้เป็นโครงสร้างกราฟิกสำหรับแสดงความสัมพันธ์ความน่าจะเป็นระหว่างชุดของตัวแปรสุ่ม

ในเครือข่ายเหล่านี้ แต่ละโหนดเป็นตัวแปรสุ่มที่มีข้อเสนอเฉพาะ ตัวอย่างเช่น ในการวินิจฉัยทางการแพทย์ โหนดมะเร็งคือข้อบ่งชี้ว่าผู้ป่วยเป็นมะเร็ง

ขอบที่เชื่อมต่อโหนดเป็นการพึ่งพาความน่าจะเป็นระหว่างตัวแปรสุ่มเหล่านี้ หากเป็นสองโหนด โหนดหนึ่งมีผลกับอีกโหนดหนึ่ง จะต้องเชื่อมต่อโดยตรง ความแข็งแรงของความสัมพันธ์ระหว่างตัวแปรวัดจากความน่าจะเป็นที่เกี่ยวข้องกับแต่ละโหนด

มีข้อ จำกัด เกี่ยวกับส่วนโค้งใน BN เท่านั้น คุณไม่สามารถกลับไปที่โหนดโดยทำตามทิศทางของส่วนโค้ง ดังนั้น BNS จึงเรียกว่ากราฟวงจร

โครงสร้าง BN เหมาะสำหรับการรวมความรู้และข้อมูลที่สังเกตได้ BN สามารถใช้เพื่อเรียนรู้ความสัมพันธ์เชิงสาเหตุและทำความเข้าใจปัญหาต่างๆ และทำนายอนาคต แม้จะไม่มีข้อมูลก็ตาม

โครงข่ายประสาทใช้ที่ไหน

    พวกเขาสามารถทำงานที่ง่ายสำหรับมนุษย์ แต่ยากสำหรับเครื่องจักร:

    การบินและอวกาศ - นักบินอัตโนมัติของเครื่องบิน;

    ยานยนต์ - ระบบนำทางรถยนต์;

    ทหาร - การติดตามเป้าหมาย, นักบินอัตโนมัติ, การจดจำสัญญาณ / ภาพ;

    อิเล็กทรอนิกส์ - การทำนาย การวิเคราะห์ข้อผิดพลาด แมชชีนวิชัน การสังเคราะห์เสียง

    การเงิน – การประเมินมูลค่าอสังหาริมทรัพย์ ที่ปรึกษาสินเชื่อ การจำนอง พอร์ตโฟลิโอของบริษัทการค้า ฯลฯ

    การประมวลผลสัญญาณ - โครงข่ายประสาทเทียมสามารถฝึกให้ประมวลผลสัญญาณเสียงได้

แมชชีนเลิร์นนิงเป็นคำศัพท์กว้างๆ ที่ครอบคลุมทุกสิ่งที่คุณทำเมื่อคุณพยายามสอนแมชชีนให้พัฒนาตนเอง โดยเฉพาะอย่างยิ่ง สิ่งนี้ใช้กับระบบใดๆ ที่ประสิทธิภาพของคอมพิวเตอร์ในการทำงานได้รับการปรับปรุงโดยประสบการณ์ที่มากขึ้นกับงานนั้นเท่านั้น โครงข่ายประสาทเทียมเป็นตัวอย่างหนึ่งของการเรียนรู้ของเครื่อง แต่ไม่ใช่วิธีเดียวในการฝึกคอมพิวเตอร์

ตัวอย่างเช่น วิธีการอื่นของการเรียนรู้ด้วยเครื่องเรียกว่าการเรียนรู้แบบเสริมแรง ในวิธีนี้ คอมพิวเตอร์ทำงานแล้วประเมินผลลัพธ์ ตัวอย่างเช่น หากคอมพิวเตอร์ชนะหมากรุก มันก็จะกำหนดค่าที่ชนะให้กับชุดการเคลื่อนไหวที่ใช้ระหว่างเกม หลังจากเล่นเกมหลายล้านเกม ระบบจะสามารถระบุได้ว่าท่าใดมีแนวโน้มที่จะนำไปสู่ชัยชนะมากที่สุดโดยพิจารณาจากผลลัพธ์ของเกมก่อนหน้า

แม้ว่าโครงข่ายประสาทเทียมจะดีสำหรับสิ่งต่างๆ เช่น การจดจำรูปแบบในภาพ แต่การเรียนรู้ของเครื่องประเภทอื่นๆ อาจมีประโยชน์มากกว่าสำหรับงานต่างๆ เช่น การค้นหาเพลงโปรดของคุณ Google อ้างว่าแอปเพลงจะค้นหาเพลงที่คุณต้องการฟัง ทำได้โดยการวิเคราะห์เพลย์ลิสต์ก่อนหน้าของคุณ หากคุณไม่ชอบผลลัพธ์เครื่องจะถือว่าล้มเหลว แต่ถ้าคุณเลือกหนึ่งในรายการที่เสนอ เธอจะทำเครื่องหมายว่าประสบความสำเร็จและวิเคราะห์การเคลื่อนไหวที่ชนะซึ่งนำเธอไปสู่หัวใจของคุณ

ในกรณีเช่นนี้ คุณจะไม่ได้รับประโยชน์อย่างเต็มที่จากการเรียนรู้ของเครื่อง หากคุณไม่ได้ใช้คุณสมบัตินี้บ่อยๆ เมื่อคุณเปิดแอป Google Music เป็นครั้งแรก คำแนะนำมักจะอยู่เหนือกว่า แต่ยิ่งคุณใช้มากเท่าไหร่ ข้อเสนอก็จะยิ่งดีขึ้นเท่านั้น ในทางทฤษฎีอย่างน้อย การเรียนรู้ด้วยเครื่องไม่ใช่ยาครอบจักรวาล แมชชีนเลิร์นนิงเป็นแนวคิดที่คลุมเครือมากกว่าโครงข่ายประสาทเทียม แต่ยังบอกเป็นนัยว่าซอฟต์แวร์ที่คุณใช้จะขึ้นอยู่กับความคิดเห็นของคุณเพื่อปรับปรุงประสิทธิภาพ

ปัญญาประดิษฐ์คือทุกสิ่งที่มีคำนำหน้า "ฉลาด"


เช่นเดียวกับโครงข่ายประสาทเทียมเป็นรูปแบบหนึ่งของการเรียนรู้ด้วยเครื่อง การเรียนรู้ด้วยเครื่องก็เป็นรูปแบบหนึ่งของปัญญาประดิษฐ์ แต่หมวดหมู่ของ "ปัญญาประดิษฐ์" นั้นนิยามได้ไม่ดีนักจนวลีนี้ไม่มีความหมายในทางปฏิบัติ ใช่ มันสร้างภาพแห่งอนาคตที่ล้ำหน้าทางเทคโนโลยี แต่ในความเป็นจริง เรายังไม่ได้เข้าใกล้มันเลย กาลครั้งหนึ่ง การรู้จำอักขระด้วยแสงนั้นซับซ้อนเกินไปสำหรับเครื่อง แต่ตอนนี้แอพในโทรศัพท์ของคุณสามารถสแกนเอกสารและเปลี่ยนเป็นข้อความได้ การเรียกมันว่าเป็นความสำเร็จของปัญญาประดิษฐ์นั้นไร้ค่า

เหตุผลที่ความสามารถขั้นพื้นฐานของโทรศัพท์ถือได้ว่าเป็นปัญญาประดิษฐ์ก็เพราะว่าจริงๆ แล้ว AI มีอยู่สองประเภท AI ที่อ่อนแอหรือแคบจะอธิบายระบบใดๆ ที่ออกแบบมาเพื่อดำเนินการตามรายการงานแคบๆ ตัวอย่างเช่น Google Assistant หรือ Siri ในขณะที่ AI ค่อนข้างทรงพลัง ก็ยังคงทำงานที่ค่อนข้างแคบ พวกเขาได้รับคำสั่งเสียงและตอบกลับหรือเปิดแอปพลิเคชัน การวิจัย AI กระตุ้นคุณลักษณะเหล่านี้ แต่ถือว่า "อ่อนแอ"

ในทางตรงกันข้าม AI ที่แข็งแกร่งหรือที่เรียกว่าปัญญาประดิษฐ์ทั่วไปหรือ "AI เต็มรูปแบบ" เป็นระบบที่สามารถทำงานของมนุษย์ได้ และเธอไม่มีอยู่จริง ดังนั้นแอปพลิเคชั่นที่ "ฉลาด" ยังคงเป็นปัญญาประดิษฐ์ที่อ่อนแอ

และแม้ว่าความหมายจะคลุมเครือมาก แต่การวิจัยเชิงปฏิบัติเกี่ยวกับปัญญาประดิษฐ์นั้นมีประโยชน์มากจนอาจเป็นส่วนหนึ่งของชีวิตประจำวันของคุณแล้ว ทุกครั้งที่โทรศัพท์จดจำตำแหน่งที่คุณจอดรถโดยอัตโนมัติ จดจำใบหน้าในภาพถ่าย รับคำแนะนำการค้นหา หรือจัดกลุ่มภาพช่วงสุดสัปดาห์ทั้งหมดโดยอัตโนมัติ แสดงว่าคุณกำลังสัมผัสกับปัญญาประดิษฐ์ไม่ทางใดก็ทางหนึ่ง ในระดับหนึ่ง "ปัญญาประดิษฐ์" หมายความว่าแอปจะฉลาดกว่าที่เราคุ้นเคยเล็กน้อย ไม่น่าเป็นไปได้ที่ป้ายกำกับ "AI" ในตอนนี้จะหมายถึงสิ่งที่เข้าใจได้จากมุมมองที่ใช้งานได้จริง



บทความที่คล้ายกัน