एआई ने शतरंज और गो में सर्वश्रेष्ठ प्रदर्शन किया है, लेकिन यह Minecraft में हीरा खोजने के लिए संघर्ष करता है
एक नई चुनौती देखकर AI की सीखने की क्षमता का परीक्षण करती है
स्मार्ट फेसबुक

चाहे हम आमलेट बनाना सीख रहे हों या कार चलाना, नए कौशल में महारत हासिल करने का रास्ता अक्सर दूसरों को देखकर शुरू होता है। लेकिन क्या आर्टिफिशियल इंटेलिजेंस उसी तरह सीख सकता है? एआई एजेंटों को खेलना सिखाना एक नई चुनौतीMinecraftसुझाव देता है कि यह कंप्यूटर के लिए बहुत अधिक कठिन है।
इस साल की शुरुआत में घोषित,माइनआरएल प्रतियोगिताशोधकर्ताओं की टीमों को एआई बॉट बनाने के लिए कहा जो सफलतापूर्वक हीरे का खनन कर सकेMinecraft. यह एक असंभव कार्य नहीं है, लेकिन इसके लिए खेल की मूल बातों में महारत हासिल करने की आवश्यकता है। खिलाड़ियों को यह जानने की जरूरत है कि राक्षसों और लावा को चकमा देते हुए पेड़ों को कैसे काटा जाए, पिकैक्स बनाया जाए और भूमिगत गुफाओं का पता लगाया जाए। ये ऐसे कौशल हैं जिन्हें अधिकांश वयस्क कुछ घंटों के प्रयोग के बाद सीख सकते हैं या YouTube पर ट्यूटोरियल देखकर बहुत तेज़ी से सीख सकते हैं।
लेकिन MineRL प्रतियोगिता में 660 प्रविष्टियों में से, कोई भी चुनौती को पूरा करने में सक्षम नहीं था, परिणामों के अनुसार जो AI सम्मेलन NeurIPS में घोषित किए जाएंगे और जिनकी सबसे पहले रिपोर्ट की गई थी बीबीसी समाचार .हालांकि बॉट थेसीखने में सक्षममध्यवर्ती कदम, जैसे टिकाऊ पिकैक्स बनाने के लिए भट्टी का निर्माण, किसी को भी सफलतापूर्वक हीरा नहीं मिला।
हमने जो कार्य किया है वह बहुत कठिन है, माइक्रोसॉफ्ट रिसर्च के एक प्रमुख शोधकर्ता, काटजा हॉफमैन, जिन्होंने चुनौती को व्यवस्थित करने में मदद की, ने बतायाबीबीसी समाचार. जबकि किसी भी सबमिट किए गए एजेंट ने कार्य को पूरी तरह से हल नहीं किया है, उन्होंने बहुत प्रगति की है और रास्ते में आवश्यक कई टूल बनाना सीख लिया है।

यह आश्चर्य की बात हो सकती है, खासकर जब आपको लगता है कि एआई शतरंज, गो, और जैसे खेलों में सर्वश्रेष्ठ इंसानों में कामयाब रहा हैडोटा 2।लेकिन यह तकनीक की महत्वपूर्ण सीमाओं के साथ-साथ माइनआरएल के न्यायाधीशों द्वारा टीमों को वास्तव में चुनौती देने के लिए लगाए गए प्रतिबंधों को दर्शाता है।
MineRL के बॉट्स को इमिटेशन लर्निंग और रीइन्फोर्समेंट लर्निंग नामक विधियों के संयोजन का उपयोग करके सीखना था। नकली सीखने में, एजेंटों को उनके आगे कार्य का डेटा दिखाया जाता है, और वे इसकी नकल करने का प्रयास करते हैं। सुदृढीकरण सीखने में, उन्हें बस एक आभासी दुनिया में फेंक दिया जाता है और परीक्षण और त्रुटि का उपयोग करके अपने लिए काम करने के लिए छोड़ दिया जाता है।
अक्सर, AI इन दोनों विधियों को मिलाकर बड़ी चुनौतियों का सामना करने में सक्षम होता है। उदाहरण के लिए, प्रसिद्ध अल्फ़ागो प्रणाली ने पहले पुराने खेलों का डेटा खिलाकर गो खेलना सीखा। इसके बाद इसने अपने कौशल का सम्मान किया - और सभी मनुष्यों को पीछे छोड़ दिया - खुद को बार-बार खेलकर।
शी-रा अक्षर
माइनआरएल बॉट्स ने एक समान दृष्टिकोण अपनाया, लेकिन उनके लिए उपलब्ध संसाधन तुलनात्मक रूप से सीमित थे। जबकि अल्फागो जैसे एआई एजेंटों को विशाल डेटासेट, शक्तिशाली कंप्यूटर हार्डवेयर और दशकों के प्रशिक्षण समय के बराबर बनाया गया है, माइनआरएल बॉट्स को सीखने के लिए केवल 1,000 घंटे के रिकॉर्डेड गेमप्ले के साथ एक एकल एनवीडिया ग्राफिक्स प्रोसेसर के साथ प्रशिक्षण लेना था। , और गति प्राप्त करने के लिए केवल चार दिन।
यह एमएलबी टीम के लिए उपलब्ध संसाधनों के बीच का अंतर है - कोच, पोषण विशेषज्ञ, बेहतरीन उपकरण पैसे खरीद सकते हैं - और लिटिल लीग टीम के साथ क्या करना है।
इस तरह से माइनआरएल बॉट्स को हैमस्ट्रिंग करना अनुचित लग सकता है, लेकिन ये बाधाएं एआई को वास्तविक दुनिया में एकीकृत करने की चुनौतियों को दर्शाती हैं। जबकि अल्फागो जैसे बॉट्स निश्चित रूप से एआई को प्राप्त करने की सीमा को धक्का देते हैं, बहुत कम कंपनियां और शोध प्रयोगशालाएं Google के स्वामित्व वाले डीपमाइंड के संसाधनों से मेल खा सकती हैं।
प्रतियोगिता के प्रमुख आयोजक, कार्नेगी मेलन विश्वविद्यालय के पीएचडी छात्र विलियम गस ने बतायाबीबीसी समाचारकि चुनौती यह दिखाने के लिए थी कि हर एआई समस्या को कंप्यूटिंग शक्ति को फेंक कर हल नहीं किया जाना चाहिए। गस ने कहा, यह मानसिकता, इन सुदृढीकरण सीखने की प्रणालियों तक पहुंच को लोकतांत्रिक बनाने के खिलाफ सीधे काम करती है, और जटिल वातावरण में एजेंटों को प्रशिक्षित करने की क्षमता को कम्प्यूट के साथ निगमों को छोड़ देती है।
तो जबकि एआई संघर्ष कर रहा होMinecraftअब, जब यह इस चुनौती को पार कर जाएगी, तो उम्मीद है कि यह व्यापक दर्शकों को लाभ पहुंचाएगी। बस उन गरीबों के बारे में मत सोचोMinecraftYouTubers जो नौकरी से बाहर हो सकते हैं।