ओपनएआई के एआई-पावर्ड रोबोट ने रूबिक के क्यूब को एक हाथ से हल करना सीखा
Dactyl अधिक निपुण हो जाता है

आर्टिफिशियल इंटेलिजेंस रिसर्च ऑर्गनाइजेशन ओपनएआई ने सामान्य उद्देश्य, सेल्फ-लर्निंग रोबोट बनाने की अपनी खोज में एक नया मील का पत्थर हासिल किया है। समूह के रोबोटिक्स डिवीजन का कहना है कि डैक्टिल, इसका ह्यूमनॉइड रोबोटिक हाथ पहली बार पिछले साल विकसित हुआ था, ने रूबिक के क्यूब को एक हाथ से हल करना सीख लिया है। OpenAI इस उपलब्धि को रोबोट उपांगों की निपुणता और अपने स्वयं के AI सॉफ़्टवेयर दोनों के लिए एक छलांग के रूप में देखता है, जो Dactyl को आभासी सिमुलेशन का उपयोग करके नए कार्यों को सीखने की अनुमति देता है, इससे पहले कि इसे दूर करने के लिए एक वास्तविक, शारीरिक चुनौती पेश की जाए।
Dactyl की नई प्रतिभा को प्रदर्शित करने वाले एक प्रदर्शन वीडियो में, हम देख सकते हैं कि रोबोट का हाथ अनाड़ी लेकिन सटीक युद्धाभ्यास के साथ एक पूर्ण घन हल की ओर अपना रास्ता बना लेता है। इसमें कई मिनट लगते हैं, लेकिन Dactyl अंततः पहेली को हल करने में सक्षम होता है। यह कार्रवाई में देखने के लिए कुछ हद तक परेशान करने वाला है, यदि केवल इसलिए कि आंदोलन मानव की तुलना में काफी कम तरल दिखते हैं और विशेष रूप से असंबद्ध जब प्रदर्शन पर अंधा गति और कच्ची निपुणता की तुलना मेंजब एक मानव स्पीडक्यूबर सेकंड के एक मामले में घन को हल करता है.
हैंगआउट कॉल
लेकिन OpenAI के लिए, Dactyl की उपलब्धि इसे व्यापक AI और रोबोटिक्स उद्योगों के लिए एक बहुप्रतीक्षित लक्ष्य के करीब एक कदम आगे ले जाती है: एक ऐसा रोबोट जो वास्तविक दुनिया के विभिन्न कार्यों को करना सीख सकता है, बिना महीनों से वर्षों तक प्रशिक्षण के। वास्तविक दुनिया का समय और विशेष रूप से प्रोग्राम किए जाने की आवश्यकता के बिना।

बहुत सारे रोबोट रूबिक के क्यूब्स को बहुत तेजी से हल कर सकते हैं। ओपनएआई के शोध वैज्ञानिक और रोबोटिक्स लीड पीटर वेलिंडर कहते हैं, उन्होंने वहां क्या किया और हम यहां क्या कर रहे हैं, इसके बीच महत्वपूर्ण अंतर यह है कि वे रोबोट बहुत उद्देश्य से बनाए गए हैं। जाहिर है कि किसी अन्य कार्य को करने के लिए आप उसी रोबोट या समान दृष्टिकोण का उपयोग करने का कोई तरीका नहीं है। OpenAI की रोबोटिक्स टीम की बहुत अलग महत्वाकांक्षाएँ हैं। हम एक सामान्य उद्देश्य वाला रोबोट बनाने की कोशिश कर रहे हैं। जिस तरह से मनुष्य और हमारे मानव हाथ बहुत कुछ कर सकते हैं, उसी तरह, न केवल एक विशिष्ट कार्य, हम कुछ ऐसा बनाने की कोशिश कर रहे हैं जो इसके दायरे में बहुत अधिक सामान्य हो।
वेलिंडर पिछले कुछ वर्षों में रोबोट की एक श्रृंखला का उल्लेख कर रहा है जिसने रूबिक के क्यूब को मानव हाथों और दिमाग की सीमाओं से बहुत आगे बढ़ाया है। 2016 में, सेमीकंडक्टर निर्माता Infineon ने विशेष रूप से अलौकिक गति से रूबिक के क्यूब को हल करने के लिए एक रोबोट विकसित किया, और बॉट एक सेकंड के भीतर ऐसा करने में कामयाब रहा। इसने उस समय उप-पांच-सेकंड के मानव विश्व रिकॉर्ड को कुचल दिया। दो साल बाद, MIT द्वारा विकसित एक मशीनएक घन को 0.4 सेकंड से भी कम समय में हल किया. 2018 के अंत में, एक जापानी YouTube चैनल जिसे ह्यूमन कंट्रोलर इवन कहा जाता हैअपना स्वयं का समाधान करने वाला रूबिक का घन विकसित कियाप्रोग्राम करने योग्य सर्वो मोटर्स से जुड़े 3 डी-मुद्रित कोर का उपयोग करना।
मशीनें वर्षों से रुबिक के घन को अलौकिक गति से हल करने में सक्षम हैंदूसरे शब्दों में, एक रोबोट एक विशिष्ट कार्य के लिए बनाया गया है और उस कार्य को यथासंभव कुशलता से करने के लिए प्रोग्राम किया गया है, जो आम तौर पर मानव को सर्वश्रेष्ठ कर सकता है, और रूबिक का घन समाधान कुछ ऐसा सॉफ़्टवेयर है जिसे बहुत पहले महारत हासिल है। इसलिए क्यूब को हल करने के लिए एक रोबोट विकसित करना, यहां तक कि एक ह्यूमनॉइड भी, अपने आप में इतना उल्लेखनीय नहीं है, और धीमी गति से Dactyl संचालित होता है।
लेकिन OpenAI का Dactyl रोबोट और सॉफ्टवेयर जो इसे शक्ति देता है, एक समर्पित क्यूब-सॉल्विंग मशीन की तुलना में डिज़ाइन और उद्देश्य में बहुत भिन्न हैं। जैसा कि वेलिंडर कहते हैं, OpenAI के चल रहे रोबोटिक्स कार्य का उद्देश्य संकीर्ण कार्यों में बेहतर परिणाम प्राप्त करना नहीं है, क्योंकि इसके लिए केवल आपको एक बेहतर रोबोट विकसित करने और उसके अनुसार प्रोग्राम करने की आवश्यकता है। यह आधुनिक कृत्रिम बुद्धि के बिना किया जा सकता है।
इसके बजाय, Dactyl को जमीन से एक स्व-शिक्षण रोबोटिक हाथ के रूप में विकसित किया गया है जो एक मानव की तरह नए कार्यों तक पहुंचता है। इसे ऐसे सॉफ़्टवेयर का उपयोग करके प्रशिक्षित किया जाता है, जो इस समय प्राथमिक तरीके से, उन लाखों वर्षों के विकास को दोहराने की कोशिश करता है, जो हमें बच्चों के रूप में सहज रूप से अपने हाथों का उपयोग करना सीखने में मदद करते हैं। यह एक दिन हो सकता है, OpenAI उम्मीद करता है, मानवता को ह्यूमनॉइड रोबोट के प्रकार विकसित करने में मदद करता है जिसे हम केवल विज्ञान कथा से जानते हैं, रोबोट जो हमें खतरे में डाले बिना समाज में सुरक्षित रूप से काम कर सकते हैं और शहर की सड़कों और कारखाने के फर्श के रूप में अराजक वातावरण में विभिन्न प्रकार के कार्य कर सकते हैं। .
रूबिक के घन को एक हाथ से हल करने का तरीका जानने के लिए, OpenAI ने खिलौने को हल करने के लिए Dactyl को स्पष्ट रूप से प्रोग्राम नहीं किया;इंटरनेट पर मुफ्त सॉफ्टवेयरआपके लिए ऐसा कर सकता है। इसने हाथ के प्रदर्शन के लिए अलग-अलग गतियों को प्रोग्राम नहीं करना भी चुना, क्योंकि वह चाहता था कि वह उन आंदोलनों को स्वयं ही समझ सके। इसके बजाय, रोबोटिक्स टीम ने हाथ के अंतर्निहित सॉफ़्टवेयर को एक तले हुए क्यूब को हल करने का अंतिम लक्ष्य दिया और आधुनिक एआई का उपयोग किया - विशेष रूप से प्रोत्साहन-आधारित गहन शिक्षण का एक ब्रांड जिसे सुदृढीकरण सीखना कहा जाता है - इसे अपने आप ही पता लगाने की दिशा में मदद करने के लिए। एआई एजेंटों को प्रशिक्षित करने का एक ही तरीका है कि कैसे OpenAIअपना विश्व स्तर विकसित कियाडोटा 2बीओटी.
लेकिन हाल तक, एआई एजेंट को वस्तुतः कुछ करने के लिए प्रशिक्षित करना बहुत आसान रहा है - उदाहरण के लिए, कंप्यूटर गेम खेलना - वास्तविक दुनिया के कार्य को करने के लिए इसे प्रशिक्षित करने की तुलना में। ऐसा इसलिए है क्योंकि आभासी दुनिया में कुछ करने के लिए प्रशिक्षण सॉफ्टवेयर को तेज किया जा सकता है, ताकि एआई वास्तविक दुनिया के कुछ ही महीनों में हजारों वर्षों के प्रशिक्षण के बराबर खर्च कर सके, हजारों उच्च अंत सीपीयू और अल्ट्रा के लिए धन्यवाद समानांतर में काम कर रहे शक्तिशाली जीपीयू।
भौतिक रोबोट के साथ शारीरिक कार्य करने के समान स्तर का प्रशिक्षण करना संभव नहीं है। यही कारण है कि OpenAI वास्तविक दुनिया के स्थान पर नकली वातावरण का उपयोग करके रोबोट प्रशिक्षण के नए तरीकों को आगे बढ़ाने की कोशिश कर रहा है, कुछ ऐसा जिसे रोबोटिक्स उद्योग ने मुश्किल से ही प्रयोग किया है। इस तरह, सॉफ्टवेयर एक साथ कई अलग-अलग कंप्यूटरों में त्वरित गति से व्यापक रूप से अभ्यास कर सकता है, इस उम्मीद के साथ कि जब वह वास्तविक रोबोट को नियंत्रित करना शुरू करता है तो वह उस ज्ञान को बरकरार रखता है।
OpenAI का Dactyl रोबोटिक हाथ AI सॉफ़्टवेयर द्वारा संचालित हैप्रशिक्षण की सीमा और स्पष्ट सुरक्षा चिंताओं के कारण, आज व्यावसायिक रूप से उपयोग किए जाने वाले रोबोट एआई का उपयोग नहीं करते हैं और इसके बजाय बहुत विशिष्ट निर्देशों के साथ प्रोग्राम किए जाते हैं। जिस तरह से अतीत में संपर्क किया गया है वह यह है कि आप कार्यों को हल करने के लिए बहुत विशिष्ट एल्गोरिदम का उपयोग करते हैं, जहां आपके पास रोबोट और जिस वातावरण में आप काम कर रहे हैं, दोनों का सटीक मॉडल है, वेलिंडर कहते हैं। फ़ैक्टरी रोबोट के लिए, आपके पास उनमें से बहुत सटीक मॉडल हैं और आप वास्तव में उस वातावरण को जानते हैं जिस पर आप काम कर रहे हैं। आप ठीक-ठीक जानते हैं कि यह विशेष भाग को कैसे उठाएगा।
यही कारण है कि वर्तमान रोबोट मनुष्यों की तुलना में बहुत कम बहुमुखी हैं। रोबोट को पुन: प्रोग्राम करने के लिए बड़ी मात्रा में समय, प्रयास और धन की आवश्यकता होती है, जो कुछ और करने के लिए ऑटोमोबाइल या कंप्यूटर घटक के एक विशिष्ट हिस्से को इकट्ठा करता है। एक ऐसा रोबोट पेश करें जिसे ठीक से प्रशिक्षित नहीं किया गया है, यहां तक कि एक साधारण कार्य भी जिसमें मानव निपुणता या दृश्य प्रसंस्करण का कोई भी स्तर शामिल है और यह बुरी तरह विफल हो जाएगा। आधुनिक एआई तकनीकों के साथ, हालांकि, रोबोटों को मनुष्यों की तरह बनाया जा सकता है, ताकि वे दुनिया की समान सहज समझ का उपयोग करके दरवाजे खोलने से लेकर अंडा तलने तक सब कुछ कर सकें। कम से कम, यही सपना है।
हम अभी भी उस स्तर के परिष्कार से दशकों दूर हैं, और एआई समुदाय ने सॉफ्टवेयर की तरफ से जो छलांग लगाई है - जैसे सेल्फ-ड्राइविंग कार, मशीन ट्रांसलेशन और इमेज रिकग्निशन - का अगली पीढ़ी के रोबोट में बिल्कुल अनुवाद नहीं किया गया है। अभी, OpenAI केवल एक मानव शरीर के अंग की जटिलता की नकल करने और उस रोबोटिक एनालॉग को अधिक स्वाभाविक रूप से संचालित करने के लिए प्राप्त करने की कोशिश कर रहा है।
यही कारण है कि Dactyl एक 24-संयुक्त रोबोटिक हाथ है जिसे मानव हाथ के बाद बनाया गया है, न कि पंजा या पिनर शैली के रोबोटिक ग्रिपर के बजाय जो आप कारखानों में देखते हैं। और उस सॉफ़्टवेयर के लिए जो Dactyl को यह सीखने की शक्ति देता है कि उन सभी जोड़ों का उपयोग एक मानव तरीके से कैसे किया जाए, OpenAI ने भौतिक घन को हल करने की कोशिश करने से पहले सिमुलेशन में हजारों वर्षों के प्रशिक्षण के माध्यम से इसे रखा।

यदि आप वास्तविक दुनिया के रोबोट पर चीजों को प्रशिक्षित कर रहे हैं, तो जाहिर है कि आप जो कुछ भी सीख रहे हैं वह उस पर काम कर रहा है जिस पर आप वास्तव में अपने एल्गोरिदम को तैनात करना चाहते हैं। इस तरह, यह बहुत आसान है। लेकिन एल्गोरिदम को आज बहुत अधिक डेटा की आवश्यकता है। एक वास्तविक दुनिया के रोबोट को प्रशिक्षित करने के लिए, कुछ भी जटिल करने के लिए, आपको कई वर्षों के अनुभव की आवश्यकता होती है, वेलिंडर कहते हैं। एक इंसान के लिए भी, इसमें कुछ साल लगते हैं, और इंसानों के पास हाथ चलाने की सीखने की क्षमता होने के लिए लाखों साल का विकास होता है।
मोबाइल फोन में फेसबुक साइन इन करें
एक सिमुलेशन में, हालांकि, वेलिंडर का कहना है कि प्रशिक्षण को तेज किया जा सकता है, जैसे कि गेम-प्लेइंग और एआई बेंचमार्क के रूप में लोकप्रिय अन्य कार्यों के साथ। एल्गोरिथम को प्रशिक्षित करने में हजारों वर्षों का समय लगता है। लेकिन इसमें केवल कुछ दिन लगते हैं क्योंकि हम प्रशिक्षण को समानांतर कर सकते हैं। उन्होंने आगे कहा कि आपको रोबोट को तोड़ने या किसी को चोट पहुंचाने के बारे में चिंता करने की ज़रूरत नहीं है क्योंकि आप इन एल्गोरिदम को प्रशिक्षित कर रहे हैं। फिर भी शोधकर्ताओं को अतीत में भौतिक रोबोट पर काम करने के लिए आभासी प्रशिक्षण प्राप्त करने की कोशिश में काफी परेशानी हुई है। ओपनएआई का कहना है कि यह वास्तव में इस संबंध में प्रगति देखने वाले पहले संगठनों में से एक है।
जब इसे एक वास्तविक घन दिया गया, तो Dactyl ने इसका उपयोग करने के लिए अपना प्रशिक्षण दिया और इसे अपने आप हल किया, और इसने विभिन्न परिस्थितियों में ऐसा किया जिसके लिए इसे कभी भी स्पष्ट रूप से प्रशिक्षित नहीं किया गया था। इसमें एक दस्ताने के साथ एक हाथ से क्यूब को हल करना शामिल है, इसकी दो अंगुलियों को एक साथ टेप किया गया है, और जबकि OpenAI के सदस्यों ने इसे अन्य वस्तुओं के साथ पोक करके और बुलबुले और कंफ़ेद्दी जैसे कागज के टुकड़ों के साथ बौछार करके लगातार इसमें हस्तक्षेप किया।
OpenAI ने वास्तविक दुनिया में अपने कौशल का परीक्षण करने से पहले सिमुलेशन का उपयोग करके हजारों वर्षों तक Dactyl को प्रशिक्षित कियाहमने पाया कि उन सभी परेशानियों में, रोबोट अभी भी रूबिक के घन को सफलतापूर्वक घुमाने में सक्षम था। लेकिन प्रशिक्षण में ऐसा नहीं हुआ, वेलिंडर के साथी ओपनएआई की रोबोट टीम लीड मैथियास प्लापर्ट कहते हैं। जब हमने इसे भौतिक रोबोट पर आजमाया तो हमें जो मजबूती मिली, वह हमारे लिए आश्चर्यजनक थी।
यही कारण है कि OpenAI Dactyl के नए अर्जित कौशल को रोबोटिक हार्डवेयर की उन्नति और AI प्रशिक्षण दोनों के लिए समान रूप से महत्वपूर्ण मानता है। यहां तक कि दुनिया के सबसे उन्नत रोबोट, जैसे कि ह्यूमनॉइड और कुत्ते जैसे बॉट, जो उद्योग के नेता बोस्टन डायनेमिक्स द्वारा विकसित किए गए हैं, स्वायत्त रूप से काम नहीं कर सकते हैं, और उन्हें व्यापक कार्य-विशिष्ट प्रोग्रामिंग और यहां तक कि बुनियादी कार्यों को करने के लिए लगातार मानव हस्तक्षेप की आवश्यकता होती है।
OpenAI का कहना है कि Dactyl उस तरह के रोबोट की दिशा में एक छोटा लेकिन महत्वपूर्ण कदम है जो एक दिन मैन्युअल श्रम या घरेलू कार्य कर सकता है और यहां तक कि बंद-बंद वातावरण के बजाय मनुष्यों के साथ काम कर सकता है, बिना किसी स्पष्ट प्रोग्रामिंग के उनके कार्यों को नियंत्रित करता है।
भविष्य के लिए उस दृष्टि में, रोबोटों के लिए नए कार्यों को सीखने और बदलते परिवेशों के अनुकूल होने की क्षमता एआई के लचीलेपन के बारे में उतनी ही होगी जितनी कि भौतिक मशीन की मजबूती के बारे में है। प्लैपर्ट कहते हैं, ये विधियां वास्तव में प्रदर्शित करना शुरू कर रही हैं कि ये सभी अंतर्निहित जटिलताओं और भौतिक दुनिया की गड़बड़ी से निपटने के समाधान हैं।