• بانی: میرخلیل الرحمٰن
  • گروپ چیف ایگزیکٹووایڈیٹرانچیف: میر شکیل الرحمٰن
ری اِنفورسمنٹ لرننگ مصنوعی ذہانت کی ایک شاخ

ری اِنفورسمنٹ لرننگ طریقۂ کار کے تحت کمپیوٹر دیگر ہینڈ کوڈِڈ کمپیوٹرز کی طرز پر بتائی جانیوالی مثالوں کے تحت نہیں سیکھتا بلکہ اس طریقہ کے تحت کمپیوٹر ازخود تجربات کرتا اور غلطیوں کی اصلاح کرتا ہے اور ضرورت کے مطابق اپنی پروگرامنگ میں تبدیلیاں بھی کر سکتا ہے تاکہ وہ مطلوبہ بہترین نتائج حاصل کر سکے۔ اس کا سادہ سا مطلب یہ ہوا کہ کمپیوٹرز خود تجربے کرکے ایسے کام کرنا سیکھ رہے ہیں، جو کوئی پروگرامر انھیں نہیں سِکھا سکا۔ ری انفورسمنٹ لرننگ، مصنوعی ذہانت کی ٹیکنالوجی کی ایک شاخ ہے، جو اس وقت خود کار یعنی بغیر ڈرائیور کے چلنے والی گاڑیوں میں آزمائی جارہی ہے۔

بغیر ڈرائیور چلنے والی گاڑیوں کےلیے مخصوص الگورتھم اور کمپیوٹر پروگرامنگ کی ضرورت ہوتی ہے، تاہم متذکرہ بالا گاڑیوں کے لیے کسی کمپیوٹر پروگرامنگ کی ضرورت نہیں ہو گی بلکہ یہ گاڑیاں ازخود اپنے تجربات سے سبق سیکھیں گی اور صورتحال سے ری انفورسمنٹ لرننگ کے طریقہ کے تحت عہدہ برآ ہوں گی۔ ان گاڑیوں کے لیے سیفٹی سسٹم اسرائیلی کمپنی Mobileye کی جانب سے تیار کیا گیا ہے۔ یہ کمپنی کئی معروف کارساز اداروں کے لیے بھی کام کر رہی ہے، جن میں بی ایم ڈبلیو بھی شامل ہے۔ خودکار ڈرائیونگ کے معاملے میں بنیادی مقصد یہ ہے کہ گاڑی اپنے سواروں کو گنجان شاہراہوں اور ہائی ویز سے بحفاظت منزل مقصود تک پہنچا سکے، اس کے لیے اس طرح کی تکنیک ضروری ہے جس کے تحت کمپیوٹر مؤثر تربیتوں سے اپنی کارکردگی کو بہتر بنا سکے اور اپنے اندر سپر ہیومن جیسی صلاحیتیں پیدا کر سکے۔ اس حوالے سے امریکن سینٹر آف موبیلٹی کے ڈائریکٹر جیمز میڈوکس کا کہنا ہے کہ بغیر ڈرائیور چلنے والی گاڑیوں کے لیے سب سے بڑا چیلنج یہ ہے کہ وہ انسان جو گاڑیاں چلا رہے ہیں ،اس کے ساتھ کس طرح انٹرایکشن رکھتے ہیں۔ ایسی گاڑیوں کے لیے ضروری ہے کہ وہ ناصرف ماحول سے تربیت حاصل کریں، بلکہ شاہراہوں پر گاڑیاں چلانے والے انسانوں کے تجربات سے بھی استفادہ کریں۔

ری انفورسمنٹ لرننگ کے تحت ماضی میں بھی کافی مثبت نتائج سامنے آئے ہیں۔ پچھلے سال ’الفابیٹ‘ نامی کمپنی کی ایک ذيلی کمپنی نے، جس کا نام ’ڈیپ مائنڈ‘ہے، اسی تکنیک کی مدد سے گو (Go) نامی بورڈ گیم کھیلنا سیکھا تھا اور دنیا کے بہترین انسانی کھلاڑی کو شکست دی تھی، جس کے بعد اب اسے خود کار گاڑیوں میں آزمایا جارہا ہے۔ یہ ٹیکنالوجی روبوٹس کو ان چیزوں تک کی نشاندہی کرسکتی ہے، جو انھوں نے کبھی دیکھی بھی نہ ہوں۔ اس کے علاوہ، ان کے لیے کسی ڈيٹا سینٹر کے آلات کی بہترین کانفیگریشن نکالنا بھی ممکن ہوگا۔

ری اِنفورسمنٹ لرننگ مصنوعی ذہانت کی ایک شاخ

ری انفورسمنٹ لرننگ کو کامیاب بنانے کے لیے ریسرچرز ہر صحیح یا غلط قدم کی ایک ویلیو متعین کرتے ہیں، جسے ایک بڑے سے ٹیبل میں درج کیا جاتا ہے۔ کمپیوٹر جیسے جیسے سیکھتا رہتا ہے، وہ اس ٹیبل میں ردوبدل کرتا رہتا ہے۔ اگر کوئی کام بہت زیادہ پیچیدہ ہو، تو ایک وقت ایسا آتا ہے، جب یہ پراسیسنگ مزید قابل عمل نہیں رہتی ہے۔ تاہم پچھلے چند برسوں میں ڈیپ لرننگ کی مدد سے ڈيٹا کے پیٹرنز کی نشاندہی آسان ہوگئی ہے۔

ڈیپ مائنڈ نے گیمز کے شعبے میں اپنا نام کمایا تھا۔ 2013ء میں انھوں نے ایک ایسے پروگرام کی تفصیلات شائع کی تھیں، جو کسی سپرہیومن کی طرح ویڈیو گیمز کھیل سکتا تھا، جس کے بعد گوگل نے 2014ء میں50کروڑ ڈالر کے عوض اس کمپنی کو خریدلیا۔ اس کے بعد دوسرے ریسرچرز اور کمپنیوں نے ہمت پکڑی اور ان کی توجہ ری انفورسمنٹ لرننگ کی طرف چلی گئی۔ اب صنعتی روبوٹ بنانے والی کئی کمپنیاں، مشینوں کو مینیول پروگرامنگ کے بغیر کام کرنا سکھا رہی ہیں۔ اس کے علاوہ، گوگل کے ریسرچرز، ڈیپ مائنڈ کی مدد سے اپنے ڈيٹا سینٹرز کو بہتر طور پر توانائی استعمال کرنا سکھا رہے ہیں۔ ڈیٹا سینٹر کے پرزے، توانائی کے استعمال کو کس طرح متاثر کریں گے؟ اس وقت اس سوال کا جواب نہیں دیا جاسکتا۔ تاہم ایک ری انفورسمنٹ لرننگ کا الگارتھم، سِیمولیشن کے ڈیٹا سے تربیت حاصل کرکے زیرِ استعمال سسٹمز کے متعلق مشورے ضرور فراہم کرسکتا ہے۔

ری اِنفورسمنٹ لرننگ مصنوعی ذہانت کی ایک شاخ

اس کے باوجود، ابھی بھی ری انفورسمنٹ لرننگ کی راہ میں رکاوٹیں پوری طرح ختم نہیں ہوئی ہیں۔ چینی کمپنی بیدو کے چیف سائنسدان اینڈریو نگ (Andrew Ng) کہتے ہیں کہ ان سسٹمز کے لیے وافر مقدار میں ڈیٹا درکار ہے اور یہ صرف اسی وقت کامیاب ثابت ہوا ہے، جب اسے سیمولیشنز میں مشق کرنے کا موقع ملا ہے۔ پیچیدہ مسائل کے حل کے لیے ریسرچرز ری انفورسمنٹ لرننگ کو استعمال کرنے کے طریقۂ کار ڈھونڈنے میں لگے ہوئے ہیں۔ موبل آئی کو بھی اپنے پروٹوکولز میں مزید ردوبدل کرنا پڑے گا، تاکہ ایک ایسی خودکار گاڑی جو حادثات سے بچنے میں ماہر ہو، دوسروں کے لیے حادثوں کی وجہ نہ بنے۔

پاکستان میں انجنیئرنگ اور سائنس کی اعلیٰ تعلیم دینے والے اداروں اور طالب علموں کو ری انفورسمنٹ لرننگ سمیت مصنوعی ذہانت کی ٹیکنالوجی میں ہر آئے روز آنے والی پیش رفت پر نظر رکھنا ہوگی، تاکہ وہ خودکو ایسے مستقبل کے لیے بہتر طور پر تیار کر سکیں، جہاں ہر کام مصنوعی ذہانت کی مدد سے کمپیوٹرز اور روبوٹس سے لیا جارہا ہوگا۔

تازہ ترین