لینگوج انجینئرنگ

July 21, 2024

قاضی آصف

پاکستان میں کمپیوٹنگ سافٹ ویئر میں جو ترقی ہو رہی ہے اس میں لینگویج انجینئرنگ بھی شامل ہے۔ ویسے تو آپ نے انجینئرنگ کے مختلف شعبے سنے ہوں گے لیکن لینگویج انجنیئرنگ کا شعبہ ہمارے یہاں عام نہیں، مگر دنیا میں تیزی سے ترقی کر رہا ہے۔ اب خوش قسمتی سے یہ کام پاکستان میں بھی شروع ہوگیا ہے، جس سے پاکستان میں مروج زبانیں کمپیوٹنگ کی دنیا میں بھی ترقی کرپائیں گی۔

لینگویج انجینئرنگ کیا ہے؟

ضروری ہے کہ آگے بڑھنے سے پہلے اس نقطے کو واضح کیا جائے۔ لینگویج (زبانوں کی )انجینئرنگ کا تعلق کمپیوٹر میں استعمال ہونے والی تیکنیک سے ہے۔ اس کو مزید واضح اس طرح سے کیا جا سکتا ہے کہ لینگویج انجینئرنگ کا ایک حالیہ رجحان مشینوں ، کمپیوٹر، مصنوعی ذہانت میں زبانوں کو قابل استعمال بنانا اور الفاظ ، جملوں، خیال کی تخلیق، ان کو محفوظ بنانا اور مختلف مراحل سے گذار کر ٹیکنالوجیز کے لیے قابل استعمال بنانا ہے۔

گوگل جو مختلف زبانوں میں تراجم کرتے ہیں یا زبانوں کے الفاظ کو تحریر کی شکل دیتے ہیں یا مشینیں کسی بھی زبان میں تحریری یا زبانی ہدایات پر عمل کرتی ہیں، وہ زبانوں کی انجنیئرنگ کا ہی نتیجہ ہے۔ یہ آسان کام نہیں،کیوں کہ کمپیوٹر یا مشینیں بنیادی طور پر کوئی زبان نہیں جا نتی بلکہ وہ فقط کمپیوٹرز کے مخصوص کوڈز کو پہنچاتی ہیں۔

ان کوڈز کی مدد سے ہی کمپیوٹرز یا مشینوں کو کوئی بھی زبان سکھائی جاتی ہے، جس کی بنیاد پر کمپیوٹرز یا مشینیں وہ زبان تحریر یا بول سکتی ہیں، مختلف زبانوں کے الفاظ کو سمجھ کر ترجمہ کر سکتی ہیں۔

جہاں گوگل نے اپنے ترجمہ کاری کے سرشتے میں مصنوعی ذہانت کو استعمال کرتے ہوئے کئی زبانوں کے ماڈلز بنا کران کوبغیر انٹرنیٹ یعنی آف لائن بھی ترجمہ کے قابل بنا دیا ہے۔ ان میں پاکستان کی زبانوں میں اردو اور سندھی بھی شامل ہے۔ گوگل نے نئے ترجمہ کاری کے نظام کو مصنوعی ذہانت کی مدد دی ہے، جس سے ترجمہ کاری کا معیار بہت بلند ہوگیا ہے۔ مثال کے طور پر پہلے گوگل ایک ایک الفاظ کا ترجمہ کرکے پھر کمیونٹی کی جانب سے ماڈل کے طور پر دیئے گئے جملوں کی تشکیل گرامر کے الفاظ کی ترتیب سے جملے ادھار لے کرترجمہ کرتے تھی۔

یہ طریقہ اتنا قابل بھروسہ نہیں ہوتا تھا۔ اس سے اکثر جملوں کے تراجم غلط ہوتے تھے۔ لیکن اب گوگل آپ پانچ ہزار الفاظ پر مشتمل کسی بھی مضمون کے پورے متن کو پہلے سے موجود معنائوں سے مدد لیکر،پھر انٹرنیٹ پر موجود ڈیٹا بیس سے ملنے والے جملوں سے موازنہ کرکے، پھرمصنوعی ذہانت سے کے ذریعے ترجمہ مکمل کرکے آپ کے سامنے رکھتا ہے۔

ترجمے کو یہ پورا لمبا اور پیچیدہ سفرایک سیکنڈ کے پچاسویں حصے میں مکمل ہوتا ہے۔ گوگل پوری دنیا میں آپ کی طرح تقریبا ًتین ارب افراد کے ساتھ اسی سیکنڈ کے حساب سے کام کرتا ہے۔ ابھی تک ترقی یافتہ ممالک میں بڑی زبانوں کی لینگویج انجینئرنگ کی جاتی رہی تھی لیکن مصنوعی ذہانت کے بعد دنیا میں لینگویج انجینئرنگ کی ضرورت اور اہمیت اور بھی بڑھ گئی ہے۔

ہم پاکستان اور دنیا میں اردو، سندھی، پشتو زبانوں کوچاردہائیوں سے کمپیوٹر پر تحریر کرتے آئے ہیں۔ لیکن جدید زمانے میں زبانوں کو مشینوں کے قابل استعمال بنانے کے لیےمزید اقدامات کی سخت ضرورت محسوس ہونے لگی۔ خوش قسمتی سے پاکستان میں اس ضرورت کو محسوس کرتے ہوئے اردو اور سندھی زبانوں کی لینگویج انجینئرنگ اور کمپیوٹنگ میں زبانوں کے استعمال کی آگہی کیلئے ادارے قائم ہوچکے ہیں۔

لیکن ان کی تعداد فقط دو ہے۔ لاہور کی ایک یونیورسٹی میں قائم مرکز تحقیقات لسانیات اردو اور دیگر زبانوں کا کمپیوٹنگ انسٹیٹیوٹ ہے، جب کہ دوسرا حکومت سندھ کی جانب سے محکمہ کلچر، ٹوئرزم، اینٹی کیوٹی اور آرکائیور کی جانب سے عبدالماجد بھرگڑی انسٹیٹیوٹ آف لینگویج انجینئرنگ (ایمبل) ہے۔ یہ انسٹیٹیوٹ محکمہ ثقافت کے پی ڈی ایم آئی سیل کی جانب سے قائم کیا گیا ہے۔

لاہور کی یونیورسٹی میں قائم اردو لینگویج انجینئرنگ کے انسٹیٹیوٹ میں اردو زبان کے جن نکات پر تحقیق ہو رہی ہے ۔ مرکز تحقیقات لسانیات (CLE)،مرکز لینگویج پروسسنگ کی قومی اور بین الاقوامی سطح پر ترقی کے لئے سیمینار، ورکشاپ اور کانفرنس کے مؤثر انعقاد کرانے اور حصہ لینے میں بڑا سرگرم ہے۔

یہ کام متعلقہ زبانوں میں کمپیوٹنگ کی ترقی کا موجب ہو گا۔CLE کا مقصد مقامی آبادی کے لئے ان کی مقامی زبانوں میں معلومات تک رسائی اور ابلاغ کے مواقع فراہم کرنا ہےاور انہیں اس قابل بنانا ہے کہ وہ اپنے سماجی و معاشی فائدے کے لئے انفارمیشن اور کمیونیکیشن ٹیکنالوجی کا زیادہ سے زیادہ استعمال کر سکیں۔ CLE کے پاس گریجویٹ طلباء اور کل وقتی ریسرچ اسٹاف کی سرگرم ٹیم ہے، جس میں ماہر لسانیات، ماہر سماجیات، کمپیوٹر سائنسدان اور انجینئر شامل ہیں جو ان مقاصد کے حصول کے لئے کوشاں ہیں۔ یہ ادارہ لینگویج کمپیوٹنگ کی تحقیقات میں بڑا اہم کام کر رہا ہے۔

ایمبل کا کام ریسرچ کے ساتھ کمپیوٹنگ لینگویج کی پراڈکٹس بھی بناناہے۔ جو بغیر کسی ادائیگی کے ان کی ویب سائیٹ سے مفت ڈائون لوڈ کی جا سکتی ہیں۔یہ ادارہ 2021 ء میں قائم کیا گیا، اس ادارے نے جو کام کیے ہیں وہ تیسری دنیا کے غریب ملک پاکستان کے صوبہ سندہ کی زبان کو کمپیوٹر، مصنوعی ذہانت کے حوالے سے دنیا کی ترقی یافتہ زبانوں میں لا کھڑا کیا ہے۔ اب سندھی زبان کمپیوٹر کی زبان بن چکی ہے، جس میں سندھی زبان کو گوگل ٹرانسلیشن کے ذریعے دنیا کی کسی بھی زبان میں ترجمہ کیا جا سکتا ہےاور دنیا کی کسی بھی زبان کی تحریر کو سندھی میں مشینی ترجمہ ہو سکتا ہے۔

کمپیوٹر کا مدر بورڈ دنیا کے کسی بھی حصے میں کسی بھی کمپیوٹر لیپ ٹاپ اور موبائل فون پر سندھی زبان تحری کی جا سکتی ہے، اس کا استعمال کیا جا سکتا ہے۔ عبدالماجد بھرگڑی انسٹیٹیوٹ آف لینگویج انجینئرنگ ایکٹ15جون 2021ء کو سندھ اسمبلی سے پاس کیا گیا۔ ادارے کے قیام کے بعد سندھی زبان کو کمپیوٹنگ میں جدید ضروریات پورا کرنے کے لیے بیک وقت بہت سے منصوبے شروع کئے گئے، جس کے نتیجے میں گذشتہ سال سندھی زبان کو مشینی سسٹم میں لانے کے لیےاہم کامیابیاں ہوئی ہیں۔ جن میں مائیکروسوفٹ کے ترجمہ کاری کے سسٹم میں سندھی زبان کا شامل ہونا ہے۔ اب سندھی زبان کو مصنوعی ذہانت میں داخل کرنے کے لیے تیکنیکی کوششیں کی جا رہی ہیں۔

اردو اور سندھی پاکستان کی دو وہ زبانیں ہیں جن کو لینگویج انجینئرنگ کے ادارے موجود ہیں اور کمپوٹنگ کی دنیا میں روز بروز ترقی کر رہی ہے۔ وہ دن دور نہیں جب دونوں زبانوں کو روباٹس سمجھیں گے بھی اور استعمال بھی کریں گے۔ روبوٹس سے اردو اور سندھی میں بات چیت کرسکیں گے۔ فقط اردو اورسندھی نہیں بلکہ پاکستان کی تمام ترلکھنے پڑھنے کے قابل زبانوں کو کمپیوٹر پر منتقل کرکے، مصنوعی ذہانت سے مانوس کیا جا سکتا ہے۔

اس ضمن میں متعلق اداروں کو آگے آکر اپنا کردار ادا کرنا پڑے گا، جس سے پاکستان کی تمام لکھنے،پڑھنے اور بولی جانے والی زبانیں ترقی کرکے عوام کو مزید آگے لانے اور دنیا کے ساتھ ہم قدم ہونے کی راہ پر گامزن کیا جا سکتا ہے۔

پاکستان میں قائم لینگویج انجنیئرنگ کے دو اداروں سے مدد لے کر ایسے مزید ادارے قائم کیے جا سکتے ہیں،کیوں کہ جدید دنیا میں ٹیکنالوجی کی ترقی سے ہم رکاب ہونے کے لیے لینگویج انجنیئرنگ کی طرف آنا پڑے گا۔ اس ضمن میں پاکستان میں قائم جامعات اہم کردار ادا کر سکتی ہیں۔