• بانی: میرخلیل الرحمٰن
  • گروپ چیف ایگزیکٹووایڈیٹرانچیف: میر شکیل الرحمٰن

دنیا کی ٹاپ آن لائن کامرس کمپنیاں ایمیزون اور وال اسٹریٹ روزانہ ہزاروں کسٹمر ٹرانزیکشنز کرتی ہیں جبکہ فیس بک، ٹوئٹر، یو ٹیوب، انسٹاگرام جیسے مقبول عام میڈیا پر250 پیٹابائٹس سے زائد ڈیٹا روزانہ ہر ایک گھنٹے میں شامل ہو رہا ہے۔ کاروبار اور سائنسی تحقیق نیز جرائد و اخبارات سے معلومات کی ترسیل پر مبنی وسیع مواد پالیسی سازی، تحقیق اور معاشرتی رجحانات میں اہم کردار ادا کر رہا ہے۔ ڈیٹا انجینئرز اس مواد کو ڈیٹا سائنس پراجیکٹس میں استعمال کر رہے ہیں تاکہ کریٹیکل تھنکنگ کو پروان چڑھایا جائے اور بڑھتی معلومات کو کارآمد بناتے ہوئے تحقیق اور اعدادوشمار کی تشکیل میں اس کا استعمال کیا جائے۔ سوشل میڈیا، آن لائن آکشن سائٹس، انشورنس، ہیلتھ کیئر، انرجی، پولیٹیکل پولنگ، موسم کی پیشگوئی، تعلیم، سیاحت اور فنانس میں ڈیٹا سائنس کا استعمال بڑھ رہا ہے۔

ڈیٹا سائنس اور ڈیٹا انجینئرنگ، ایک محفوظ کیریئر

ڈیٹا سائنس تحریر و تصاویر، تقریر و مباحث یعنی آڈیو اور ویڈیو کے وسیع تر مواد کو پروسیس اور ریسورس آپٹمائزیشن کے ذریعے کاروبار، سرمایہ کاری، صحت، لائف اسٹائل اور سماجی زندگی بہتر بنانے میں معاون ہوتی ہے۔ کسی بھی معلومات کے جائزے کے اس عمل میں آپ خام مواد (Raw Data)کو کمپیوٹیشنل طریقوں سے پروسیس کرکے قیمتی اور قابل عمل معلومات حاصل کرتے ہیں۔ ڈیٹا انجینئرنگ میں وسیع معلومات کے سائز، ورائٹی اور ولاسٹی کا جائزہ لے کر کارآمد معلومات تک رسائی حاصل کی جاتی ہے۔ اس طرح ڈیٹا سائنسدان اور ڈیٹا انجینئرتین ڈیٹا ورائٹیز پر کام کرتے ہیں۔ سب سے پہلے اسٹرکچرڈ ڈیٹا کا جائزہ لے کرنتائج حاصل کیے جاتے ہیں۔ یہ منظم مواد پرنٹ، الیکٹرانک اور سوشل میڈیا کی جملہ معلومات سےملتا ہے۔ دوسری قسم اَن اسٹرکچرڈ ڈیٹا یعنی غیر منظم مواد کی ہے۔ یہ مواد ریکارڈ کی صورت انسانی سرگرمیوں سے ملتا ہے۔ تیسری قسم سیمی اسٹرکچر ڈیٹا یعنی نیم منظم موادپر مشتمل ہے ۔ یہ منظم مواد کو الگ الگ فائلز میں بانٹنے سے حاصل ہوتا ہے۔

آن لائن ریسورسز اور کتابوں کے ڈیٹا کو جاننے کے لئے تربیت کی ضرورت پڑے گی تاکہ معلومات کے انتہائی وسیع مواد میں سے مطلوبہ مواد کا انتخاب کیا جاسکے۔ ڈیٹا سائنس دنیا دیکھنے کی روایتی سوچ میں تبدیلی لا کر خود کو انفرادیت کے ہنر میں ڈھالنے کا نام ہے، جس کے لیے آپ کو ریاضی و شماریات کی تجزیاتی ذہانت کو استعمال میں لانا ہو گا۔ ڈیٹا پر کام کرنے کے لئے کوڈ اسکلز اور اپنے شعبے میں مہارت ہونا لازمی ہے۔ نت نئی باتوں کو سیکھنے کی لگن سے ڈیٹا سائنس کی مشکل وادی میں اتر کرملکی و غیرملکی کمپنیوں میںڈیٹا سائنٹسٹ، ڈائریکٹر ڈیجیٹل انالسٹ، کلینیکل ڈیٹا سائنٹسٹ، جیو انجینئر ڈیٹا سائنٹسٹ، جیو اسپیٹئل انالیٹکس ڈیٹا سائنٹسٹ، ویٹیل پرسنلائزیشن ڈیٹا سائنٹسٹ اور فارماکو میٹرکس میں کلینیکل انفارمیٹکس انالسٹ جیسی اہم ملازمتیں حاصل کر کے کیریئر کو محفوظ بنایا جاسکتا ہے۔

مواد کا استعمال، تجزیہ اور نتائج

معلوماتی مواد تک رسائی کے کئی پلیٹ فارمز ہیں، جس میں کلائوڈ پر مبنی پلیٹ فارم بھی دستیاب ہے۔ اس کے لئے آپ کو اسٹرکچرڈ کوانری لینگویج (SQL) یا پائتھون (Python)کی سب سے زیادہ ضرورت پڑے گی۔ ان کے ذریعے آپ بین الاقوامی سطح پر منظور شدہ فارمیٹس میں مواد کا تجزیہ کر کے نتائج تک پہنچ سکتے ہیں۔ ان فارمیٹس میں سب سے معروفCSVفائلز، اسکرپٹس، ایپلی کیشن فائلز اور ویب پروگرامنگ فائلز ہیں۔

بگ ڈیٹا اور ڈیٹا مائننگ

ڈیٹا سائنس، بگ ڈیٹا اور ڈیٹا مائننگ کی اصطلاحات اب ہم معنی بن چکی ہیں،جن کے مابین مشاورتی رابطے سے مراد ٹرانزیکشنز، انٹر پرائز ڈیٹا، پبلک ڈیٹا، سوشل میڈیا اور سینسر ڈیٹا تک ریاضیات اور اعدادوشمار کی رسائی ہے۔ ڈیٹا سائنسدان ریاضیاتی تیکنیکس اور الگورتھمک اپروچز سے پیچیدہ کاروبار اور سائنسی مسائل کو حل کرتے ہیں۔ کاروبار میں ڈیٹا سائنس مصنوعات پر لاگت اور صارفین کی پسند و ناپسند یعنی مارکیٹ ٹرینڈز کا تجزیہ کرتے ہوئے سودمند مصنوعات کی تیاری میں سہولت پیدا کرتی ہے۔ معلومات کے مختلف ذرائع کے اندر مواد در مواد معلومات کی رسائی کے لئے ڈیٹا مائننگ کی اصطلاح بھی وضع ہو چکی ہے۔

چیلنجز اور مواقع

ڈیٹا سائنس کی اصطلاح 2012ء میں اس وقت مقبول ہوئی جب ہارورڈ بزنس ریویو نے اسے21ویں صدی کی پرکشش ترین ملازمت قرار دیا اور پھر یہ لفظ معلومات کی دستاویزات سازی کا لازمی جزو بن گیا۔ معلومات کے باضابطہ مطالعے کی اس ’’ڈیٹا سائنس‘‘ کو اس وقت کئی چیلنجز کا سامنا ہے۔ہر طالب علم اپنی کوششوں سے آگے بڑھتا ہے۔ اگر آپ سیکھنے کا جذبہ رکھتے ہیں تو ڈیٹا سائنس آن لائن کاروبار کے ڈھنگ سکھاسکتی ہے۔

پاکستان میں ڈیٹا سائنس کی تعلیم

آئی ٹی اور ٹیلی کام انڈسٹری کی موجودہ ترقی اور ڈیٹا ڈریوِن ورلڈ کے باعث دنیا بھر میں کاروباری طبقے کو ڈیٹا سائنسدان چاہئیں۔ اس حوالے سے مختلف یونیورسٹیاں ڈیٹا سائنس میں ماسٹرز ڈگری اور پی ایچ ڈی پروگرام پیش کر رہی ہے۔مزید برآں کئی آن لائن کورسز بھی دستیاب ہیں۔

تازہ ترین