سال ۲۰۱۲ که هاروارد بیزنس ریویو تیتر زد دیتاساینس جذاب ترین شغل قرن ۲۱ است. موجی از تیترهای اینچنینی به راه افتاد. دیتا ساینتست عنوان شغلی هست که تا قبل از ۲۰۰۸ هیچکس اطلاعی از اون نداشت.
اما حالا کسب و کارها با کمبود نیروی متخصص در این حوزه مواجه هستند و بسیاری علاقمند به ورود به این حوزه اند، اما دلیل این استقبال زیاد و تیترهای داغ اینچنینی چیست؟
یکی از دلایل اینه که دیتاساینس به سرعت در همه زمینه ها رشد میکند. و متوسط حقوق دریافتی دیتاساینتیست ها در آمریکا بالای ۱۰۰ هزار دلار و در آلمان حدود ۷۰ هزار یورو هست. جذابیت های دیگری نیز در این شغل وجود دارد مانند اینکه همیشه شما با چالش حل مساله برای کسب و کارها روبرو هستید و باید دایم در حال یادگیری باشید.
البته انتظارات غیرواقعی نسبت به این شغل چه در کارفرمایان و چه در کارجویان وجود دارد که میتوان به آنها به عنوان عیب های این شغل اشاره کرد. مثلا چون بعضی کسب و کارها دید روشنی نسبت به این تخصص ندارند فکر میکنند یک نفر میتونه همه مشکلات اونها رو یک شبه با داده های جسته گریخته ای که اغلب کم و نامرتب هستند، حل کنه و به محض استخدام یک دیتاساینتیست از اون بخوان که یه مدل یادگیری ماشین پیاده سازی کنه، بدون اینکه به آماده سازی داده ها بپردازن.
بین کارجویان هم چنین سوء برداشت ها و انتظارات نابجایی وجود داره. مثلا ممکنه فکر کنن، خروجی مدلها هر چه که باشد لازم و الاجرا هست. و یا اینکه فکر کنن که دیتا انجینیر ها که بعدا درباره ش صحبت خواهیم کرد، داده رو حاضر و آماده بدون هیچ مشکلی به اونها تحویل خواهند داد و یک کامپیوتر فوق سریع با منابع نامحدود در اختیار خواهند داشت و تنها کاری که باید انجام بدن پیاده سازی مدلهای مورد نیاز هست. که صدالبته اینگونه نیست.
قبل از اینکه جلوتر بریم اجازه بدید ابتدا یک تعریف ساده اما روشن از دیتاساینس داشته باشیم. به طور کلی دیتاساینس بکارگیری دیتا و روشهای علمی به منظور درک و حل مشکلات واقعی کسب و کارهاست، و اصلا موضوع جدیدی نیست. از قدیم الیام مردم از روشهای مختلف برای تحلیل های مالی استفاده میکردند. اما امروزه با استفاده از کامپیوتر و نرم افزارهای کامپیوتری، دیتا ساینتیست ها میتوانند کارهای مثل data transformation and aggregation انجام بدن، تحلیلهای آماری انجام بدن یا یک مدل ماشین لرنینک رو اجرا کنن. و با استفاده ازخروجی های اونها داشبوردهای مدیریتی ایجاد کرده و تصمیمات هوشمندانه بگیرن.
اجازه بدید یک مثال بزنم. فرض کنیم یه فروشگاه زنجیره ای در نظر داره که یک شعبه جدید راه اندازی کنه، مدیر بخش شعبات این برند میتونه از یک دیتاساینتیست بخواد که با استفاده از روشهای data analysis بهترین مکان رو برای راه اندازی شعبه جدید پیشنهاد کنه. دیتاساینتست با بررسی داده های مربوط به محل ارسال خریدهای آنلاین متوجه میشه کجاها درخواست بیشتری برای محصولات این فروشگاه هست. همچنین با ادغام داده های مربوط به افرادی که در این محلها زندگی میکنند از طریق اطلاعات سرشماری رسمی بهترین محل برای راه اندازی رو پیدا کنه و با ارایه توصیه هاش به افراد ذیصلاح آنها رو تو راه اندازی شعبه جدید از طریق دیتا کمک کنه. به این میگن Data Driven Decision Making.
مثال دیگری که میتواند در ارتباط با همین موضوع بیان کرد، پیاده سازی یک سیستم توصیه گر recommendation system بر اساس داده های موجود از خریدهای مشتریان هست. دانشمندان داده میتونن با ایجاد یک مدل ماشین لرنینگ بلافاصله بر اساس خرید فعلی شما یا وضعیت سبد خرید شما و یا حتی بازدیدهایی که از کالا ها دارید بهتون پیشنهاد بدن که چه محصولات دیگری میتونید خریداری کنید.
در قسمتهای بعدی، به جنبه های دیگر دیتاساینس و مسیر یادگیری و اشتغال اون خواهم پرداخت. همچنین میتونید از طریق این لینک به ویدیو وبینار آشنایی با دیتاساینس در یوتیوب دسترسی پیدا کنید. در اونجا به طور کامل در این باره صحبت کردم.