مقدمه ای بر علم داده ها

م

حجم وسیعی از داده ها ما را احاطه نموده است و کاملا در میان داده ها غرق شده ایم. این داده ها از کامپیوترها، ابزارهای موبایل، دوربینها، سنسورها و حتی ساعتی که به دست می بندیم و یا لباسی که می پوشیم بدست می آیند. با هر تعاملی که در شبکه های اجتماعی داریم، هر فایلی که ذخیره میکنیم، هر تصویری که ثبت می کنیم، و هر پرس و جویی که به بانکهای اطلاعاتی ارسال می کنیم، داده ها تولید می شوند. حتی وقتی از گوگل می پرسیم نزدیک ترین کافی شاپ به من کجاست؟ داده تولید می شود.

اگر چه غرق شدن در حجم انبوهی از داده ها چیز جدیدی نیست، احتمالا متوجه رشد سریع این پدیده شده اید. برکه ها، دریاچه ها و رودخانه های داده تبدیل به سیل و سونامی های واقعی از داده های ساختیافته، نیمه ساختیافته و غیرساختیافته شده اند که تقریبا از هر فعالیت فیزیکی و دیجیتالی که صورت می پذیرد، نشات می گیرند. پس به دنیای داده های عظیم (Big Data) خوش آمدید.


اما سوالی که پیش می آید هدف از این همه داده چیست؟ چرا با تمام توان برای تولید و جمع آوری آنان تلاش می کنیم؟ هر چند تا یک دهه قبل هیچ کس در این موقعیت قرار نداشت که از این حجم وسیع از داده های تولید شده استفاده نماید، اما اکنون همه چیز تغییر کرده است. متخصصینی با عنوان مهندسین داده ها (Data Engineers) دائما در حال نوآوری و دستیابی به راههای جدید به منظور جمع آوری، تطبیق، و متراکم کردن حجم باور نکردنی از داده ها هستند، و متخصصین دیگری با عنوان دانشمندان داده ها (Data Scientists) با استخراج بینش های (Insights) کاربردی و ارزشمند از داده ها به دنبال تغییر در کسب و کارها هستند.


در واقع، علم داده ها (Data Science) فرآیند و روش بهبود منابع را ارائه می دهد. علم داده ها بینش های داده ها را ایجاد می کند – بینشهایی که به شما در درک و بهبود کسب و کار، سرمایه گزاری، سلامت و حتی سبک زندگیتان کمک میکند. استفاده از علم داده ها مانند این است که در تاریکی قادر به دیدن باشید. به دنبال دستیابی به هر چیزی که باشید، علم داده ها می تواند به شما در فهم و پیش بینی بهترین مسیر ممکن برای رسیدن از جایی که هستید به جایی که می خواهید باشید و شناسایی موانع بین راه، کمک کند.

درباره نویسنده

محمدمهدی لطفی نژاد

ارسال دیدگاه

نوشته‌های تازه

آخرین دیدگاه‌ها

بایگانی

دسته‌ها

اطلاعات