آماده‌سازی داده ها

آماده‌سازی داده به فرآیند تمیز کردن، استانداردسازی و غنی‌سازی داده‌های خام برای آماده‌سازی آن‌ها برای تجزیه و تحلیل پیشرفته و موارد استفاده از علم داده اشاره دارد. تحلیلگران داده قبل از شروع تجزیه و تحلیل اعداد، برای به دست آوردن داده های مربوطه تلاش می کنند. در واقع، دانشمندان داده بیش از 80 درصد از زمان خود را صرف آماده سازی داده های مورد نیاز خود قبل از استفاده از آن در مدل های مختلف یادگیری ماشینی تحت نظارت و بدون نظارت می کنند. این قانون 80/20 نامیده می شود - تحلیلگران داده و دانشمندان داده 20٪ از زمان خود را صرف تجزیه و تحلیل واقعی کسب و کار می کنند، در حالی که بقیه صرف یافتن، پاکسازی و سازماندهی داده ها می شود.


جهت آماده سازی داده های خود اینجا کلیک کنید.