مطالب پیشنهادی از سراسر وب

آماده سازی داده ها برای یادگیری ماشینی

دسته بندی ها: آموزش یادگیری ماشینی (Machine Learning) ، آموزش هوش مصنوعی (AI) ، آموزش های پلورال سایت (Pluralsight)

از آنجا که یادگیری ماشین در اوج محبوبیت قرار گرفته، شناخت دقیقا نحوه آماده سازی داده های وارد شده به مدل به روشی متناسب با مسئله ای که می خواهیم حل کنیم، اهمیت بیشتری پیدا می کند. در این دوره، آماده سازی داده ها برای یادگیری ماشینی؛ شما توانایی بررسی، پاک سازی، و ایجاد ساختار داده های خود را به شیوه هایی کسب خواهید کرد که بهترین نتیجه را در مدل یادگیری ماشینی شما داشته باشد.

در ابتدا، شما خواهید آموخت که چرا پاک سازی و آماده سازی داده ها بسیار مهم است، و چگونه مشکلات مربوط به داده های از دست رفته، داده های گم شده، outliers، و سایر مشکلات مرتبط را می توان حل کرد. سپس، کشف خواهید کرد که چگونه مدل هایی که بیش از حد داده ها را می خوانند، از مشکلی به نام نصب بیش از حد رنج می برند، که در آن مدل ها در شرایط تست عملکرد خوبی دارند اما در استقرارهای زنده کشمکش دارند.

شما همچنین خواهید فهمید که چگونه مدل هایی که با داده های ناکافی یا نامناسب آموزش داده می شوند از مجموعه دیگری از مشکلات رنج می برند و چگونه می توان این مشکلات را کاهش داد. در پایان، با استفاده از روش های مختلف برای انتخاب ویژگی، مقابله با داده های از دست رفته ای که از تقلید استفاده می کنند، دانش خود را جمع بندی می کنید و با استفاده از  مناسب ترین ویژگی ها، مدل های خود را می سازید.

با اتمام این دوره، شما دانش و مهارت لازم برای شناسایی data procedures مناسب برای پاک سازی و آماده سازی داده ها برای راه اندازی مدل خود برای موفقیت را کسب خواهید کرد.

بررسی اجمالی دوره

فایل های تمرین exercise_files.zip
آیا این نوشته را دوست داشتید؟
Pluralsight Preparing Data for Machine Learning Author:Janani Ravi Duration:3:24:16 Level:Beginner

As Machine Learning explodes in popularity, it is becoming ever more important to know precisely how to prepare the data going into the model in a manner appropriate to the problem we are trying to solve.
In this course, Preparing Data for Machine Learning* you will gain the ability to explore, clean, and structure your data in ways that get the best out of your machine learning model.
First, you will learn why data cleaning and data preparation are so important, and how missing data, outliers, and other data-related problems can be solved. Next, you will discover how models that read too much into data suffer from a problem called overfitting, in which models perform well under test conditions but struggle in live deployments. You will also understand how models that are trained with insufficient or unrepresentative data suffer from a different set of problems, and how these problems can be mitigated.
Finally, you will round out your knowledge by applying different methods for feature selection, dealing with missing data using imputation, and building your models using the most relevant features.
When you’re finished with this course, you will have the skills and knowledge to identify the right data procedures for data cleaning and data preparation to set your model up for success.

پیشنهاد آموزش مرتبط در فرادرس