فرض کنید شما دانشمند داده هستید. روزانه قصد دارید داده های زیادی را برای اعمال آخرین مدل ها جهت به دست آوردن بینش جدید استفاده کنید، اما به نظر می رسد که با موانع زیادی روبه رو می شوید. همکارانتان برای تبدیل داده شرکت به شما تکیه می کنند چه کار میکنید؟ عیب یابی یادگیری ماشینی پایتون پاسخ سوال می باشد. ما به طور سیستماتیک درباره مشکلات رایج یادگیری ماشینی که به صورت آنلاین در اطراف data wrangling مستندسازی شده اند و اشکال زدایی مدل هایی مانند جنگل های تصادفی و SVM ها، و نمایش نتایج حیرت انگیز تحقیق می کنیم. از آمار  Overflow Stack، Medium و GitHub استفاده می کنیم. مهمترین مسائل را مانند بازیابی مهمترین ویژگی های رگرسیون و توضیح نتایج خود پس از خوشه بندی و راه حل های مربوطه پیدا می کنیم. این مطالعات موردی را در یک فرمت مسئله-راه حل ارائه می دهیم.

سرفصل:

  • معرفی دوره
  • تقسیم مجموعه داده های شما برای آموزش، تست و اعتبارسنجی
  • مقاوم سازی مدل های سخت با ذخیره آن در دیسک
  • محاسبه فرکانس های ورد در ol’ Python
  • تبدیل ویژگی های متغیر طول به بردارهای One-Hot
  • رگرسیون شکست و طبقه بندی مشکلات در scikit-learn
  • پیدا کردن ویژگی های مهم در Classifier شما
  • پیش بینی اهداف چندگانه با همان مجموعه داده
  • بازیابی بهترین Estimators بعد از جستجوی شبکه
  • Pandas Data Frame با Simple Statsmodels OLS
  • عیب یابی مدل های پیشرفته مانند جنگل های تصادفی و SVM ها
  • استخراج قوانین درخت تصمیم گیری از scikit-learn
  • طبقه بندی با SVM هنگامی که داده های شما دارای کلاس های نامتعادل است
  • خوشه بندی اسناد متن با scikit-learn K-means
  • حل مسائل مصورسازی پیش بینی با Matplotlib
  • طراحی یک درخت تصمیم گیری در scikit-learn
  • و غیره