در این دوره با  نسخه های Jupyter Notebook، NumPy، Pandas و scikit-learn در داده پایتون، جعبه ابزار ضروری علم داده Python 3.6 و  تکنیک های یادگیری ماشینی و مصورسازی آشنا می شوید.

سرفصل:

  • معرفی دوره
  • معرفی علوم داده و پایتون
  • نگاهی به بسته های ضروری
  • معرفی Jupyter Notebook
  • مجموعه داده های Scikit-learn Toy
  • Data Munging
  • بارگیری و پیش پردازش داده
  • کار با داده های طبقه بندی شده و متن
  • ایجاد آرایه NumPy
  • عملیات و محاسبات سریع NumPy
  • خط لوله داده
  • معرفی EDA
  • ایجاد ویژگی های جدید
  • کاهش ابعاد
  • معیارهای اعتبار سنجی
  • تست و اعتبار سنجی
  • Cross-Validation
  • بهینه سازی هایپرپارامتر
  • انتخاب ویژگی
  • بسته شدن همه چیز در خط لوله
  • یادگیری ماشینی
  • آماده سازی ابزارها و مجموعه داده ها
  • رگرسیون خطی و منطقی
  • Naive Bayes
  • K-Nearest Neighbors
  • یادگیری بدون نظارت