آیا می خواهید یک دانشمند داده شوید؟

اگر چنین است، این دوره شما را با مفاهیم و ابزارهایی که در کسب این مهارت کمک می کند و کار بر روی هر پروژه علم داده آشنا می کند. در این دوره با مفهوم علم داده، استخراج داده از انواع مختلف منابع و مدل یادگیری ماشینی به عنوان API endpoint که می تواند در راه حل داده های دنیای واقعی مورد استفاده قرار گیرد آشنا می شوید. پس از آن شما یاد خواهید گرفت که از کتابخانه های استاندارد مختلف در اکوسیستم پایتون مانند Pandas، NumPy، Matplotlib، Scikit-Learn، Pickle، Flask برای رفع مراحل مختلف پروژه های علم داده مانند استخراج داده ها، تمیز کردن و پردازش داده ها، ساخت و ارزیابی مدل یادگیری ماشین استفاده کنید.

سرفصل ها:

  • مرور دوره
  • معرفی دوره
  • مخاطبان دوره
  • پیش نیازهای دوره
  • بررسی چرخه پروژه علم داده
  • چرا پایتون برای علم داده؟
  • راه اندازی محیط کار
  • توزیع پایتون برای علم داده
  • Python 3.x در مقابل  Python 2.x
  • نسخه ی نمایشی: نصب توزیع Anaconda
  • Jupyter Notebook
  • نسخه ی نمایشی: راه اندازی Jupyter Notebook در ماشین محلی
  • نسخه ی نمایشی: نوت بوک Jupyter – مبانی
  • نسخه ی نمایشی: Jupyter Notebook – توابع MAGIC
  • قالب پروژه علم داده
  • نسخه ی نمایشی: ایجاد قالب پروژه ی علم داده ی Cookiecutter
  • نسخه ی نمایشی: پروژه را به Git اضافه کنید
  • استخراج داده
  • استخراج داده از پایگاه داده
  • استخراج داده از API ها
  • استخراج داده با Web Scraping
  • مجموعه های داده
  • انجام تغییرات در Git
  • معرفی NumPy و Pandas
  • EDA: ساختار اولیه
  • EDA: آمار خلاصه
  • اندازه گیری مرکزیت
  • اندازه گیری مرکزیت: Mean
  • اندازه گیری مرکزیت: Median
  • اندازه گیری گسترش
  • اندازه گیری گسترش: محدوده
  • اندازه گیری گسترش: درصد و Boxplot
  • اندازه گیری گسترش: واریانس و انحراف استاندارد
  • EDA: توزیع
  • EDA: گروه بندی
  • Data Munging
  • Missing Value
  • رمزگذاری ویژگی های طبقه بندی شده
  • ساخت و ارزیابی مدل های پیش بینی شده
  • مبانی یادگیری ماشینی
  • معیارهای عملکرد
  • مدل Baseline
  • مدل رگرسیون خطی
  • مدل رگرسیون منطقی
  • Underfitting در مقابل Overfitting
  • بهینه سازی پارامتر: GridSearch
  • اعتبار سنجی متقابل
  • اعتبار سنجی متقابل K-Fold
  • عادی سازی و استاندارد سازی ویژگی
  • پایداری مدل
  • توسعه API یادگیری ماشینی
  • خلاصه