شرکت های بزرگ در زمینه  فن آوری مانند گوگل، فیس بوک، Netflix، Airbnb، آمازون، ناسا و بیشتر همه از Spark برای حل مشکلات داده های بزرگ خود استفاده می کنند. در این دوره نحوه ی استفاده از Spark با Python که شامل Spark Streaming، یادگیری ماشینی و DataFrame های Spark 2.0 می شود را فرا خواهید گرفت.

سرفصل ها:

  • معرفی دوره
  • راه اندازی پایتون با Spark
  • راه اندازی محلی VirtualBox
  • راه اندازی AWS EC2 PySpark
  • راه اندازی Databricks
  • راه اندازی AWS EMR Cluster
  • دوره Python
  • مبانی Spark DataFrame
  • پروژه تمرینی Spark DataFrame
  • معرفی یادگیری ماشینی با MLlib
  • رگرسیون خطی
  • رگرسیون منطقی
  • درختان تصمیم گیری و جنگل های تصادفی
  • K-means Clustering
  • فیلتر همکاری برای سیستم های توصیه گر
  • پردازش زبان طبیعی
  • Spark Streaming با پایتون