این دوره مبانی Apache Spark با Scala را پوشش می دهد و تمام نکات مورد نیاز برای یادگیری ایجاد و توسعه اپلیکیشن Spark با  اسکالا را آموزش می دهد. در این دوره با  Apache Spark، تحلیل کلان داده، استفاده از آپاچی اسپارک برای خط لوله پردازش کلان داده و اپلیکیشن های تحلیل داده، نحوه در نظر گرفتن مشکلات تحلیل دده به عنوان مشکلات Spark، جمع آوری نگارخانه های وب آپاچی ناسا از منابع مختلف، درآمد توسعه دهندگان در سراسر دنیا، تجزیه و تحلیل نحوه ساخت فضاهای سازنده در مناطق مختلف در بریتانیا و غیره آشنا می شوید. این دوره با Scala تدریس می شود. Scala نسل بعدی زبان برنامه نویسی برای برنامه نویسی تابعی است که در حال افزایش است و یکی از محبوب ترین زبان ها در صنعت برای نوشتن برنامه های Spark می باشد. پس با این دوره نوشتن برنامه های Spark را با اسکالا بیاموزید تا مدل سازی مشکلات کلان داده امروزی را انجام دهید.

سرفصل:

  • شروع کار با Apache Spark
  • معرفی دوره
  • معرفی Spark
  • نصب Java و Git
  • راه اندازی پروژه Spark با IntelliJ IDEA
  • اجرای اولین کار Apache Spark
  • عیب یابی – اجرای اولین کار Apache Spark
  • RDD
  • مبانی RDD در  Apache Spark
  • ایجاد RDD
  • Map و Filter Transformation در Apache Spark
  • راه حل Airports با Latitude Problem
  • تبدیل FlatMap در Spark Apache
  • تنظیم عملیات در Apache Spark
  • راه حل برای مشکل مشابه میزبان
  • عملیات در Apache Spark
  • حل مسئله تعداد اعداد
  • جنبه های مهم در مورد RDD
  • خلاصه ای از عملیات RDD در Spark Apache
  • ذخیره و پایداری در Spark Apache
  • معماری Spark و کامپوننت ها
  • معماری Spark
  • کامپوننت های Spark
  • Pair RDD در Apache Spark
  • معرفی Pair RDD در Spark
  • ایجاد Pair RDDs در Spark
  • Filter و MapValue Transformations در Pair RDD
  • کاهش با Key Aggregation در Apache Spark
  • راه حل نمونه برای مشکل Average House
  • GroupBy Key Transformation در  Spark
  • SortBy Key Transformation در Spark
  • راه حل نمونه برای مشکل شمارش کلمه ذخیره شده
  • Data Partitioning در Apache Spark
  • پیوستن به عملیات در Spark
  • عنوان پیشرفته اسپارک
  • Accumulators
  • راه حل در StackOverflow
  • متغیرهای Broadcast
  • Apache Spark SQL
  • معرفی Apache Spark SQL
  • Spark SQL
  • مجموعه داده تایپ شده
  • استفاده از مجموعه داده یا RDD
  • تبدیل داده ها و RDD
  • تنظیم عملکرد SQL Spark
  • اجرای Spark در خوشه
  • مقدمه ای بر اجرای Spark در یک خوشه
  • Package Spark Application و استفاده از  spark-submit
  • اجرای برنامه Spark در خوشه EMR آمازون