مطالب پیشنهادی از سراسر وب

پردازش کلان داده با آپاچی اسپارک (Apache Spark)

دسته بندی ها: آموزش آپاچی اسپارک (Apache Spark) ، آموزش های Packtpub ، آموزش کلان داده (Big Data)

پردازش کلان داده یا بیگ دیتا به صورت Real Time با توجه به موضوع تحمل خطاها و ثبات اطلاعات یک مساله چالش برانگیز است.

دوره "پردازش کلان داده با آپاچی اسپارک" به شما نحوه استفاده از Spark برای ایجاد گردش کار تحلیلی سریع و کارآمد را آموزش می دهد.

ابتدا مبانی پردازش داده با استفاده از RDDs ،SQL ،Datasets و Dataframes APIs را می آموزید. پس از درک مبانی، شما به سمت استفاده از Spark Streaming API برای مصرف داده به صورت real time از طریق سوکت های TCP و ادغام آن با وب سرویس آمازون (AWS) حرکت خواهید کرد.

در پایان دوره شما با استفاده از اسپارک در پروژه های بزرگ کلان داده خود آشنا خواهید شد.

آیا این نوشته را دوست داشتید؟
Big Data Processing with Apache Spark Author:Manuel Ignacio Franco Galeano Duration:3 hours 30 minutes

Processing big data in real time is challenging due to scalability, information consistency, and fault-tolerance. Big Data Processing with Apache Spark teaches you how to use Spark to make your overall analytical workflow faster and more efficient. You'll explore all core concepts and tools within the Spark ecosystem, such as Spark Streaming, the Spark Streaming API, machine learning extension, and structured streaming.
You'll begin by learning data processing fundamentals using Resilient Distributed Datasets (RDDs), SQL, Datasets, and Dataframes APIs. After grasping these fundamentals, you'll move on to using Spark Streaming APIs to consume data in real time from TCP sockets, and integrate Amazon Web Services (AWS) for stream consumption.
By the end of this course, you’ll not only have understood how to use machine learning extensions and structured streams but you’ll also be able to apply Spark in your own upcoming big data projects.

پیشنهاد آموزش مرتبط در فرادرس