آموزش Apache Hive | تحلیل و مدیریت کلان‌داده

مرتب‌سازی:

معرفی Apache Hive

Apache Hive پلت فرمی است که برای استفاده از اسکریپت های SQL برای انجام عملیات MapReduce استفاده می شود. Hive یک ابزار زیرساخت انبار داده برای پردازش داده های ساخت یافته در Hadoopاست که در بالای Hadoop قرار می گیرد تا اطلاعات Big Dataرا خلاصه کند و آنالیز و querying را آسان انجام دهد. در ابتدا، Hive توسط فیس بوک توسعه یافت. بعدها بنیاد نرم افزار آپاچی آن را گسترش داد و آن را به عنوان منبع باز تحت نام Apache Hive توسعه داد. Hive توسط شرکت های مختلف استفاده می شود. به عنوان مثال، آمازون از آن در Amazon Elastic MapReduce استفاده می کند. Hive یک پایگاه داده رابطه ای، طراحی برای (OLTP) و یک زبان برای پرس و جو در زمان واقعی و به روز رسانی سطح سطر نیست.

ویژگی های Apache Hive

ذخیره سازی طرح ها در در یک پایگاه داده و داده های پردازش شده به HDFS
طراحی شده برای OLAP
دارای زبان SQL برای پرس و جو به نام HiveQL یا HQL
سریع
مقیاس پذیر
قابل گسترش

نظرتون درباره این نوشته چیه؟ عالیه بد نیست خوب نبود