آموزش Apache Hive

معرفی Apache Hive

Apache Hive پلت فرمی است که برای استفاده از اسکریپت های SQL برای انجام عملیات MapReduce استفاده می شود.

Hive یک ابزار زیرساخت انبار داده برای پردازش داده های ساخت یافته در Hadoopاست که در بالای Hadoop قرار می گیرد تا اطلاعات Big Dataرا خلاصه کند و آنالیز و querying را آسان انجام دهد.

در ابتدا، Hive توسط فیس بوک توسعه یافت. بعدها بنیاد نرم افزار آپاچی آن را گسترش داد و آن را به عنوان منبع باز تحت نام Apache Hive توسعه داد. Hive توسط شرکت های مختلف استفاده می شود. به عنوان مثال، آمازون از آن در Amazon Elastic MapReduce استفاده می کند.

Hive یک پایگاه داده رابطه ای، طراحی برای (OLTP) و یک زبان برای پرس و جو در زمان واقعی و به روز رسانی سطح سطر نیست.

ویژگی های Apache Hive

  • ذخیره سازی طرح ها در در یک پایگاه داده و داده های پردازش شده به HDFS
  • طراحی شده برای OLAP
  • دارای زبان SQL برای پرس و جو به نام HiveQL یا HQL
  • سریع
  • مقیاس پذیر
  • قابل گسترش