تحلیل داده (Data Analysis)

معرفی تحلیل داده یا Data Analysis

تجزیه و تحلیل داده ها (DA) فرآیند بررسی مجموعه های داده است تا نتیجه های مربوط به اطلاعاتی را که در آنها وجود دارد، به طور فزاینده ای با کمک سیستم ها و نرم افزارهای تخصصی به دست آورد. فن آوری ها و تکنیک های تجزیه و تحلیل داده ها به طور گسترده ای در صنایع تجاری مورد استفاده قرار می گیرند تا سازمان ها بتوانند با اطلاعات کافی موجود تصمیمات کسب و کار بیشتر و بهتری بگیرند و با دانشمندان و محققان مدل های علمی، نظریه ها و فرضیه ها را تایید یا رد کنند. تجزیه و تحلیل داده ها توسط متخصص آمار John Tukey در سال 1961 تعریف شده است.

تحلیل داده چیست؟

تجزیه و تحلیل داده فرآیند بازرسی، تمیز کردن، تبدیل و مدل سازی داده ها با هدف کشف اطلاعات مفید، پیشنهاد نتیجه گیری و پشتیبانی از تصمیم گیری است.

به عنوان یک اصطلاح، تجزیه و تحلیل داده عمدتا به مجموعه ای از برنامه های کاربردی، از مبانی هوش تجاری (BI) و گزارش دهی و پردازش تحلیلی آنلاین (OLAP) گرفته تا به اشکال مختلف تجزیه و تحلیل پیشرفته اشاره می کند.

در سطح بالا، متدولوژی های تحلیل داده شامل تجزیه و تحلیل اطلاعات اکتشافی (EDA) است که هدف آن یافتن الگوها و روابط در داده می باشد و تجزیه و تحلیل داده های تاییدیه (CDA) است که تکنیک های آماری را برای تعیین اینکه آیا فرضیه های مربوط به یک مجموعه داده درست یا غلط است مورد بررسی قرار می دهد. EDA اغلب با کارآگاهی مقایسه می شود، در حالی که CDA مشابه کار قاضی یا هیئت منصفه در دادگاه است.

انواع تحلیل داده

چندین تکنیک تجزیه و تحلیل داده وجود دارد که شامل دامنه گسترده ای  از کسب و کار، علم، علوم اجتماعی و غیره با نام های مختلف است.

  • داده کاوی
  • هوش تجاری
  • تحلیل آماری
  • تجزیه و تحلیل پیش بینی
  • تجزیه و تحلیل متن

داده کاوی

داده کاوی، تحلیل مقدار زیادی از داده ها برای استخراج الگوهای ناشناخته و جالب از داده ها، داده های غیر معمول و وابستگی ها است. توجه داشته باشید که هدف استخراج الگوها و دانش از مقادیر زیادی داده  است و استخراج از خود داده نیست.

تجزیه و تحلیل داده ها شامل متد های علوم رایانه ای در مقاطع هوش مصنوعی، یادگیری ماشینی، آمار و سیستم های پایگاه داده می باشد.

هوش تجاری

تکنیک ها و ابزارهای هوش تجاری برای اکتساب و تبدیل مقدار زیادی از داده های کسب و کار بدون ساختار برای کمک به شناسایی، توسعه و ایجاد فرصت های تجاری جدید استراتژیک است.

هدف از هوش تجاری تفسیر آسان از حجم زیادی داده برای شناسایی فرصت های جدید است و می تواند در اجرای یک استراتژی موثر بر اساس بینش هایی که می تواند کسب و کار را با مزیت رقابتی بازار و ثبات درازمدت کارساز باشد.

تحلیل آماری

آمار مطالعه جمع آوری، تجزیه و تحلیل، تفسیر، ارائه و سازماندهی داده ها است. در تحلیل داده ها، دو روش اصلی آماری استفاده می شود:

  • آمار توصیفی
  • آمار استنباطی

تحلیل پیش بینی

تجزیه و تحلیل پیش بینی از مدل های آماری برای تجزیه و تحلیل داده های جاری و تاریخی برای پیش بینی در مورد رویدادهای آینده و یا ناشناخته استفاده می کند. در کسب و کار، تجزیه و تحلیل پیش بینی برای شناسایی خطرات و فرصت هایی که در تصمیم گیری کمک می کند استفاده می شود.

تحلیل متن

تحلیل متن، همچنین به عنوان Mining Text یا به عنوان Text Data Mining نامیده می شود فرآیند استخراج اطلاعات با کیفیت بالا از متن است.  معمولا متن کاوی فرآیند ساختار متن ورودی، الگوهای استخراج در داده های ساخت یافته است که از ابزارهایی مانند یادگیری الگوی آماری، ارزیابی و تفسیر خروجی استفاده می کند.

تجزیه و تحلیل داده ها با اکسل

مایکروسافت اکسل چندین روش و ابزار برای تجزیه و تحلیل و تفسیر داده ها را فراهم می کند. داده ها می توانند از منابع مختلف باشد. داده ها را می توان با چندین روش تبدیل و فرمت کرد. همچنین با ابزارها، توابع و دستورالعمل های Excel داده ها را تحلیل کرد.

آیا این نوشته را دوست داشتید؟