آموزش پانداس (Pandas)

دسته بندی: آموزش پایتون (Python)

پانداس

آنچه در این صفحه می خوانید:

معرفی پانداس (Pandas)

در برنامه نویسی رایانه، pandas یک کتابخانه نرم افزاری است که برای زبان برنامه نویسی پایتون برای دستکاری و تحلیل داده ها نوشته شده است. به طور خاص، ساختار داده و عملیات را برای دستکاری جداول عددی و سری های زمانی ارائه می دهد. این نرم افزار رایگان است که تحت مجوز BSD منتشر شده است. این نام از اصطلاح "panel data" گرفته شده است، اصطلاح اقتصاد سنجی برای مجموعه داده ها که شامل مشاهدات در طی دوره های زمانی مختلف برای افراد مشابه است. بسته pandas مهمترین ابزار در دسترس دانشمندان و تحلیلگران داده است که امروز در پایتون کار می کنند. ابزار قدرتمند یادگیری ماشین و ابزارهای ویژوال سازی ممکن است توجه همه را به خود جلب کند، اما پانداس ستون فقرات اکثر پروژه های داده است.

کاربرد پانداس (Pandas)

پانداس کاربردهای زیادی دارند که ممکن است به جای آنچه می تواند انجام دهد، لیست کارهایی که نمی توانند انجام دهند منطقی باشد. این ابزار در اصل خانه داده شما است. از طریق پانداس، با تمیز کردن، تبدیل و تجزیه و تحلیل آن با اطلاعات خود آشنا می شوید. به عنوان مثال، می خواهید یک مجموعه داده ذخیره شده در CSV در رایانه خود را کشف کنید. پاندا داده ها را از آن CSV در DataFrame استخراج می کند. یک جدول، اساساً، سپس به شما امکان می دهد کارهایی مانند:

  • آمار را محاسبه کنید و به سؤالات مربوط به داده ها پاسخ دهید، مانند میانگین، حداکثر یا حداقل هر ستون چیست؟
  • آیا ستون A با ستون B ارتباط دارد؟
  • توزیع داده ها در ستون C چگونه به نظر می رسد؟
  • داده ها را با انجام کارهایی مانند از بین بردن مقادیر از دست رفته و فیلتر کردن سطرها یا ستون ها بر اساس برخی معیارها، پاک کنید.
  • داده ها را با کمک Matplotlib ویژوال سازی کنید. Plot بار ها، خطوط، هیستوگرام، حباب ها و موارد دیگر.
  • داده های تمیز و تبدیل شده را به CSV، پرونده یا پایگاه داده دیگر برگردانید.

قبل از اینکه به مدل سازی یا ویژوال سازی های پیچیده بپردازید، باید درک درستی از ماهیت مجموعه داده ها و پانداس داشته باشید بهترین راه برای انجام این کار است. پاندا ها عمدتاً در قالب فریم داده برای یادگیری ماشین استفاده می شوند. پاندا اجازه وارد کردن داده از قالب های مختلف فایل مانند CSV ،Excel و غیره را می دهد. كتابخانه پانداس نه تنها جزء ابزار اصلی اطلاعات داده ها است، بلكه در رابطه با سایر كتابخانه های آن مجموعه نیز مورد استفاده قرار می گیرد. Pandas در بالای بسته NumPy ساخته شده است، به این معنی که ساختار زیادی از NumPy در پانداس استفاده شده یا همانند سازی می شود. داده ها در پاندا ها اغلب برای تغذیه تجزیه و تحلیل آماری در SciPy، ترسیم توابع از Matplotlib و الگوریتم های یادگیری ماشین در Scikit-Learn استفاده می شود. Jupyter Notebooks برای انجام اکتشاف و مدل سازی داده ها، محیط مناسبی را برای استفاده از پاندا ارائه می دهند، اما پاندا ها را می توان به راحتی در ویرایشگر متن نیز استفاده کرد. Jupyter Notebooks به ما امکان اجرای کد را در یک سلول خاص بر خلاف اجرای کل پرونده می دهند. این کار زمان زیادی را در هنگام کار با مجموعه داده های بزرگ و تحولات پیچیده صرفه جویی می کند. نوت بوک ها همچنین روشی آسان برای ویژوال سازی تصاویر داده ها و طرح های پانداس را ارائه می دهند.

ویژگی های پانداس (Pandas)

  • شی DataFrame برای دستکاری داده با نمایه سازی یکپارچه
  • ابزاری برای خواندن و نوشتن داده ها بین ساختار داده های حافظه و قالب های مختلف فایل
  • هم ترازی داده ها و مدیریت یکپارچه داده های از دست رفته
  • طراحی مجدد و محور کردن مجموعه داده ها
  • برش مبتنی بر برچسب، نمایه سازی فانتزی و زیر مجموعه مجموعه داده های بزرگ
  • درج ستون و حذف ستون ساختار داده
  • گروه بندی شده توسط موتور اجازه می دهد تا عملیات تقسیم-کاربرد-ترکیب را روی مجموعه داده ها انجام دهد.
  • ادغام و پیوستن به مجموعه داده ها
  • نمایه سازی محور سلسله مراتبی برای کار با داده های با ابعاد زیاد در یک ساختار داده با ابعاد کم
  • قابلیت های سری زمانی شامل تولید دامنه تاریخ و تبدیل فرکانس، آمار پنجره در حال حرکت، حرکت رگرسیون خطی پنجره، تغییر تاریخ.
  • تصفیه داده را فراهم می کند.

این کتابخانه برای عملکرد بسیار بهینه شده است، با مسیرهای کد بحرانی که به زبان پایتون و Cython یا C نوشته شده است.

آیا این نوشته را دوست داشتید؟
pluralsight-working-with-multidimensional-data-using-numpy

کار با داده های چندبعدی با استفاده از NumPy


در این دوره، توابع و کلاس های ساده و بصری را که NumPy برای کار با داده های با ابعاد بالا ارائه می دهد، خواهید آموخت. ابتدا با عملیات اساسی برای کاوش د...

1399/09/01 999 بازدید
pluralsight-cleaning-data-python-data-playbook

آموزش تمیز کردن داده: پلی بوک داده پایتون


در این دوره آموزشی تمیز کردن داده ها در پایتون، نحوه بکارگیری pandas برای تمیز کردن مجموعه داده های واقعی را یاد خواهید گرفت. در ابتدا، نحوه درک، مشاه...

1399/06/07 1138 بازدید
skillshare-data-science-in-python-pandas-scikit-learn-numpy-matplotlib

کتابخانه های علم داده در پایتون Pandas، Scikit-learn ،Numpy و Matplotlib


این دوره مقدماتی اولیه برای شروع تحلیل داده ها، یادگیری ماشینی و اجرای پیشرفته الگوریتم های هوش مصنوعی است و به شما تمامی کتابخانه های اصلی پایتون Pan...

1399/06/01 4505 بازدید
linkedin-using-python-with-excel

آموزش استفاده از پایتون با اکسل


پایتون پر رشدترین زبان برنامه نویسی در جهان و یک ابزار قدرتمند است که به ساده سازی و موثرکردن توسعه و علم داده کمک می کند. در این دوره از Madecraft می...

1399/01/08 6920 بازدید زیرنویس دارد
teamtreehouse-introduction-to-pandas

آشنایی با pandas


فریمورک Pandas ساختار داده های سریع، انعطاف پذیر و تفسیری را ارائه می دهد که برای ایجاد کار با داده های رابطه ای یا "دارای برچسب" طراحی شده اند که نه ...

1398/10/02 2378 بازدید
infiniteskills-data-wrangling-and-analysis-with-python

تجزیه و تحلیل و آماده‌ سازی داده ها با پایتون


در دوره (Data Wrangling and Analysis with Python)، شما با قابلیت های کتابخانه نرم‌ افزاری پانداس (Pandas) در پایتون، برای تجزیه و تحلیل و آماده سازی د...

1398/02/02 16345 بازدید
pluralsight-importing-data-python-data-playbook

آموزش وارد کردن داده - داده پایتون


پایتون یکی از قدرتمندترین و گسترده ترین زبان ها برای کار با داده ها است. در این دوره با دانش لازم جهت وارد کردن داده فرمت های مختلف فایل از جمله متن، ...

1397/10/09 4988 بازدید
pluralsight-pandas-playbook-visualization

آموزش Pandas - مصورسازی


در بعضی موارد هنگامی که شما با یک مجموعه داده کار می کنید، می خواهید خواص این مجموعه داده را به صورت گرافیکی قابل مشاهده کنید. این یک مهارت اصلی برای ...

1397/09/22 1679 بازدید
pluralsight-advanced-pandas

دوره پیشرفته Pandas


در علم داده دانش کاملی از ابزارهای تحلیل داده است و در میان آنها Pandas یکی از محبوب ترین هاست. در این دوره با تحلیل داده، آماده سازی مجموعه داده، کار...

1397/06/23 1788 بازدید زیرنویس دارد
pluralsight-data-wrangling-with-pandas-for-machine-learning-engineers

آموزش Data Wrangling با Pandas برای مهندسان یادگیری ماشینی


در هسته ي يادگيري ماشينی، دانش کاملي از Data Wrangling وجود دارد. در این دوره با معرفی data wrangling، اهمیت آن در فرآیند یادگیری ماشینی، بررسی Pandas...

1397/06/19 2499 بازدید زیرنویس دارد
pluralsight-pandas-playbook-manipulating-data

آموزش دستکاری داده با Pandas 


Pandas تنها یکی از محبوب ترین بسته های نرم افزاری برای تجزیه و تحلیل داده ها نیست، بلکه بدون شک بهترین روش برای کار با داده های شما است. در این دوره ب...

1397/05/15 1930 بازدید
packtpub-data-analysis-and-exploration-with-pandas-video

آموزش کشف و تحلیل داده با Pandas 


آیا به دنبال افزایش قابل توجهی در بهره وری خود هستید؟ آیا شما برخی از ترفندهای جالب و سرگرم کننده را برای حل مشکلات داده های خود جستجو می کنید؟ اگر چن...

1397/04/10 1786 بازدید
packtpub-unpacking-numpy-and-pandas-video

آموزش NumPy و Pandas در پایتون 


پایتون، یک زبان برنامه نویسی چند پارادایمی است که به زبان منتخب دانشمندان داده برای تحلیل داده ها، مصورسازی و یادگیری ماشینی تبدیل شده است. در ابتدا ب...

1396/11/17 4651 بازدید
infiniteskills-introduction-to-pandas-for-developers

آشنایی با Pandas برای توسعه دهندگان


در این دوره ی آموزشی با Pandas آشنا شده و استفاده از آن را طی مثالهای عملی و بسیار کاربردی خواهید آموخت. یکی از کتابخانه های مهم زبان برنامه نویسی پا...

1396/11/17 2536 بازدید
1396/11/08 1463 بازدید زیرنویس دارد
1396/10/28 2313 بازدید
udemy-data-analysis-with-pandas-and-python-udemy

آموزش آنالیز داده با Pandas و Python


دز این دوره آنالیز سریع و آسان داده با استفاده از کتابخانه ی قدرتمند پایتون به نام Pandas را فرا می گیرید. سرفصل های دوره: نصب و راه اندازی معرف...

1396/10/12 3627 بازدید