آموزش Scikit-Learn
آنچه در این صفحه می خوانید:
معرفی Scikit-Learn
Scikit-learn (قبلا با نام scikits.learn و همچنین به عنوان sklearn نیز شناخته می شود) یک کتابخانه یادگیری ماشین و نرم افزار رایگان برای زبان برنامه نویسی پایتون است. این کتابخانه شامل الگوریتم های مختلف طبقه بندی، رگرسیون و خوشه بندی از جمله ماشین های بردار پشتیبانی، جنگل های تصادفی، افزایش شیب، k-means و DBSCAN است و برای همکاری با کتابخانه های عددی و علمی پایتون، NumPy و SciPy طراحی شده است.
پروژه یادگیری scikit به عنوان scikits.learn توسط دیوید کورناپو در یک پروژه Google Summer of Code آغاز شد. نام آن از این مفهوم نشأت می گیرد که یک "SciKit" (جعبه ابزار SciPy)، یک پسوند شخص ثالث جداگانه توسعه یافته و توزیع شده به SciPy است. Scikit-learn یکی از مشهورترین کتابخانه های یادگیری ماشینی در گیت هاب (GitHub) است.
Scikit-learn به طور عمده در پایتون نوشته شده و از NumPy به طور گسترده برای عملیات جبر خطی و آرایه با عملکرد بالا استفاده می کند. علاوه بر این، برخی الگوریتم های اصلی در سایتون (Cython) برای بهبود عملکرد نوشته شده اند. ماشین های بردار پشتیبانی توسط یک بسته بندی سایتون در اطراف LIBSVM پیاده سازی می شوند. رگرسیون لجستیک و ماشین های بردار پشتیبانی خطی توسط یک بسته بندی مشابه در اطراف LIBLINEAR. در چنین مواردی، گسترش این روش ها با پایتون ممکن نیست.
Scikit-learn به خوبی با بسیاری از کتابخانه های پایتون دیگر مانند matplotlib و Plotly برای رسم نمودار، NumPy برای برداری آرایه، قاب داده های پانداس (Pandas)، scipy و بسیاری دیگر ادغام می شود.
ویژگی های Scikit-Learn
Scikit-learn با ویژگی های زیادی همراه است. در اینجا چند مورد از آنها آورده شده است:
- الگوریتم های یادگیری تحت نظارت: به هر الگوریتم یادگیری ماشین نظارت شده ای که ممکن است در مورد آن شنیده باشید، احتمال بسیار زیادی وجود دارد که بخشی از یادگیری scikit باشد. شروع از مدل های خطی تعمیم یافته (به عنوان مثال رگرسیون خطی)، ماشین های بردار پشتیبان (SVM)، درخت های تصمیم گیری به روش های Bayesian - همه آنها بخشی از جعبه ابزار scikit-learn هستند. گسترش الگوریتم های یادگیری ماشین یکی از دلایل مهم استفاده زیاد از یادگیری scikit است.
- الگوریتم های یادگیری بدون نظارت: باز هم الگوریتم های یادگیری ماشینی از خوشه بندی، تحلیل عاملی، تحلیل کامپوننت های اصلی گرفته تا شبکه های عصبی بدون نظارت گسترش زیادی دارند.
- استخراج ویژگی ها: برای استخراج ویژگی های تصاویر و متن از Scikit استفاده می شود.
- خوشه بندی: برای گروه بندی داده های بدون برچسب مانند KMeans.
- اعتبار سنجی متقابل: برای تخمین عملکرد مدل های تحت نظارت بر داده های دیده نشده.
- دیتاست ها: برای دیتاست های آزمایشی و برای تولید دیتاست هایی با ویژگی های خاص برای بررسی رفتار مدل.
- کاهش ابعاد: برای کاهش تعداد ویژگی های داده ها برای جمع بندی ، ویژوال سازی و انتخاب ویژگی مانند تجزیه و تحلیل کاموپوننت اصلی.
- روش های گروه: برای ترکیب پیش بینی چندین مدل نظارت شده.
- استخراج ویژگی: برای تعریف ویژگی ها در داده های تصویر و متن.
- انتخاب ویژگی: برای شناسایی ویژگی های معنی دار که از آنها می توان مدل های تحت نظارت ایجاد کرد.
- تنظیم پارامتر: برای استفاده بیشتر از مدل های تحت نظارت.
- منیفولد یادگیری: برای جمع بندی و به تصویر کشیدن داده های پیچیده چند بعدی.
آموزش ساخت شبکه های عصبی با scikit-learn
شما در این دوره، توانایی ساخت بهترین پشتیبانی هایی را که scikit-learn برای یادگیری عمیق ارائه می دهد را به دست می آورید. شما ابتدا، دقیقاً خواهید فهمی...
ساخت مدل های طبقه بندی با scikit-learn
شما در این دوره، توانایی برشمردن انواع مختلف الگوریتم های طبقه بندی و پیاده سازی صحیح آن ها را در scikit-learn به دست خواهید آورد. ابتدا می آموزید که ...
به کارگیری متدهای جمعی با scikit-learn
شما در این دوره، توانایی ساخت چندین نوع مهم مدل یادگیری جمعی را به دست خواهید آورد. ابتدا، یاد خواهید گرفت که درختان تصمیم و جنگل های تصادفی بلوک های ...
ساخت راهکارهای scikit-learn
شما در این دوره، توانایی شناسایی موقعیت هایی که scikit-learn دقیقاً ابزاری است که به دنبال آن می گردید و همچنین شرایطی که به چیز دیگری نیاز دارید را ب...
ساخت مدل های خوشه بندی با scikit-learn
شما در این دوره، توانایی برشمردن انواع مختلف الگوریتم های خوشه بندی و پیاده سازی صحیح آن ها را در scikit-learn به دست خواهید آورد. ابتدا، شما می آموزی...
انتخاب و ارزیابی مدل با استفاده از scikit-learn
شما در این دوره، دانش بنیادی توانایی ارزیابی و انتخاب بهترین مدل ها را کسب خواهید کرد و می آموزید. ابتدا با انواع معیارها آشنا خواهید شد که می توانید ...
آماده سازی داده برای مدل سازی با scikit-learn
شما در این دوره، این توانایی را بدست خواهید آورد که داده ها را به طور مناسب پیش پردازش کنید، داده های پرت را شناسایی کنید و تقریب هسته را انجام دهید. ...
کتابخانه های علم داده در پایتون Pandas، Scikit-learn ،Numpy و Matplotlib
این دوره مقدماتی اولیه برای شروع تحلیل داده ها، یادگیری ماشینی و اجرای پیشرفته الگوریتم های هوش مصنوعی است و به شما تمامی کتابخانه های اصلی پایتون Pan...
یادگیری ماشینی با XGBoost با استفاده از Scikit-learn در پایتون
در این دوره با نحوه ایجاد مدل های یادگیری ماشینی تحت نظارت با استفاده از یکی از دقیق ترین الگوریتم های موجود آشنا می شوید. ابتدا متوجه خواهید شد که XG...
آموزش استفاده از Scikit-learn برای یادگیری ماشینی
امروزه Scikit-learn مسلما محبوب ترین کتابخانه پایتون برای یادگیری ماشینی است. هزاران نفر از دانشمندان داده و شاغلان یادگیری ماشینی از آن برای وظایف رو...
آموزش پروژه های دنیای واقعی یادگیری ماشینی با Scikit-Learn
Scikit-Learn یکی از قدرتمندترین کتابخانه های پایتون است که مسائل دنیای واقعی را در زمینه های بهداشت، تجزیه و تحلیل جمعیت و شناخت رفتار خرید و موارد دی...
آموزش NLP با NLTK و Scikit-learn
امروزه بیش از حد داده های متنی آنلاین وجود دارد. به عنوان یک توسعه دهنده پایتون، شما باید یک راه حل جدید با استفاده از پردازش زبان طبیعی برای پروژه بع...
آموزش یادگیری ماشینی با پایتون و Scikit-Learn
یادگیری ماشین و هوش مصنوعی کلان داده های جدید هستند. کتابخانه scikit-learn یکی از محبوب ترین سیستم عامل ها برای یادگیری ماشینی و علم داده است زیرا بر ...