تبلیغات

دوره Data Science A-Z: تمرینات زندگی واقعی علوم داده

دسته بندی ها: آموزش های ویژه ، علم داده (Data Science) ، آموزش های یودمی (Udemy)

علم داده را قدم به قدم از طریق مثال های واقعی تجزیه و تحلیل بیاموزید. داده کاوی، مدل سازی، ویژوال سازی Tableau و موارد دیگر!

توضیحات دوره

فوق العاده Hands-On ... فوق العاده عملی ... واقعا باور نکردنی!

این یکی از آن کلاس های کرکی نیست که همه چیز فقط به همان روشی که باید انجام شود و تمرین شما قایقرانی صاف است. این دوره شما را به انتهای عمق سوق می دهد.

در این دوره شما تجربیات دست اول که به طور روزانه از طریق دانشمندان داده آورده شده را کسب می کنید. شما به آن می گویید Corrupt data، anomalies، irregularities.

در این دوره، مرور کاملی از سفر Data Science به شما ارائه می شود.

پس از اتمام این دوره می دانید:

  • نحوه تمیز کردن و آماده سازی داده ها برای تجزیه و تحلیل
  • نحوه انجام visualisation اولیه داده ها
  • نحوه مدل سازی داده ها
  • چگونه منحنی متناسب با داده ها باشد
  • و سرانجام، چگونه می توان یافته ها را ارائه داد و باعث تحریک مخاطبان شد.

این دوره آنقدر تمرین های عملی به شما می دهد که فارغ التحصیلی از این کلاس، واقعا مانند یک تکه کیک به نظر می رسد. این دوره دارای تمرینات و تکالیف است که آنقدر تحریک آمیز و چالش برانگیز است که می خواهید گریه کنید ... اما شما تسلیم نخواهید شد! شما پیروز خواهید شد.

در این دوره درک خوبی از ابزارهای زیر ایجاد خواهید کرد:

  • SQL
  • SSIS
  • Tableau
  • Gretl

این دوره دارای مسیرهای از پیش برنامه ریزی شده است. با استفاده از این مسیرها می توانید مسیر را طی کنید و بخش هایی را در سفر خودتان ترکیب کنید و مهارت های موردنیاز را کسب کنید.

یا می توانید کل دوره را انجام دهید و خود را برای حرفه ای باورنکردنی در Data Science تنظیم کنید. انتخاب با شماست. به کلاس بپیوندید و امروز شروع به یادگیری کنید!

این دوره برای چه کسانی است:

  • هر کسی که علاقه ای به علم داده دارد.
  • هر کسی که می خواهد مهارت های داده کاوی خود را بهبود ببخشد.
  • هر کسی که می خواهد مهارت های مدل سازی آماری خود را بهبود ببخشد.
  • هرکسی که می خواهد مهارت های تهیه اطلاعات خود را بهبود ببخشد.
  • هرکسی که می خواهد مهارت های ارائه اطلاعات داده خود را بهبود بخشد.

پیش نیاز های دوره

  • فقط اشتیاق به موفقیت است.
  • کلیه نرم افزارهای مورد استفاده در این دوره یا به صورت رایگان یا به صورت نسخه Demo در دسترس هستند.

آنچه که خواهید آموخت:

  • با موفقیت تمام مراحل یک پروژه پیچیده علم داده را انجام دهید.
  • انجام داده کاوی در Tableau
  • برای ایجاد رگرسیون خطی از روش معمولی Least Squares استفاده کنید.
  • Adjusted R-Squared را برای انواع مدل ها ارزیابی کنید.
  • یک رگرسیون خطی چندگانه (MLR) ایجاد کنید.
  • ضرایب MLR را تفسیر کنید.
  • برای ایجاد مدل های آماری از روش های Backward Elimination، Forward Selection و روش Bidirectional Elimination استفاده کنید.
  • بطور مستقیم یک رگرسیون لجستیک را درک کنید.
  • یک ماتریس درهم را بخوانید.
  • متغیرهای مستقل را برای اهداف مدل سازی تبدیل کنید.
  • با استفاده از VIF و ماتریس همبستگی، چند قطبی بودن را بررسی کنید.
  • برای ارزیابی مدل ها از پروفایل دقت انباشت (CAP) استفاده کنید.
  • از داده های Training و Test برای ساختن مدل های قوی استفاده کنید.
  • نسبت شانس را درک کنید.
  • درک کنید که واقعاً خراب شدن مدل چگونه است.
  • SQL Server را نصب و هدایت کنید.
  • داده ها را پاک کنید و به دنبال ناهنجاری ها باشید.
  • شکاف های شرطی را در SSIS ایجاد کنید.
  • اسکریپت ها را در SQL ایجاد کنید.
  • مراحل ذخیره شده را در SQL ایجاد کنید.
  • Visualisations Basic Tableau را ایجاد کنید.
  • نحوه استفاده از آزمون آماری Chi-Squared را درک کنید.
  • R-Squared را برای انواع مدل ها ارزیابی کنید.
  • یک رگرسیون ساده خطی (SLR) ایجاد کنید.
  • متغیرهای ساختگی ایجاد کنید.
  • خروجی نرم افزار آماری را برای مدل های ایجاد شده بخوانید.
  • یک رگرسیون لجستیک ایجاد کنید.
  • با False Positives و False Negatives کار کنید و تفاوت آن ها را بدانید.
  • یک مدل تقسیم بندی جغرافیایی قوی ایجاد کنید.
  • متغیرهای مستقل جدید را به منظور مدل سازی استخراج کنید.
  • چند قطبی بودن را درک کنید.
  • منحنی CAP را در اکسل بسازید.
  • بینش هایی از منحنی CAP بدست آورید.
  • بینش کسب و کار را از ضرایب یک رگرسیون لجستیک استخراج کنید.
  • از سه سطح تعمیر و نگهداری مدل استفاده کنید تا از خراب شدن مدل جلوگیری کنید.
  • Microsoft Visual Studio Shell را نصب و هدایت کنید.
  • از سرویس SQL Server Integration (SSIS) برای بارگذاری داده در یک پایگاه داده استفاده کنید.
  • با خطاهای واجد شرایط متن در داده های RAW مقابله کنید.
  • SQL را برای پروژه های Science Science اعمال کنید.
  • ارائه پروژه های علم داده به ذینفعان.

محتوای دوره

  • هیجان زده شدن
    • به علم داده A-Z™ خوش آمدید
    • جایزه: مسیرهای یادگیری
  • علم داده چیست؟
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • به روزرسانی در بررسی Udemy
    • حرفه آینده
    • حوزه های علم داده
    • مهم: مسیرهای دوره
    • برخی منابع اضافی !!
  • -------------- قسمت 1: ویژوال سازی -------------
    • به قسمت 1 خوش آمدید
  • معرفی Tableau
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • نصب Tableau دسکتاپ و Tableau عمومی (رایگان)
    • شرح چالش + مشاهده داده ها در فایل
    • اتصال Tableau به یک دیتا فایل - فایل CSV
    • پیمایش Tableau - اقدامات و ابعاد
    • ایجاد یک زمینه محاسبه شده
    • اضافه کردن رنگ
    • اضافه کردن برچسب و فرمت گذاری
    • اکسپورت کردن worksheet
    • بخش recap
    • مبانی Tableau
  • نحوه استفاده از Tableau برای داده کاوی
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • ایجاد bins و توزیع Visualizing
    • ایجاد آزمون طبقه بندی برای متغیر عددی
    • ترکیب دو نمودار و کار با آنها در Tableau
    • اعتبارسنجی داده کاوی Tableau با آزمون Chi-Squared
    • آزمون Chi-Square وقتی بیش از 2 دسته وجود دارد
    • بالانس Visualising و توزیع تقریبی حقوق
    • جایزه: تست Chi-Square (آموزش آمار)
    • تست: تست Chi-Squared قسمت 2 (آموزش آمار)
    • بخش recap
    • قسمت کامل شد
  • ------------- قسمت 2: مدل سازی ----------------
    • به قسمت 2 خوش آمدید
  • Refresher آمار
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • انواع متغیرها: Categorical در مقابل Numeric
    • انواع رگرسیون
    • Least Squares معمولی
    • مربع R
    • تنظیم مربع R
  • رگرسیون خطی ساده
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • آشنایی با Gretl
    • دیتاست را بدست آورید
    • وارد کردن داده ها و اجرای آمار توصیفی
    • خروجی رگرسیون خطی
    • رسم و تحلیل نمودار
  • رگرسیون خطی چندگانه
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • هشدار: فرضیات رگرسیون خطی
    • دیتاست را بدست آورید
    • متغیرهای ساختگی
    • تله متغیر ساختگی
    • راه های ساختن یک مدل: BACKWARD، FORWARD، STEPWISE
    • Backward Elimination - زمان تمرین
    • استفاده از مربع R تنظیم شده برای ایجاد مدل های مقاوم
    • ضرایب تفسیر MLR
    • بخش recap
  • رگرسیون لجستیک
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • دیتاست را بدست آورید
    • نتیجه دودویی: انواع Yes/No مشکلات تجاری
    • شهود رگرسیون لجستیک
    • اولین رگرسیون لجستیک شما
    • False Positives و False Negatives
    • ماتریس درهم
    • ضرایب تفسیر یک رگرسیون لجستیک
  • ساختن یک مدل تقسیم بندی geodemographic قوی
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • دیتاست را بدست آورید
    • تقسیم بندی geo-demographic چیست؟
    • بیایید مدل را بسازیم - تکرار اول
    • بیایید مدل را بسازیم - از بین بردن عقب: STEP-BY-STEP
    • تبدیل متغیرهای مستقل
    • ایجاد متغیرهای مشتق شده
    • بررسی چندقطبی بودن با استفاده از VIF
    • ماتریس همبستگی و شهود چند قطبی
    • مدل Ready و بخش Recap است
  • مدل خود را ارزیابی کنید
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • دقت پارادوکس
    • پروفایل دقت تجمعی (CAP)
    • نحوه ایجاد منحنی CAP در اکسل
    • مدل خود را با استفاده از منحنی CAP ارزیابی کنید
    • الگوی منحنی CAP من را بگیرید
    • نحوه استفاده از داده های تست برای جلوگیری از اضافه شدن بیش از حد مدل خود
    • استفاده از مدل برای آزمایش داده ها
    • مقایسه عملکرد تمرین و عملکرد آزمون
    • بخش recap
  • ترسیم insights از مدل شما
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • قدرت insights از CAP شما
    • ضرایب رگرسیون لجستیک - برنامه حمله (موضوع پیشرفته)
    • نسبت شانس (موضوع پیشرفته)
    • نسبت شانس در مقابل ضرایب در رگرسیون لجستیک (موضوع پیشرفته)
    • insights از ضرایب شما (مبحث پیشرفته)
    • بخش recap
  • نگهداری مدل
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • زوال مدل چگونه به نظر می رسد؟
    • چرا مدل ها رو به زوال می گذارند؟
    • سه سطح نگهداری برای مدل های مستقر
    • بخش recap
  • -------------- قسمت سوم: تهیه اطلاعات ----------------
    • به قسمت 3 خوش آمدید
  • ابزارهای هوش تجاری (BI)
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • کار با داده
    • انبار داده چیست؟ بانک اطلاعاتی چیست؟
    • تنظیم Microsoft SQL Server 2014 برای تمرین
    • مهم: پایگاه داده تمرین
    • ETL برای علوم داده - عصاره ترانسفورم بار (ETL) چیست؟
    • ابزارهای مایکروسافت (BI): SSDT-BI چیست و SSIS چیست؟
    • نصب SSDT با MSVS Shell
  • ETL فاز 1: خطاهای داده قبل از بارگذاری
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • ساختار پوشه خود را برای پروژه Data Science خود آماده می کنید
    • برای این بخش دیتاست را دانلود کنید
    • دو کاری که باید قبل از بارگذاری انجام دهید
    • ++Notepad
    • Editpad Lite
  • فاز 2 ETL: راهنمای مرحله به مرحله بارگذاری داده ها با استفاده از SSIS
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • شروع و پیمایش یک پروژه SSIS
    • ایجاد یک flat-file سورس و مقصد OLE DB
    • اتصال flat-file سورس خود را تنظیم کنید
    • اتصال بانک اطلاعاتی خود را تنظیم کرده و یک جدول RAW ایجاد کنید
    • Upload و Disable را اجرا کنید
    • Dilligence دلیل: تضمین کیفیت بارگذاری
  • رسیدگی به خطاها در طول ETL (فاز 1 و 2)
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • برای این بخش دیتاست را دانلود کنید
    • چگونه اکسل می تواند اطلاعات شما را خراب کند
    • طرح Bulletproof برای ویرایش اطلاعات قبل از بارگذاری
    • خطای SSIS: صلاحیت متن مشخص نشده است
    • وقتی سورس فایل شما خراب است چه می کنید؟ (قسمت 1)
    • وقتی سورس فایل شما خراب است چه می کنید؟ (قسمت 2)
    • خطای SSIS: قطع اطلاعات
    • یک ترفند مفید برای یافتن ناهنجاری ها در SQL
    • اتوماسیون کار با خطا در SSIS: تقسیم شرطی
    • اتوماسیون کار با خطا در SSIS: تقسیم شرطی (سطح 2)
    • نحوه تجزیه و تحلیل فایل های خطا
    • Dilligence دلیل: یک چیزی که هر موقع شما باید انجام دهید
    • انواع خطاها در SSIS
    • خلاصه
    • مشق شب
  • برنامه نویسی SQL برای علم داده
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • برای این بخش دیتا ست را دانلود کنید
    • آشنایی با استودیوی مدیریت MS SQL
    • میانبر برای آپلود داده ها
    • SELECT * Statement
    • استفاده از بند WHERE برای فیلتر کردن داده ها
    • نحوه استفاده از Wildcards / عبارات منظم در SQL (٪ و _)
    • کامنت در SQL
    • Order By
    • انواع داده در SQL
    • تبدیل ضمنی داده ها در SQL
    • استفاده از ()Cast در مقابل تبدیل ()Convert
    • کار با NULLs
    • درک چگونگی پیوستن LEFT، RIGHT، INNER و OUTER به کار
    • Joins با مقادیر تکراری
    • Joins با فیلد های تکراری
    • تمرین Joins
  • فاز 3 ETL: ویرایش داده ها پس از بارگذاری
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • جداول RAW، WRK، DRV
    • برای این بخش مجموعه داده را دانلود کنید
    • اولین Proc ذخیره شده خود را در SQL ایجاد کنید
    • اجرای رویه های ذخیره شده
    • تغییر رویه های ذخیره شده
    • ساخت جدول
    • Insert INTO
    • بررسی if table exists + drop table + Truncate
    • Recap متوسط - Procs
    • Proc را برای فایل دوم ایجاد کنید
    • افزودن leading zeros
    • تبدیل داده ها در پرواز
    • نحوه ایجاد یک الگوی proc
    • درآمد حاصل از بایگانی
    • کاری که می توانید با استفاده از این جداول انجام دهید [فایل های drv و غیره]
  • رسیدگی به خطاها در طول ETL (فاز 3)
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • برای این بخش دیتاست را دانلود کنید
    • داده ها را در جدول RAW بارگذاری کنید
    • ایجاد Create Stored
    • نحوه مقابله با خطاها با استفاده از تابع ()isnumeric
    • نحوه مقابله با خطاها با استفاده از تابع ()len
    • نحوه مقابله با خطاها با استفاده از تابع ()isdate
    • بررسی تضمین کیفیت اضافی: بالانس
    • بررسی تضمین کیفیت اضافی: ZipCode
    • بررسی تضمین کیفیت اضافی: Birthday
    • این قسمت کامل شد
    • خطای ETL در مدیریت پروژه "Vehicle Service"
  • --------------- قسمت 4: ارتباطات ----------------
    • به قسمت 4 خوش آمدید
  • کار با مردم
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • کار مقطعی
    • با یک مشکل در تجارت پیش من بیایید
    • تنظیم انتظارات و ارتباطات قبل از پروژه
    • بروید و با آن ها بنشینید
    • هنر گفتن "نه"
    • بعضی اوقات باید به بالا بروید
    • ایجاد فرهنگ داده
  • ارائه برای دانشمندان داده
    • مقدمه (آنچه در این بخش یاد خواهید گرفت)
    • مطالعه موردی
    • تجزیه و تحلیل مقدمه
    • معرفی مقدمه - recap
    • پیشرفت عملی ارائه اطلاعات داده های REAL - مخاطب خود را وادار به گفتن "WOW" کنید
    • روش طوفان مغزی من
    • نحوه ارائه به مدیران
    • حقیقت همیشه زیبا نیست
    • Passion و Wow-Factor
    • جایزه: ارائه کامل
    • جایزه: پیوند به مثال های روایت خوب دیگر
  • راه حل های تکالیف
    • داده کاوی پیشرفته با Tableau: نمره Visualising Credit و Tenure
    • داده کاوی پیشرفته با Tableau: آزمون Chi-Squared برای کشور
    • خطای ETL (فاز 1 و 2)
    • خطای ETL در مدیریت پروژه "Vehicle Service" (قسمت 1 از 3)
    • خطای ETL در مدیریت پروژه "Vehicle Service" (قسمت 2 از 3)
    • خطای ETL در مدیریت پروژه "Vehicle Service" (قسمت 3 از 3)
    • با تشکر از شما فیلم جایزه

 

به علم داده A-Z™ خوش آمدید

 

مقدمه

 

مقدمه تجزیه و تحلیل

 

کار با داده

 

داده کاوی پیشرفته با ویژوال سازی اعتبار امتیاز و تصرف Tableau

 

اولین Proc ذخیره شده خود را در SQL ایجاد کنید

 

اجرای رویه های ذخیره شده

 

تغییر رویه های ذخیره شده

 

آیا این نوشته را دوست داشتید؟
Data Science A-Z™: Real-Life Data Science Exercises Included Publisher:udemy Author:Kirill Eremenko, SuperDataScience Team Duration:21 hours

What you'll learn

  • Successfully perform all steps in a complex Data Science project
  • Perform Data Mining in Tableau
  • Apply Ordinary Least Squares method to Create Linear Regressions
  • Assess the Adjusted R-Squared for all types of models
  • Create a Multiple Linear Regression (MLR)
  • Interpret coefficients of an MLR
  • Use Backward Elimination, Forward Selection, and Bidirectional Elimination methods to create statistical models
  • Intuitively understand a Logistic Regression
  • Read a Confusion Matrix
  • Transform independent variables for modelling purposes
  • Check for multicollinearity using VIF and the correlation matrix
  • Apply the Cumulative Accuracy Profile (CAP) to assess models
  • Use Training and Test data to build robust models
  • Understand the Odds Ratio
  • Understand what model deterioration actually looks like
  • Install and navigate SQL Server
  • Clean data and look for anomalies
  • Create Conditional Splits in SSIS
  • Create Scripts in SQL
  • Create stored procedures in SQL
  • Create Basic Tableau Visualisations
  • Understand how to apply the Chi-Squared statistical test
  • Assess R-Squared for all types of models
  • Create a Simple Linear Regression (SLR)
  • Create Dummy Variables
  • Read statistical software output for created models
  • Create a Logistic Regression
  • Operate with False Positives and False Negatives and know the difference
  • Create a Robust Geodemographic Segmentation Model
  • Derive new independent variables for modelling purposes
  • Understand the intuition of multicollinearity
  • Build the CAP curve in Excel
  • Derive insights from the CAP curve
  • Derive business insights from the coefficients of a logistic regression
  • Apply three levels of model maintenance to prevent model deterioration
  • Install and navigate Microsoft Visual Studio Shell
  • Use SQL Server Integration Services (SSIS) to upload data into a database
  • Deal with Text Qualifier errors in RAW data
  • Apply SQL to Data Science projects
  • Present Data Science projects to stakeholders

 Course content

  • Get Excited
    • Welcome to Data Science A-Z™
    • BONUS: Learning Paths
  • What is Data Science?
    • Intro (what you will learn in this section)
    • Updates on Udemy Reviews
    • Profession of the future
    • Areas of Data Science
    • IMPORTANT: Course Pathways
    • Some Additional Resources!!
  • --------------------------- Part 1: Visualisation ------------------------
    • Welcome to Part 1
  • Introduction to Tableau
    • Intro (what you will learn in this section)
    • Installing Tableau Desktop and Tableau Public (FREE)
    • Challenge description + view data in file
    • Connecting Tableau to a Data file - CSV file
    • Navigating Tableau - Measures and Dimensions
    • Creating a calculated field
    • Adding colours
    • Adding labels and formatting
    • Exporting your worksheet
    • Section Recap
    • Tableau Basics
  • How to use Tableau for Data Mining
    • Intro (what you will learn in this section)
    • Get the Dataset + Project Overview
    • Connecting Tableau to an Excel File
    • How to visualise an AB test in Tableau?
    • Working with Aliases
    • Adding a Reference Line
    • Looking for anomalies
    • Handy trick to validate your approach / data
    • Section Recap
  • Advanced Data Mining With Tableau
    • Intro (what you will learn in this section)
    • Creating bins & Visualizing distributions
    • Creating a classification test for a numeric variable
    • Combining two charts and working with them in Tableau
    • Validating Tableau Data Mining with a Chi-Squared test
    • Chi-Squared test when there is more than 2 categories
    • Visualising Balance and Estimated Salary distribution
    • Bonus: Chi-Squared Test (Stats Tutorial)
    • Bonus: Chi-Squared Test Part 2 (Stats Tutorial)
    • Section Recap
    • Part Completed
  • --------------------------- Part 2: Modelling ---------------------------
    • Welcome to Part 2
  • Stats Refresher
    • Intro (what you will learn in this section)
    • Types of variables: Categorical vs Numeric
    • Types of regressions
    • Ordinary Least Squares
    • R-squared
    • Adjusted R-squared
  • Simple Linear Regression
    • Intro (what you will learn in this section)
    • Introduction to Gretl
    • Get the dataset
    • Import data and run descriptive statistics
    • Reading Linear Regression Output
    • Plotting and analysing the graph
  • Multiple Linear Regression
    • Intro (what you will learn in this section)
    • Caveat: assumptions of a linear regression
    • Get the dataset
    • Dummy Variables
    • Dummy Variable Trap
    • Ways to build a model: BACKWARD, FORWARD, STEPWISE
    • Backward Elimination - Practice time
    • Using Adjusted R-squared to create Robust models
    • Interpreting coefficients of MLR
    • Section Recap
  • Logistic Regression
    • Intro (what you will learn in this section)
    • Get the dataset
    • Binary outcome: Yes/No-Type Business Problems
    • Logistic regression intuition
    • Your first logistic regression
    • False Positives and False Negatives
    • Confusion Matrix
    • Interpreting coefficients of a logistic regression
  • Building a robust geodemographic segmentation model
    • Intro (what you will learn in this section)
    • Get the dataset
    • What is geo-demographic segmenation?
    • Let's build the model - first iteration
    • Let's build the model - backward elimination: STEP-BY-STEP
    • Transforming independent variables
    • Creating derived variables
    • Checking for multicollinearity using VIF
    • Correlation Matrix and Multicollinearity Intuition
    • Model is Ready and Section Recap
  • Assessing your model
    • Intro (what you will learn in this section)
    • Accuracy paradox
    • Cumulative Accuracy Profile (CAP)
    • How to build a CAP curve in Excel
    • Assessing your model using the CAP curve
    • Get my CAP curve template
    • How to use test data to prevent overfitting your model
    • Applying the model to test data
    • Comparing training performance and test performance
    • Section Recap
  • Drawing insights from your model
    • Intro (what you will learn in this section)
    • Power insights from your CAP
    • Coefficients of a Logistic Regression - Plan of Attack (advanced topic)
    • Odds ratio (advanced topic)
    • Odds Ratio vs Coefficients in a Logistic Regression (advanced topic)
    • Deriving insights from your coefficients (advanced topic)
    • Section Recap
  • Model maintenance
    • Intro (what you will learn in this section)
    • What does model deterioration look like?
    • Why do models deteriorate?
    • Three levels of maintenance for deployed models
    • Section Recap
  • --------------------------- Part 3: Data Preparation ---------------------------
    • Welcome to Part 3
  • Business Intelligence (BI) Tools
    • Intro (what you will learn in this section)
    • Working with Data
    • What is a Data Warehouse? What is a Database?
    • Setting up Microsoft SQL Server 2014 for practice
    • Important: Practice Database
    • ETL for Data Science - what is Extract Transform Load (ETL)?
    • Microsoft BI Tools: What is SSDT-BI and what are SSIS/SSAS/SSRS ?
    • Installing SSDT with MSVS Shell
  • ETL Phase 1: Data Wrangling before the Load
    • Intro (what you will learn in this section)
    • Preparing your folder structure for your Data Science project
    • Download the dataset for this section
    • Two things you HAVE to do before the load
    • Notepad ++
    • Editpad Lite
  • ETL Phase 2: Step-by-step guide to uploading data using SSIS
    • Intro (what you will learn in this section)
    • Starting and navigating an SSIS Project
    • Creating a flat file source task and OLE DB destination
    • Setting up your flat file source connection
    • Setting up your database connection and creating a RAW table
    • Run the Upload & Disable
    • Due Dilligence: Upload Quality Assurance
  • Handling errors during ETL (Phases 1 & 2)
    • Intro (what you will learn in this section)
    • Download the dataset for this section
    • How excel can mess up your data
    • Bulletproof Blueprint for Data Wrangling before the Load
    • SSIS Error: Text qualifier not specified
    • What do you do when your source file is corrupt? (Part 1)
    • What do you do when your source file is corrupt? (Part 2)
    • SSIS Error: Data truncation
    • Handy trick for finding anomalies in SQL
    • Automating Error Handling in SSIS: Conditional Split
    • Automating Error Handling in SSIS: Conditional Split (Level 2)
    • How to analyze the error files
    • Due Dilligence: the one thing you HAVE to do every time
    • Types of Errors in SSIS
    • Summary
    • Homework
  • SQL Programming for Data Science
    • Intro (what you will learn in this section)
    • Download the dataset for this section
    • Getting To Know MS SQL Management Studio
    • Shortcut to upload the data
    • SELECT * Statement
    • Using the WHERE clause to filter data
    • How to use Wildcards / Regular Expressions in SQL (% and _)
    • Comments in SQL
    • Order By
    • Data Types in SQL
    • Implicit Data Conversion in SQL
    • Using Cast() vs Convert()
    • Working with NULLs
    • Understanding how LEFT, RIGHT, INNER, and OUTER joins work
    • Joins with duplicate values
    • Joining on multiple fields
    • Practicing Joins
  • ETL Phase 3: Data Wrangling after the load
    • Intro (what you will learn in this section)
    • RAW, WRK, DRV tables
    • Download the dataset for this section
    • Create your first Stored Proc in SQL
    • Executing Stored Procedures
    • Modifying Stored Procedures
    • Create table
    • Insert INTO
    • Check if table exists + drop table + Truncate
    • Intermediate Recap - Procs
    • Create the proc for the second file
    • Adding leading zeros
    • Converting data on the fly
    • How to create a proc template
    • Archiving Procs
    • What you can do with these tables going forward [drv files etc.]
  • Handling errors during ETL (Phase 3)
    • Intro (what you will learn in this section)
    • Download the dataset for this section
    • Upload the data to RAW table
    • Create Stored Proc
    • How to deal with errors using the isnumeric() function
    • How to deal errors using the len() function
    • How to deal with errors using the isdate() function
    • Additional Quality Assurance check: Balance
    • Additional Quality Assurance check: ZipCode
    • Additional Quality Assurance check: Birthday
    • Part Completed
    • ETL Error Handling "Vehicle Service" Project
  • --------------------------- Part 4: Communication ---------------------------
    • Welcome to Part 4
  • Working with people
    • Intro (what you will learn in this section)
    • Cross-departmental Work
    • Come to me with a Business Problem
    • Setting expectations and pre-project communication
    • Go and sit with them
    • The art of saying "No"
    • Sometimes you have to go to the top
    • Building a data culture
  • Presenting for Data Scientists
    • Intro (what you will learn in this section)
    • Case study
    • Analysing the intro
    • Intro dissection - recap
    • REAL Data Science Presentation Walkthrough - Make Your Audience Say "WOW"
    • My brainstorming method
    • How to present to executives
    • The truth is not always pretty
    • Passion and the Wow-factor
    • Bonus: my full presentation | LIVE 2015
    • Bonus: links to other examples of good storytelling
  • Homework Solutions
    • Advanced Data Mining with Tableau: Visualising Credit Score & Tenure
    • Advanced Data Mining with Tableau: Chi-Squared Test for Country
    • ETL Error Handling (Phases 1 and 2)
    • ETL Error Handling "Vehicle Service" Project (Part 1 of 3)
    • ETL Error Handling "Vehicle Service" Project (Part 2 of 3)
    • ETL Error Handling "Vehicle Service" Project (Part 3 of 3)
    • THANK YOU bonus video
  • Bonus Lectures
    • ***YOUR SPECIAL BONUS***

Requirements

  • Only a passion for success
  • All software used in this course is either available for Free or as a Demo version

Description

Extremely Hands-On... Incredibly Practical... Unbelievably Real!

This is not one of those fluffy classes where everything works out just the way it should and your training is smooth sailing. This course throws you into the deep end.

In this course you WILL experience firsthand all of the PAIN a Data Scientist goes through on a daily basis. Corrupt data, anomalies, irregularities - you name it!

This course will give you a full overview of the Data Science journey. Upon completing this course you will know:

  • How to clean and prepare your data for analysis
  • How to perform basic visualisation of your data
  • How to model your data
  • How to curve-fit your data
  • And finally, how to present your findings and wow the audience

This course will give you so much practical exercises that real world will seem like a piece of cake when you graduate this class. This course has homework exercises that are so thought provoking and challenging that you will want to cry... But you won't give up! You will crush it. In this course you will develop a good understanding of the following tools:

  • SQL
  • SSIS
  • Tableau
  • Gretl

This course has pre-planned pathways. Using these pathways you can navigate the course and combine sections into YOUR OWN journey that will get you the skills that YOU need.

Or you can do the whole course and set yourself up for an incredible career in Data Science.

The choice is yours. Join the class and start learning today!

See you inside,

Sincerely,

Kirill Eremenko

Who this course is for:

  • Anybody with an interest in Data Science
  • Anybody who wants to improve their data mining skills
  • Anybody who wants to improve their statistical modelling skills
  • Anybody who wants to improve their data preparation skills
  • Anybody who wants to improve their Data Science presentation skills

پیشنهاد فرادرس

خرید لینک های دانلود
  • حجم فایل: 5.84GB
  • زبان: انگلیسی
  • زیرنویس انگلیسی: ندارد
  • قیمت: 8000 تومان
  • دوره Data Science A-Z: تمرینات زندگی واقعی علوم داده یک محصول ویژه است و دریافت لینک های دانلود آن با پرداخت هزینه امکان پذیر است. اطلاعات بیشتر