داده Text یکی از مهم ترین انواع داده در علم داده است. پیشرفت های جدید در یادگیری ماشینی و تکنیک های یادگیری عمیق در حال حاضر امکان ایجاد محصولات داده های فوق العاده را در منابع متن فراهم می کند. در این دوره با درک اصول متن کاوی مدرن، استفاده از یادگیری ماشینی برای استخراج اطلاعات از متن، کار بر روی Skip-grams، CBOW و X2Vec و غیره آشنا می شوید. در پایان دوره، شما جنبه های مختلف استخراج متن با ML و فرایندهای مهم در آن را خواهید آموخت.

سرفصل:

  • معرفی دوره
  • درک متن کاوی
  • راه اندازی محیط کار
  • خواندن و فرآیند ویژگی های متن
  • درک منابع داده متن
  • N-Grams
  • استخراج از متن
  • استفاده از مدل های ازپیش آموزش دیده
  • طبقه بندی متن
  • الگوریتم های یادگیری ماشین برای طبقه بندی متن
  • نقش های Thumb
  • رویکرد یادگیری عمیق در طبقه بندی متن
  • Word Embeddings
  • Word Embeddings چیست؟
  • آموزش مدل Word2Vec
  • X2Vec
  • و غیره