داده کاوی در SPSS Modeler

این دوره با هدف آشنایی دانشجویان و محققان با چگونگی پیاده سازی فرآیند داده کاوی از قبیل آماده سازی داده ها و ساخت مدل های پیشبینانه در نرم افزارهای تخصصی داده کاوی طراحی شده است.

کد دوره: ISM-1801

  • مدت دوره: ۲۸ ساعت
  • مخاطب دوره: دانشجویان، پژوهشگران و متخصصان علاقه‌مند به حوزه داده
  • دوره های پیش نیاز: آشنایی مقدماتی با مفاهیم علوم داده
  • مدرسین دوره: زهرا ذوالقدر . محمد روزبه
  • ظرفیت ثبت نام: ۱۴ نفر
  • ارزش دوره:  ۸۸۷ هزار تومان (۲۵ % تخفیف برای دانشجویان و مشتریان قدیمی)

دستاورد دوره

شرکت کنندگان پس از پایان دوره، توانایی شناخت درست و تعریف مسائل در چهارچوب ادبیات داده کاوی را خواهند داشت. همچنین می توانند مطابق با استاندارد اجرایی DM-CRISP پروژه های داده کاوی را بصورت گام به گام پیش برده و از قابلیت های نرم افزار پیشرفته SPSS Modeler در انجام فعالیت های خود استفاده نمایند.

محتوای دوره

 بخش اول: آشنایی با داده کاوی و ضرورت آن به عنوان یک روش حل مساله 

  • ضرورت، پیشینه، تعاریف
    • چرا داده کاوی؟
    • جایگاه داده کاوی نسبت به سایر متدها
    • ویژگی های داده کاوی و عوامل موفقیت آن
    • کاربردهای بالقوه داده کاوی
  • مروری بر ادبیات داده کاوی و وظایف آن
    • روش های یادگیری با راهنما و بدون راهنما
    • وظایف شش گانه داده کاوی
  • آشنایی با نرم افزار های داده کاوی؛ تفاوت ها و نقاط قوت و ضعف هر کدام
  • معرفی استانداردهای موجود در داده کاوی
  • داده کاوی چگونه کار می کند؟  آشنایی با فرآیند استاندارد داده کاوی CRISP-DM
  • ارائه نمونه های موردی از پروژه های داده کاوی

بخش دوم: شناسایی و آماده سازی مقدماتی داده ها

  • جمع آوری داده ها در محیط نرم افزار
    • فراخوانی داده ها در محیط SPSS Modeler14.2
    • یکپارچه سازی داده ها
  • بررسی کیفیت داده ها و پاکسازی
    • بررسی شاخص های کیفی داده ها و نحوه برخورد با آنها
    • تشخیص رکوردهای پرت با استفاده از آنالیز چندمتغیره Anomaly Detection
  • کاهش ابعاد داده ها و ساخت شاخص ها
    • کاهش ابعاد سطری داده ها
    • انتخاب ویژگی های موثر (Feature Selection)
    • تعریف شاخص های مرتبط و ایجاد آنها

بخش سوم: مدل های پیش بینی کننده 

  • مدل های مبتنی بر قانون
    • طبقه بندی: انواع درخت های تصمیم
    • استفاده از درخت های رگرسیونی به منظور پیش بینی
  • مدل های جعبه سیاه
    • ساخت مدل های پیش بینی کننده با شبکه های عصبی مصنوعی
  • استنتاج مبتنی بر مورد
    • بررسی مدل K- نزدیکترین همسایگی (KNN)
  • مدل های تجمیعی (Bagging, Boosting, Ensemble)
  • استفاده از ابزار مدلسازی پیش بینانه اتوماتیک و رتبه بندی مدل ها
  • ارزیابی پیشرفته مدل های پیش بینی کننده (بررسی شاخص های ماتریس پریشانی و نمودارها)

بخش چهارم: مدل های بدون راهنما

  • انواع تکنیک های خوشه بندی ( بررسی الگوریتم های K-Means و Two-Step)
  • ارزیابی مدل های خوشه بندی
  • استفاده از ابزار مدلسازی خوشه بندی اتوماتیک و رتبه بندی مدل ها
  • قوانین پیوند (بررسی الگوریتم Apriori و استفاده از گراف Web)

برای مشاهده برنامه زمانی این دوره در تقویم آموزشی دایکه کلیک کنید.

لیست دوره ها

دوره های آموزشی

انتقال دانش و تجربه به دوستداران علوم داده، رسالت همیشگی گروه داده کاوی دایکه بوده است. آکادمی دایکه با ارائه دوره های آموزشی متنوع با رویکردهای تحلیل داده، علوم داده و مهندسی داده و همینطور برگزاری دوره های اینترنشیپ و کارورزی، سعی دارد تا علاقه مندان این حوزه را در مسیری حرفه ای و با هدف کسب آمادگی جهت ورود به بازار همراهی کند.

جزئیات بیشتر: دوره های آموزشی info