ساره واحدی

ساره واحدی هستم؛ دانشجوی پانزدهمین دوره "علم داده" در آکادمی دایکه، دانشجوی کارشناسی ارشد فیزیک و علاقمند به کار کردن با دیتاها

SPSS Modeler پیاده سازی رگرسیون خطی

اجرای نمونه گیری در نرم افزار

در درس قبل نمونه گیری را توضیح دادیم. در این ویدیو با استفاده از دیتا ست Sampling  Data به اجرای نمونه برداری یا sampling  در نرم افزار می پردازیم. Pallet Bar 🡺 Sources 🡺 Var File Pallet Bar 🡺 Record Ops 🡺 Sample (random) Pallet Bar 🡺 Graphs 🡺 Histogram Pallet Bar 🡺 Record Ops […]

اجرای نمونه گیری در نرم افزار Read More »

نمونه گیری

نمونه گیری

نمونه گیری یک روش آماری کم هزینه برای کاهش داده هاست تا بر اساس انتخاب زیرمجموعه ای از رکوردهای داده، نماینده مناسبی از داده ها را در حجم کمتر ایجاد نماید. اهمیت نمونه‌گیری را می‌توان صرفه‌جویی در زمان برای تهیه مشاهدات از جامعه آماری به منظور انجام تحقیق علمی دانست. معمولا نمونه‌گیری در مقابل سرشماری

نمونه گیری Read More »

SPSS Modeler پیاده سازی رگرسیون خطی

استخراج ویژگی در نرم افزار

در این ویدیو PCA را به طور عملی بر روی یک دیتا ست PCA Statistics Example انجام خواهیم داد. دیتاست مورد نظر مربوط به یک نظر سنجی است که از گروهی از افراد پرسیده شد که چرا دانشجویان نمی توانند با درس آمار ارتباط خوبی برقرار کنند. Pallet Bar 🡺 Source 🡺 CSV Pallet Bar

استخراج ویژگی در نرم افزار Read More »

استخراج ویژگی

استخراج ویژگی

استخراج ویژگی (Feature extraction) فرایندی است که در آن با انجام عملیاتی بر روی داده‌ها، ویژگی‌های بارز و تعیین‌کننده آن داده ها استخراج می‌شود. هدف استخراج ویژگی این است که داده‌های خام به شکل قابل استفاده‌تری برای پردازش‌های آماری بعدی درآیند. در تکنیک های استخراج ویژگی، با ایجاد ترکیب های خطی از ویژگی های اولیه،

استخراج ویژگی Read More »

پیاده سازی

پیاده سازی انتخاب ویژگی در نرم افزار

در این بخش از آموزش به پیاده سازی Feature Selection در دیتاست Bankloan می پردازیم و خواهیم دید که در نرم افزار IBM SPSS Modeler چگونه باید ویژگی های مهمی که در تحلیل این داده به ما کمک خواهند کرد را شناسایی کنیم. همچنین خواهیم آموخت که چگونه برآیند اهمیت فیلد ها را از طریق

پیاده سازی انتخاب ویژگی در نرم افزار Read More »

انتخاب ویژگی

انتخاب ویژگی

همانطور که در ابتدای مباحث داده کاوی اشاره شده یکی از روش های شناخت و آماده سازی داده ها، کاهش ابعاد و انتخاب نمونه است. کاهش ابعاد تبدیلی است که در آن سعی می شود از تعداد متغیر ها کاسته شود. در این روش اقدام به حذف فیلد های نا مرتبطی که ارزش تحلیلی ندارند

انتخاب ویژگی Read More »

هموارسازی داده ها

هموارسازی داده ها

کاربرد هموارسازی داه ها: در طبیعت و دنیای اطراف ما، پدیده‌هایی وجود دارند که با طول زمان دچار تغییر می‌شوند. این تغییرات می‌تواند به عوامل مختلفی وابسته باشد. گاهی ممکن است یک روند صعودی (یا نزولی) در تغییرات مربوط به ویژگی‌های یک پدیده مشاهده شود یا تغییرات فصلی باعث پدید آمدن تفاوت و اختلاف شود.

هموارسازی داده ها Read More »

تجمیع داده ها

تجمیع و فشرده سازی (Aggregation) تجمیع داده ها با ترکیب دو یا چند رکورد داده و خلاصه سازی آنها با اهداف زیر انجام میشود: ۱. تغییر مقیاس و زاویه نگاه به داده ها به طور مثال با تجمیع داده های مشتریان بانک به تفکیک هر شعبه می توان زاویه نگاه تحلیل را از سطح مشتری

تجمیع داده ها Read More »

SPSS Modeler پیاده سازی رگرسیون خطی

اجرای تبدیل داده ها در نرم افزار

در این ویدیو با استفاده از پروژه ای که قبلا بر روی فایل Bankloan تعریف کرده ایم مباحثی که در خصوص تبدیل داده ها آموختیم را پیاده سازی می نماییم. در این قسمت از تکنیک های نرمال سازی، ساخت ویژگی و گسسته سازی  (دانش زمینه ای و روش های نظارت شده و نظارت نشده) استفاده

اجرای تبدیل داده ها در نرم افزار Read More »

گسسته سازی

گسسته سازی

روش (Discretization / Binning) گسسته سازی به فرآیند تبدیل داده های پیوسته به مقادیر گسسته در قالب فواصل مجاوری که داده های پیوسته را درون خود قرار داده است، گفته می شود. در صورتی که طیف اعداد ورودی بسیار متنوع باشد (برای نمونه داده‌های مربوط به حقوق کارکنان)، در این حالت می‌توان طبقه‌هایی را برای

گسسته سازی Read More »

درخواست مشاوره رایگان ×

    Call Center
    سبد خرید شما
    هیچ محصولی در سبد خرید نیست.

    ورود به حساب کاربری

    ساخت حساب کاربری