دانشمند داده

دانشمند داده

  • آمار و احتمال
  • یادگیری ماشین
  • مدلسازی و ارزیابی
  • مباحث پیشرفته

مخاطب این گروه افرادی می باشند که علاقه زیادی به حل مساله با رویکرد داده محور داشته و حوزه علم داده را به عنوان حیطه تخصصی برای خود در نظر گرفته اند و آینده شغلی خود را متخصص در علوم داده می بینند. پیش بینی فرایندها، تحلیل سری زمانی، متن کاوی، تحلیل شبکه های اجتماعی و یادگیری عمیق از جمله مسائلی هستند که در این حوزه مطرح می باشند. 

دانشمند داده چه جایگاهی دارد؟!

یک دانشمند داده متخصصی است که مهارت خود در تحلیل آماری و ساخت مدل های یادگیری ماشین را برای انجام پیش بینی و پاسخ به سوالات مهم کسب و کار به کار می گیرد. متخصص علوم داده همانند یک تحلیلگر داده نیاز دارد تا در پاکسازی، تحلیل و مصورسازی داده ها توانمند بوده و حتی بطور عمیقتری به این موارد بپردازد. ضمن اینکه علاوه بر اینها باید در ساخت، آموزش و بهبود مدل های یادگیری ماشین تسلط و مهارت لازم را داشته باشد. اگر یک تحلیلگر داده بر درک داده های گذشته و چشم انداز کنونی آن تمرکز می کند، دانشمند داده به ارائه پیش بینی های قابل قبول از آینده می پردازد. 

یک دانشمند داده فردیست که می تواند با طرح سوالات پیچیده و حل آنها به کمک دانش آماری پیشرفته و به کارگیری الگوریتم های یادگیری ماشین، ارزش فوق العاده ای برای سازمان ایجاد کند.

متخصصین علوم داده می توانند با استفاده از متدهای یادگیری ماشین با ناظر و بدون ناظر، به دانش پنهان موجود در داده ها دست یابند و آن را آشکار سازند. آموزش مدل های ریاضی به آنها این امکان را می دهد تا بتوانند الگوها را شناسائی کرده و به پیش بینی دقیقتری از آینده برسند. به نوعی می توان گفت که یک دانشمند داده متخصص آماری است که بیشتر از یک آماری کامپیوتر می داند و متخصص کامپیوتری است که بیشتر از یک کامپیوتری به آمار مسلط است.

توانایی ها و مسئولیت ها

توانایی ها:

  • توانایی بالا در درک کسب و کار
  • توانایی بالا در ریاضیات و آمار
  • توانایی بالا در علوم کامپیوتر و برنامه نویسی

مسئولیت ها:

  • پاکسازی داده های کثیف و آماده سازی آن
  • تجزیه و تحلیل اکتشافی داده ها
  • شناسائی الگوها با استفاده از روشهای یادگیری ماشین
  • انجام پیش بینی بر اساس الگوهای بدست آمده
  • طرح سوال و تعریف مساله جدید متناسب با چالشهای پیش رو
  • ارائه راهکار مبتنی بر علم داده جهت حل مسائل پیچیده سازمان

مسیر پیشنهادی دایکه

مسیری که در مجموعه دایکه برای یک دانشمند داده طراحی شده است، شامل ۲۰۸ ساعت در ۹ گام آموزشی می باشد. انتخاب عناوین آموزشی و اولویت بندی آنها بر اساس بینش و تجربه هسته علمی گروه دایکه و با نگاهی بر منابع آموزشی معتبر در سطح دنیا صورت گرفته است. لذا به متقاضیان این دوره ها توصیه می گردد تا ترتیب پیشنهادی و همینطور آیتم های پیشنیاز تعریف شده را مدنظر قرار دهند.

  • نام مسیر:                       دانشمند داده (شامل ۹ گام آموزشی + پروژه کارورزی + مدرک مهارتی معتبر)
  • مدت:                             ۲۰۸ ساعت (در طول ۹ ماه)
  • روزهای برگزاری:               جمعه ها  (صبح‌ها ۱۳-۹ و عصرها ۱۸-۱۴)
  • نوع دوره:                       حضوری و غیرحضوری (همراه با کلاس رفع اشکال آنلاین برای شرکت کنندگان غیرحضوری)
  • میزان سرمایه گذاری:       حضوری: ۵,۸۰۰,۰۰۰ تومان  | غیرحضوری: ۵,۲۰۰,۰۰۰ تومان
  • روش پرداخت:                نقدی یا بصورت اقساطی (۲۰ درصد هنگام ثبت نام و مابقی در ۴ قسط: ۱ آذر- ۱بهمن- ۱فروردین- ۱خرداد )

زمان بندی دقیق مسیرهای قابل ثبت نام یا درحال برگزاری را می توانید از صفحه تقویم آموزشی مشاهده کنید.

مسیر آموزشی علوم داده - گروه داده کاوی دایکه

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

گام اول: فرآیند داده‌کاوی در SPSS Modeler

در این دوره به نوعی صفر تا صد مسیر حل مساله در فضای ویژوال نرم‌افزار آموزش داده می شود و یک بینش کلی از نوع مسائلی که می توان تعریف کرد و روش حل آنها به مخاطب منتقل می شود. این امر کمک می کند تا مخاطبان پس از پایان دوره، ضمن اینکه توانایی حل مساله با کمک نرم افزار را کسب می کنند، می توانند با نگاه بازتر و اشراف بهتری مسیر تکمیلی را ادامه دهند.

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

گام دوم: آمار و احتمالات کاربردی در SPSS Statistics

این دوره با هدف آشنایی دانشجویان و محققان با مفاهیم آمار و احتمال مقدماتی و کاربردهای آن طراحی شده است. بدون شک متخصصان علوم داده نیاز دارند تا مفاهیم مختلف تحلیل آماری را در بررسی کیفیت داده ها، تحلیل توصیفی، آزمون های اعتبارسنجی مدلهای بدست آمده و … به کار بگیرند.

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

گام سوم: تحلیل مقدماتی در Python

تجهیز شدن به یک زبان برنامه نویسی قدرتمند مثل پایتون می تواند شما را بدون محدودیت های نرم افزاری به هدفتان برساند. قدرت مانور شما در مواجهه با انواع داده ها افزایش می یابد و همیشه برای بهبود نتایج دستتان باز خواهد بود. فراخوانی داده ها، ارزیابی کیفی، پاکسازی و آماده سازی آن و ارائه تحلیل های آماری و گزارشات توصیفی با کمک زبان قدرتمندی چون پایتون چیزی است که بازار از شما انتظار دارد.

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

گام چهارم: مهارت های ویژه Hacking Skills

مدیریت و تحلیل داده ها صرفا یک مهارت فردی نیست. نیازمند مشارکت افراد با نقش ها و تخصص های مختلف در یک تیم تحلیل داده  می باشد. بنابراین درست نوشتن، تمیز نوشتن، آشنایی با مفاهیم مهم برنامه نویسی همچون مفاهیم شیئ گرایی در برنامه نویسی در کنار آشنایی با مهارت های مهمی همچون کار کردن در محیط لینوکس و ابزارهای آن اهمیت زیادی دارد. در این دوره علاوه بر موارد فوق، ابزار git جهت مدیریت نسخه های کد نوشته شده در یک کار تیمی را نیز یاد خواهید گرفت.

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

گام پنجم: کار با منابع داده ای مختلف

حتما می دانید که امروزه داده های عملیاتی سازمان ها و شرکتها فقط در یک نوع منبع داده ای ذخیره نمی شوند. شما به عنوان یک متخصص داده مجبور خواهید شد تا با انواع پایگاه داده، انبارهای داده، داده های تحت وب، API ها و… کار کرده و داده های موردنیاز خود را از این منابع واکشی کنید. در این دوره یاد خواهید گرفت که با منابع مختلف چطور ارتباط برقرار کنید.

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

گام ششم: مبانی یادگیری ماشین

خودکار سازی فرآیندهای تصمیم سازی و تصمیم گیری، یکی از وظایف مهم و اساسی دانشمند داده است. در ساخت مدل های پیش بینانه و تحلیل های پیشرفته، شما نیاز دارید تا از متدهای یادگیری ماشین و الگوریتم های مرتبط استفاده کرده و حتی آنها را متناسب با مساله خود بهینه کنید.

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

گام هفتم: تحلیل داده کاوی در Python

زبان پایتون با وجود کتابخانه هایگسترده و به روز خود در حوزه علوم داده، توانسته است جایگاه ویژه ای در میان متخصصان این حوزه کسب کند. دوره پیش رو پیاده سازی فرایند داده کاوی و حل مساله را در محیط پایتون و با استفاده از کتابخانه های موجود به شما می آموزد. و این امکان را برای شما فراهم میکند تا مدل های خود را توسعه داده و بهترین نتیجه ممکن را از داده های خود بگیرید.

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

گام هشتم: مباحث ویژه در علوم داده

گستردگی مباحث علوم داده و اهمیت و کاربرد وسیع برخی از مسائل این حوزه، سبب شده تا مطالعات اختصاصی و متمرکزی روی آنها صورت گرفته و بعنوان موضوعات ویژه و خاص مطرح شوند. متن کاوی، وب کاوی، تحلیل شبکه های اجتماعی، یادگیری عمیق و… از این دست مسائل می باشند. در این دوره سعی می شود بصورت عملی و کاربردی به آنها پرداخته شود.

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

گام نهم: آشنایی با تحلیل کلان داده

با توجه به رشد روزافزون حجم، تنوع و سرعت تولید داده ها، دانشمندان داده بایستی در تعاملی پایدار با مهندسان داده امکان تحلیل های پیشرفته داده کاوی و یادگیری ماشین را در شرایط Big Data فراهم سازند. این موضوع مستلزم ایجاد ادبیات مشترک با مهندسان داده می باشد. طی این دوره با مفاهیم کلان داده ها، ابزارها، پلتفرم های رایج و همچنین محیط های تحلیلی در کلان داده آشنا می شوید.

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

گام آخر: پروژه نهایی و ارائه گواهینامه مهارتی

بدیهی است که ارائه گواهینامه پایانی منوط به گذراندن کلیه دوره های تعریف شده بر اساس مسیر پیشنهادی می باشد.

مسیرهای آموزشی

دانشمند داده یکی از انواع مسیرهای آموزشی است.

گروه دایکه خدمات آموزشی خود را با سه رویکرد تخصصی تحلیل داده ، علوم داده و مهندسی داده ارائه می دهد. شاید نتوان مرز شفاف و مشخصی میان اینها تعریف کرد اما در مجموعه دایکه اعتقاد بر این است که هر کدام از این تخصص ها را می توان به عنوان یک مسیر آموزشی جدا درنظر گرفت و برای آن دوره های مهارتی با هدفگذاری مشخصی را تعیین نمود.

جزئیات بیشتر: مسیرهای آموزشی info

آکادمی دایکه

انتقال دانش و تجربه به دوستداران علوم داده، رسالت همیشگی گروه داده کاوی دایکه بوده است. آکادمی دایکه با ارائه دوره های آموزشی متنوع با رویکردهای تحلیل داده، علوم داده و مهندسی داده و همینطور برگزاری دوره های اینترنشیپ و کارورزی، سعی دارد تا علاقه مندان این حوزه را در مسیری حرفه ای و با هدف کسب آمادگی جهت ورود به بازار همراهی کند.

جزئیات بیشتر: آکادمی دایکه info