مقدمة في البيانات الضخمة وتعلم الآلة
- تعريف البيانات الضخمة وأهميتها في الأعمال
- نظرة عامة على تعلم الآلة وتطبيقاته
- الفروقات بين التعلم الخاضع للإشراف وغير الخاضع للإشراف
- استكشاف دورة حياة البيانات
بنية البيانات الضخمة والأدوات
- مكونات بنية البيانات الضخمة
- مقدمة في إطاري عمل Hadoop وSpark
- تقنيات تخزين البيانات: بحيرات البيانات ومستودعات البيانات
- أدوات إدارة البيانات الضخمة مثل ( Hive, HBase )
تحضير ومعالجة البيانات
- تقنيات تنظيف البيانات والمعالجة المسبقة
- التعامل مع البيانات المفقودة والقيم الشاذة
- اختيار الميزات وإنشاؤها (Feature Selection & Engineering)
- مقدمة في عمليات ETL (الاستخراج، التحويل، التحميل)
خوارزميات تعلم الآلة
- نظرة عامة على الانحدار الخطي والانحدار اللوجستي
- الأشجار القرارّية وغابات القرار (Decision Trees & Random Forests)
- أساليب التجميع مثل K-Means) ، DBSCAN)
- الشبكات العصبية ومبادئ التعلم العميق
تقييم النماذج وتحسينها
- مؤشرات تقييم النماذج (الدقة، الاستدعاء، المعامل الإيجابي الدقيق)
- أهمية التحقق المتقاطع (Cross-Validation)
- تقنيات ضبط المعاملات (Hyperparameter Tuning)
- تجنب الإفراط أو النقص في التعلّم (Overfitting / Underfitting)
التطبيق والنشر
- دراسات حالة لتطبيق تعلم الآلة في القطاعات المختلفة
- استراتيجيات نشر نماذج تعلم الآلة
- اعتبارات أخلاقية والانحياز في الذكاء الاصطناعي
- أحدث الاتجاهات والابتكارات في البيانات الضخمة وتعلم الآلة