الوحدة 1: مقدمة في تحليلات البيانات الضخمة
- فهم مشهد البيانات الضخمة
- دور علماء البيانات في الصناعات المختلفة
- استكشاف سير عمل علم البيانات
الوحدة 2: جمع البيانات والمعالجة المسبقة
- مصادر البيانات وأنواعها
- تنظيف البيانات وتقييم الجودة
- تحويل البيانات وهندسة الميزات
الوحدة 3: تحليل البيانات الاستكشافية
- الإحصاء الوصفي وتوزيع البيانات
- تقنيات تصور البيانات
- تحديد الأنماط والقيم المتطرفة
الوحدة 4: التحليل الإحصائي لعلوم البيانات
- مقدمة في المفاهيم الإحصائية الأساسية
- اختبار الفرضيات والقيم p
- الارتباط والسببية
الوحدة 5: مقدمة في التعلم الآلي
- التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف
- نظرة عامة على خوارزميات التعلم الآلي الشائعة
- اختيار النموذج وتقييمه
الوحدة 6: التحليلات التنبؤية مع الانحدار
- الانحدار الخطي وتطبيقاته
- الانحدار اللوجستي للتصنيف
- مقاييس تقييم النموذج
الوحدة 7: تصور البيانات والاتصال
- مبادئ التصور الفعال للبيانات
- إنشاء المؤامرات والمخططات باستخدام مكتبات Python
- سرد القصص مع البيانات
الوحدة 8: مقدمة في تقنيات البيانات الضخمة
- نظرة عامة على Hadoop و MapReduce
- مقدمة إلى Apache Spark والحوسبة الموزعة
- التعامل مع تحديات البيانات الضخمة
الوحدة 9: الأخلاقيات والخصوصية في تحليلات البيانات
- الاعتبارات الأخلاقية في جمع البيانات وتحليلها
- لوائح خصوصية البيانات والامتثال
- ممارسات التعامل المسؤولة مع البيانات
الوحدة 10: مشروع تتويجا
- تطبيق المفاهيم المكتسبة لحل تحدي البيانات في العالم الحقيقي
- تحليل البيانات وتفسيرها وعرضها
- مشروع الفريق التعاوني