课程简介
课程涵盖数据分析和挖掘流程、常用工具介绍及五个项目实战,包括用户消费行为分析、数据分析营销案例、餐厅订单数据分析、物流数据分析和用户流失模型构建。通过实操演练,学员将掌握数据预处理、特征工程、建模与评估等技能,并能运用所学知识解决实际业务问题。本课程适合数据分析师、数据科学家等角色,旨在提升学员的Python数据分析和挖掘能力。
目标收益
培训对象
课程大纲
第一天 数据分析和挖掘流程介绍 |
数据挖掘的基本任务 定义分析和挖掘目标 数据取样 数据探索 单变量数据探索 数据关联性分析 数据预处理 数据特征工程构建和选择 挖掘建模 模型评价 |
数据分析和挖掘常用的工具 |
Jupyter工具介绍和使用 Numpy基本使用 Pandas基本使用 数据加载与处理 Pandas分组与合并 Pandas时间序列 Matplotlib基本使用 Scikit-Learn基本使用 PySpark工具介绍 |
项目实战一: 用户消费行为数据分析实战 |
项目介绍和需求分析 数据介绍和数据导入 数据预处理 用户个体消费数据分析 用户消费行为数据分析 用户分层RFM模型 新用户、活跃用户、回流用户和用户流失分析 用户购买周期分析 用户生命周期分析 用户复购率分析 用户回购分析 用户营销和推荐分析 项目总结和报告撰写 |
项目实战二: 数据分析营销案例实战 |
一、数据概况分析 • 数据概况 • 数据清洗 二、单变量分析 • 观察样本0、1的平衡性 • 观察均值大小 • 可视化 三、相关性分析和可视化 四、逻辑回归模型的建立和评估 • 模型建立 • 模型评估 • 模型优化 五、业务价值 六、模型管理、发布和调用 |
第二天 项目实战三: 餐厅订单数据分析实战 |
一、数据概况分析 • 数据概况 • 数据清洗 最受欢迎的菜单分析及可视化展示 订单消费维度分析及可视化展示 日期与时间维度分析及可视化展示 菜单组合营销分析 项目总结 |
项目实战四: 物流数据粉实战 |
需求分析 数据预处理-重复值、缺失值、数据格式调整 异常值和偏态分布处理 月份列的数据格式处理 货品配送服务分析 销售区域潜力分析 商品质量分析 项目总结 |
项目实战五: 用户流失模型实战 |
技术架构介绍 流失模型构建 -数据清洗和转换 -空值和异常值处理 -数据归一化 -特征提取 -特征的降维和升维 -文本的数据化 决策树和随机森林介绍 基于Python的用户流失模型开发 模型测试 |
第一天 数据分析和挖掘流程介绍 数据挖掘的基本任务 定义分析和挖掘目标 数据取样 数据探索 单变量数据探索 数据关联性分析 数据预处理 数据特征工程构建和选择 挖掘建模 模型评价 |
数据分析和挖掘常用的工具 Jupyter工具介绍和使用 Numpy基本使用 Pandas基本使用 数据加载与处理 Pandas分组与合并 Pandas时间序列 Matplotlib基本使用 Scikit-Learn基本使用 PySpark工具介绍 |
项目实战一: 用户消费行为数据分析实战 项目介绍和需求分析 数据介绍和数据导入 数据预处理 用户个体消费数据分析 用户消费行为数据分析 用户分层RFM模型 新用户、活跃用户、回流用户和用户流失分析 用户购买周期分析 用户生命周期分析 用户复购率分析 用户回购分析 用户营销和推荐分析 项目总结和报告撰写 |
项目实战二: 数据分析营销案例实战 一、数据概况分析 • 数据概况 • 数据清洗 二、单变量分析 • 观察样本0、1的平衡性 • 观察均值大小 • 可视化 三、相关性分析和可视化 四、逻辑回归模型的建立和评估 • 模型建立 • 模型评估 • 模型优化 五、业务价值 六、模型管理、发布和调用 |
第二天 项目实战三: 餐厅订单数据分析实战 一、数据概况分析 • 数据概况 • 数据清洗 最受欢迎的菜单分析及可视化展示 订单消费维度分析及可视化展示 日期与时间维度分析及可视化展示 菜单组合营销分析 项目总结 |
项目实战四: 物流数据粉实战 需求分析 数据预处理-重复值、缺失值、数据格式调整 异常值和偏态分布处理 月份列的数据格式处理 货品配送服务分析 销售区域潜力分析 商品质量分析 项目总结 |
项目实战五: 用户流失模型实战 技术架构介绍 流失模型构建 -数据清洗和转换 -空值和异常值处理 -数据归一化 -特征提取 -特征的降维和升维 -文本的数据化 决策树和随机森林介绍 基于Python的用户流失模型开发 模型测试 |