工程师
其他
Python
数据分析
推荐课程
average > 0 ? $model->average . '分' : '10.0分' ?>

Python数据分析案例实战培训

刘老师

某知名咨询公司 云平台系统架构师

毕业于⼤连理⼯⼤学
简介:
精通开源的⼤数据⽣态技术和架构,Hadoop、Hive、Hbase、 Spark、Flink等开源技术栈。
有10年左右基于⼤数据解决⽅案平台、数据架构、数据中台、数据治理、数据分析和挖掘的⼤型数据湖和数
据中台项⽬架构实施经验,
⽬前任职国内知名咨询公司,先后服务于北京⼤学软件研究所、阿⾥巴巴、Teradata,实施过基于开源⼤数据技术
栈的数据湖解决⽅案和实施、湖仓⼀体架构咨询和实施、数据中台的咨询和设施
最近主要项⽬介绍:
某移动⼤数据平台架构设计和设施 (Hadoop、Spark)
四⼤⾏之⼀的数据湖咨询和实施
某⼤型商业银⾏数据中台咨询
某银⾏基于开源⼤数据技术栈数据中台的咨询和实施
某航空公司数据平台流批⼀体解决⽅案和实施
特长:
在⼤数据架构、开发、运维和优化、数据集成、 数据湖(Data Lake)、数据建模、数据挖掘/机器学习、数据
中台等⽅⾯有丰富经 验。

毕业于⼤连理⼯⼤学 简介: 精通开源的⼤数据⽣态技术和架构,Hadoop、Hive、Hbase、 Spark、Flink等开源技术栈。 有10年左右基于⼤数据解决⽅案平台、数据架构、数据中台、数据治理、数据分析和挖掘的⼤型数据湖和数 据中台项⽬架构实施经验, ⽬前任职国内知名咨询公司,先后服务于北京⼤学软件研究所、阿⾥巴巴、Teradata,实施过基于开源⼤数据技术 栈的数据湖解决⽅案和实施、湖仓⼀体架构咨询和实施、数据中台的咨询和设施 最近主要项⽬介绍: 某移动⼤数据平台架构设计和设施 (Hadoop、Spark) 四⼤⾏之⼀的数据湖咨询和实施 某⼤型商业银⾏数据中台咨询 某银⾏基于开源⼤数据技术栈数据中台的咨询和实施 某航空公司数据平台流批⼀体解决⽅案和实施 特长: 在⼤数据架构、开发、运维和优化、数据集成、 数据湖(Data Lake)、数据建模、数据挖掘/机器学习、数据 中台等⽅⾯有丰富经 验。

课程费用

6800.00 /人

课程时长

2

成为教练

课程简介

课程涵盖数据分析和挖掘流程、常用工具介绍及五个项目实战,包括用户消费行为分析、数据分析营销案例、餐厅订单数据分析、物流数据分析和用户流失模型构建。通过实操演练,学员将掌握数据预处理、特征工程、建模与评估等技能,并能运用所学知识解决实际业务问题。本课程适合数据分析师、数据科学家等角色,旨在提升学员的Python数据分析和挖掘能力。

目标收益

培训对象

课程大纲

第一天
数据分析和挖掘流程介绍
数据挖掘的基本任务
定义分析和挖掘目标
数据取样
数据探索
单变量数据探索
数据关联性分析
数据预处理
数据特征工程构建和选择
挖掘建模
模型评价
数据分析和挖掘常用的工具 Jupyter工具介绍和使用
Numpy基本使用
Pandas基本使用
数据加载与处理
Pandas分组与合并
Pandas时间序列
Matplotlib基本使用
Scikit-Learn基本使用
PySpark工具介绍
项目实战一:
用户消费行为数据分析实战
项目介绍和需求分析
数据介绍和数据导入
数据预处理
用户个体消费数据分析
用户消费行为数据分析
用户分层RFM模型
新用户、活跃用户、回流用户和用户流失分析
用户购买周期分析
用户生命周期分析
用户复购率分析
用户回购分析
用户营销和推荐分析
项目总结和报告撰写
项目实战二:
数据分析营销案例实战
一、数据概况分析
• 数据概况
• 数据清洗
二、单变量分析
• 观察样本0、1的平衡性
• 观察均值大小
• 可视化
三、相关性分析和可视化
四、逻辑回归模型的建立和评估
• 模型建立
• 模型评估
• 模型优化
五、业务价值
六、模型管理、发布和调用
第二天
项目实战三:
餐厅订单数据分析实战
一、数据概况分析
• 数据概况
• 数据清洗
最受欢迎的菜单分析及可视化展示
订单消费维度分析及可视化展示
日期与时间维度分析及可视化展示
菜单组合营销分析
项目总结
项目实战四:
物流数据粉实战
需求分析
数据预处理-重复值、缺失值、数据格式调整
异常值和偏态分布处理
月份列的数据格式处理
货品配送服务分析
销售区域潜力分析
商品质量分析
项目总结
项目实战五:
用户流失模型实战
技术架构介绍
流失模型构建
-数据清洗和转换
-空值和异常值处理
-数据归一化
-特征提取
-特征的降维和升维
-文本的数据化
决策树和随机森林介绍
基于Python的用户流失模型开发
模型测试
第一天
数据分析和挖掘流程介绍
数据挖掘的基本任务
定义分析和挖掘目标
数据取样
数据探索
单变量数据探索
数据关联性分析
数据预处理
数据特征工程构建和选择
挖掘建模
模型评价
数据分析和挖掘常用的工具
Jupyter工具介绍和使用
Numpy基本使用
Pandas基本使用
数据加载与处理
Pandas分组与合并
Pandas时间序列
Matplotlib基本使用
Scikit-Learn基本使用
PySpark工具介绍
项目实战一:
用户消费行为数据分析实战
项目介绍和需求分析
数据介绍和数据导入
数据预处理
用户个体消费数据分析
用户消费行为数据分析
用户分层RFM模型
新用户、活跃用户、回流用户和用户流失分析
用户购买周期分析
用户生命周期分析
用户复购率分析
用户回购分析
用户营销和推荐分析
项目总结和报告撰写
项目实战二:
数据分析营销案例实战
一、数据概况分析
• 数据概况
• 数据清洗
二、单变量分析
• 观察样本0、1的平衡性
• 观察均值大小
• 可视化
三、相关性分析和可视化
四、逻辑回归模型的建立和评估
• 模型建立
• 模型评估
• 模型优化
五、业务价值
六、模型管理、发布和调用
第二天
项目实战三:
餐厅订单数据分析实战
一、数据概况分析
• 数据概况
• 数据清洗
最受欢迎的菜单分析及可视化展示
订单消费维度分析及可视化展示
日期与时间维度分析及可视化展示
菜单组合营销分析
项目总结
项目实战四:
物流数据粉实战
需求分析
数据预处理-重复值、缺失值、数据格式调整
异常值和偏态分布处理
月份列的数据格式处理
货品配送服务分析
销售区域潜力分析
商品质量分析
项目总结
项目实战五:
用户流失模型实战
技术架构介绍
流失模型构建
-数据清洗和转换
-空值和异常值处理
-数据归一化
-特征提取
-特征的降维和升维
-文本的数据化
决策树和随机森林介绍
基于Python的用户流失模型开发
模型测试

课程费用

6800.00 /人

课程时长

2

预约体验票 我要分享

近期公开课推荐

近期公开课推荐

活动详情

提交需求