课程简介
1. 使用“用户-电影”数据集、Large Movie Review Dataset、MovieLens Dataset、Netflix、TMDB、真实的用户离网流失分析数据集、真实用户的换机数据模型进行项目制内容讲解,阐述从经典协同过滤、略复杂的隐特征推荐算法、深度学习方案的推荐算法、大厂使用的“非经典”推荐算法(如word2vec模型在数据中的使用等)。
2.实践和理论相结合。学习期间将按照真实的“项目开发”模式进行。
目标收益
1.推荐系统算法基础和机器学习模型
2.数据集分析和推荐系统的整体结构
3.特征工程
4.基于协同过滤的商品推荐
5.基于协同过滤和隐特征的商品推荐
6.完成推荐系统的整体设计和算法验证
培训对象
有Python编程经验 至少1年软件工程研发经验 初步掌握机器学习算法的理论基础
课程大纲
第1节:推荐系统算法基础和机器学习模型 |
1. python解释器与概况 2. 数据挖掘和机器学习包的应用 3. 爬虫的编写 4. json与数据交换 5. 线性回归 6. Logistic回归 7. 随机森林 8. 层次聚类、空间密度聚类 9. 协同过滤 10. 卷积神经网络 |
第2节:数据集分析和推荐系统的整体结构 |
1. “用户-电影”数据集、Large Movie Review Dataset、MovieLens Dataset、Netflix、TMDB、用户离网流失分析数据集、用户的换机模型等数据集的各自分析。 2. 完成数据表读写和检索 3. 完成数据表关联分析 4. 完成两个进阶矩阵“用户列表”和“商品列表”,为协同过滤做准备 |
第3节:特征工程 |
1. 数据清洗:异常值、空值的处理 2. 完成数据分析和特征选择 3. 完成用户相似度、商品相似度的计算 思考:使用不同相似度会产生何种影响(非常重要) |
第4节:基于协同过滤的商品推荐 |
1. 搜索是推荐的系统基础 2. 邻接表的使用 3. 基于搜索系统,完成快速检索 4. user-based/item-based 协同过滤算法的使用 5. 分类标签和作用和如何定义标签 6. 商品评论中的分值计算 7. 邻接表的逆向使用:使用商品对用户打分 8. 建立用户兴趣模型 9. 构建少量用户访问记录 10. 构建用户“关键词”模型,思考和TopN模型的区别 |
第5节:基于协同过滤和隐特征的商品推荐 |
1.基于标准测试集,构建用户访问记录 2.基于标准测试集,构建商品被访问记录 3. 完成实时和离线的user-based 推荐 4. 完成实时和离线的item-based 推荐 5. 隐特征推荐的含义 6. LFM模型的算法原理 7. SVD模型和LFM的比较 8. LFM、SVD模型用于隐特征的推荐 |
第6节:完成推荐系统的整体设计和算法验证 |
1. 完成特征选择文档 2. 完成特征的构建 3. 完成基于LR的点击预估模型训练 4. 完成基于LR的线上推荐服务 5. 完成多种推荐算法的整合 6. 完成项目总结 |
思考: |
1. 如何获得更多的特征,如冷启动阶段。 2.是否能使用深度学习模型,如果可以,如何使用。 |
第1节:推荐系统算法基础和机器学习模型 1. python解释器与概况 2. 数据挖掘和机器学习包的应用 3. 爬虫的编写 4. json与数据交换 5. 线性回归 6. Logistic回归 7. 随机森林 8. 层次聚类、空间密度聚类 9. 协同过滤 10. 卷积神经网络 |
第2节:数据集分析和推荐系统的整体结构 1. “用户-电影”数据集、Large Movie Review Dataset、MovieLens Dataset、Netflix、TMDB、用户离网流失分析数据集、用户的换机模型等数据集的各自分析。 2. 完成数据表读写和检索 3. 完成数据表关联分析 4. 完成两个进阶矩阵“用户列表”和“商品列表”,为协同过滤做准备 |
第3节:特征工程 1. 数据清洗:异常值、空值的处理 2. 完成数据分析和特征选择 3. 完成用户相似度、商品相似度的计算 思考:使用不同相似度会产生何种影响(非常重要) |
第4节:基于协同过滤的商品推荐 1. 搜索是推荐的系统基础 2. 邻接表的使用 3. 基于搜索系统,完成快速检索 4. user-based/item-based 协同过滤算法的使用 5. 分类标签和作用和如何定义标签 6. 商品评论中的分值计算 7. 邻接表的逆向使用:使用商品对用户打分 8. 建立用户兴趣模型 9. 构建少量用户访问记录 10. 构建用户“关键词”模型,思考和TopN模型的区别 |
第5节:基于协同过滤和隐特征的商品推荐 1.基于标准测试集,构建用户访问记录 2.基于标准测试集,构建商品被访问记录 3. 完成实时和离线的user-based 推荐 4. 完成实时和离线的item-based 推荐 5. 隐特征推荐的含义 6. LFM模型的算法原理 7. SVD模型和LFM的比较 8. LFM、SVD模型用于隐特征的推荐 |
第6节:完成推荐系统的整体设计和算法验证 1. 完成特征选择文档 2. 完成特征的构建 3. 完成基于LR的点击预估模型训练 4. 完成基于LR的线上推荐服务 5. 完成多种推荐算法的整合 6. 完成项目总结 |
思考: 1. 如何获得更多的特征,如冷启动阶段。 2.是否能使用深度学习模型,如果可以,如何使用。 |