课程简介
随着近些年在全世界范围内的AI浪潮,各个公司都开始组建自身的AI团队并利用AI能力来扩展自身业务,由此行业中对于熟悉AI系统并能给出详细测试方案的测试人员有着迫切的需求。本课程会使用简单易懂的方式,从人工智能的原理作为切入点,拆解人工智能系统的各个组成部分,并详解讲解每一个部分的测试方案。本课程的特点在于从技术角度出发分析在人工智能系统中,测试人员应该如何开展测试活动以及为什么要这样开展,结合技术理论与实践,讲透人工智能的主流场景。 这其中包含了传统的机器学习, 也包含了使用深度学习构建的计算机视觉应用。 包含了利用Spark这样的分布式计算技术来构建和处理测试数据,也包含了使用ffmpeg+opencv这样的图像处理技术来构建计算机视觉的测试场景。
目标收益
1. 人工智能的算法原理,设计过程以及构建成一个完整的人工智能系统都需要哪些组件以及对应的设计。
2. 从个测试人工智能的模型的方法开始,讲解到一个完整的人工智能系统的方方面面的测试方案。
3. 学习以spark为例讲解在人工智能系统中,如何构建和处理测试数据。
4. 学习以ffmpeg+opencv为基础如何在计算机视觉场景中构建和处理测试数据。
5. 以yolo为例,讲解如何在使用人工智能来辅助测试人工智能系统。
培训对象
在人工智能背景下工作的测试人员,或者对人工智能感兴趣的技术人员
课程大纲
L1. 人工智能基础(预计2小时) |
1. 专家系统与机器学习: 以专家系统为切入点,讲解早期人工智能系统的形态,并通过银行信用卡反欺诈的案例来引出机器学习是如何解决业务问题的。 在讲解专家系统和机器学习的异同时,以简单易懂的语言描述人工智能的原理以及人工智能是如何解决业务问题的。在这一章节中主要讲解人工智能的运作原理以及业务形态。 2. 特征与模型: 讲解人工智能的产物--模型的原理和形态。 分别讲解二分类,多分类以及回归类的模型有何不同,分别对应何种场景。并以信用卡反欺诈为案例讲解在人工智能中特征是什么,模型又是什么,从业人员说的参数服务又是什么。 3. 最典型的算法--逻辑回归介绍 通过介绍机器学习中最典型的算法--逻辑回归来讲解机器学习算法的基本运作原理,在这一章节中会通过逻辑回归一次介绍机器学习算法的基本概念,比如:激活函数,梯度下降,batch size,训练轮数等超参数。结合前两个章节总结整个机器学习的业务场景。 4. 其他知识点介绍 a. 决策引擎--专家系统与机器学习的结合 b. 特征组合与时序特征数据库 c. automl与迁移学习 |
L2. 人工智能测试基础 -- 模型评估标准(预计半小时到1小时) |
1. 混淆矩阵 介绍混淆矩阵的概念以及构建混淆矩阵的方法 2. 精准率,召回率与F1 score 讲解如何通过混淆矩阵来统计精准,召回和F1socre作为模型评估指标。并通过案例讲解什么场景下侧重于什么指标来评估模型。 3. ROC与AUC 简单描述ROC与AUC的含义,并说明它的参考意义 4. 分组指标统计与过拟合 讲解过拟合的含义以及什么情况下会出现过拟合, 再分别通过分组指标统计来评估每个维度下的模型效果。 并且统计每个区间的预测值的稳定性 |
L3. 人工智能测试基础 -- 测试数据采集原则(预计1小时) |
1. 训练集,验证集,测试集 介绍在人工智能场景中,训练集,验证集与测试集各自的作用,并讲解如何构建相关的数据集 2. 选取数据的策略 a. 通过一些场景来介绍在选取测试数据时的策略,比如时序性数据,分布不均匀的数据等。 b. 演示通过spark dataframe来构造和采集数据的过程。(假设听众有spark的背景, 如果没有则进行L5的讲解) |
L4. 分布式计算Spark详解(如果客户没有大数据背景的话则讲解本章,如果有则忽略,预计2小时) |
1. rdd简介, 并且简单介绍各个算子的作用。 2. spark sql和dataframe简介(就是简单介绍) 3. 数据分区(partition)与spark的计算流程 4. 通过spark采集数据以及构建测试数据的方法 |
L5. 人工智能平台案例讲解(预计2.5小时) |
1. 人工智能平台业务与模块介绍 a. 数据中心 b. 建模中心 c. 线上工程 d. 自学习与数据闭环 e. 线上实时训练与实时指标监控 2. 性能测试介绍 a. 介绍特征维度与数据构造的关系 b. 演示通过spark构建不同特征维度的数据。 c. 演示通过异步io构建海量小文件数据。 3. 人工智能平台的数据治理简介 a. 数据血缘 b. 数据的生命周期(时序特征数据库与离线数据的TTL与治理 4. 人工智能平台的K8S与hadoop生态的结合 a. 人工智能与Hadoop结合时的架构介绍与测试场景 b. 人工智能与K8S结合时的架构介绍与测试场景 5. 线上线下一致性测试与数据质量监控 |
L6. 计算机视觉基础(2.5小时) |
1.神经网络与深度学习 通过逻辑回归扩展讲解神经网络,并通过神经网络扩展讲解深度学习。 2. 卷积神经网络介绍 通过讲解RGB色彩通道与卷积运算来说明卷积神经网络与普通的神经网络有何不同,深度学习是如何识别图片中的物体的。 3. 常见的计算机视觉场景介绍。 讲解常见的计算机视觉的业务场景,计算原理等。包括但不限于目标检测,行为识别,人脸识别等等。 4. 效果测试介绍 讲解在计算机视觉场景下,评估模型的场景与普通场景有什么区别。 5. 两阶段模型介绍与对应的性能测试场景。 讲解在视频流场景下,算法的原理,以及在此场景下影响性能测试的因素。 |
L7. 计算机视觉场景下的数据构造(2小时) |
1. 图像基础讲解 讲解图像处理的基础,包括容器,FPS,抽帧,分辨率,码率等等。 2. ffmpeg基础 讲解ffmpeg命令的基础,如何通过ffmpeg实现视频抽帧, 图片合成,视频转码,视频截取等操作 3. 摄像头模拟 讲解如果通过ffmpeg + EasyDarwin来搭建流媒体服务器来模拟网络摄像头。 4. opencv基础讲解 讲解opencv的基础,如何编写demo程序 5. opencv的数据构建 讲解如何通过opencv编写程序去处理图片,如图片翻转,灰度化,锐化,去噪等等。 |
L1. 人工智能基础(预计2小时) 1. 专家系统与机器学习: 以专家系统为切入点,讲解早期人工智能系统的形态,并通过银行信用卡反欺诈的案例来引出机器学习是如何解决业务问题的。 在讲解专家系统和机器学习的异同时,以简单易懂的语言描述人工智能的原理以及人工智能是如何解决业务问题的。在这一章节中主要讲解人工智能的运作原理以及业务形态。 2. 特征与模型: 讲解人工智能的产物--模型的原理和形态。 分别讲解二分类,多分类以及回归类的模型有何不同,分别对应何种场景。并以信用卡反欺诈为案例讲解在人工智能中特征是什么,模型又是什么,从业人员说的参数服务又是什么。 3. 最典型的算法--逻辑回归介绍 通过介绍机器学习中最典型的算法--逻辑回归来讲解机器学习算法的基本运作原理,在这一章节中会通过逻辑回归一次介绍机器学习算法的基本概念,比如:激活函数,梯度下降,batch size,训练轮数等超参数。结合前两个章节总结整个机器学习的业务场景。 4. 其他知识点介绍 a. 决策引擎--专家系统与机器学习的结合 b. 特征组合与时序特征数据库 c. automl与迁移学习 |
L2. 人工智能测试基础 -- 模型评估标准(预计半小时到1小时) 1. 混淆矩阵 介绍混淆矩阵的概念以及构建混淆矩阵的方法 2. 精准率,召回率与F1 score 讲解如何通过混淆矩阵来统计精准,召回和F1socre作为模型评估指标。并通过案例讲解什么场景下侧重于什么指标来评估模型。 3. ROC与AUC 简单描述ROC与AUC的含义,并说明它的参考意义 4. 分组指标统计与过拟合 讲解过拟合的含义以及什么情况下会出现过拟合, 再分别通过分组指标统计来评估每个维度下的模型效果。 并且统计每个区间的预测值的稳定性 |
L3. 人工智能测试基础 -- 测试数据采集原则(预计1小时) 1. 训练集,验证集,测试集 介绍在人工智能场景中,训练集,验证集与测试集各自的作用,并讲解如何构建相关的数据集 2. 选取数据的策略 a. 通过一些场景来介绍在选取测试数据时的策略,比如时序性数据,分布不均匀的数据等。 b. 演示通过spark dataframe来构造和采集数据的过程。(假设听众有spark的背景, 如果没有则进行L5的讲解) |
L4. 分布式计算Spark详解(如果客户没有大数据背景的话则讲解本章,如果有则忽略,预计2小时) 1. rdd简介, 并且简单介绍各个算子的作用。 2. spark sql和dataframe简介(就是简单介绍) 3. 数据分区(partition)与spark的计算流程 4. 通过spark采集数据以及构建测试数据的方法 |
L5. 人工智能平台案例讲解(预计2.5小时) 1. 人工智能平台业务与模块介绍 a. 数据中心 b. 建模中心 c. 线上工程 d. 自学习与数据闭环 e. 线上实时训练与实时指标监控 2. 性能测试介绍 a. 介绍特征维度与数据构造的关系 b. 演示通过spark构建不同特征维度的数据。 c. 演示通过异步io构建海量小文件数据。 3. 人工智能平台的数据治理简介 a. 数据血缘 b. 数据的生命周期(时序特征数据库与离线数据的TTL与治理 4. 人工智能平台的K8S与hadoop生态的结合 a. 人工智能与Hadoop结合时的架构介绍与测试场景 b. 人工智能与K8S结合时的架构介绍与测试场景 5. 线上线下一致性测试与数据质量监控 |
L6. 计算机视觉基础(2.5小时) 1.神经网络与深度学习 通过逻辑回归扩展讲解神经网络,并通过神经网络扩展讲解深度学习。 2. 卷积神经网络介绍 通过讲解RGB色彩通道与卷积运算来说明卷积神经网络与普通的神经网络有何不同,深度学习是如何识别图片中的物体的。 3. 常见的计算机视觉场景介绍。 讲解常见的计算机视觉的业务场景,计算原理等。包括但不限于目标检测,行为识别,人脸识别等等。 4. 效果测试介绍 讲解在计算机视觉场景下,评估模型的场景与普通场景有什么区别。 5. 两阶段模型介绍与对应的性能测试场景。 讲解在视频流场景下,算法的原理,以及在此场景下影响性能测试的因素。 |
L7. 计算机视觉场景下的数据构造(2小时) 1. 图像基础讲解 讲解图像处理的基础,包括容器,FPS,抽帧,分辨率,码率等等。 2. ffmpeg基础 讲解ffmpeg命令的基础,如何通过ffmpeg实现视频抽帧, 图片合成,视频转码,视频截取等操作 3. 摄像头模拟 讲解如果通过ffmpeg + EasyDarwin来搭建流媒体服务器来模拟网络摄像头。 4. opencv基础讲解 讲解opencv的基础,如何编写demo程序 5. opencv的数据构建 讲解如何通过opencv编写程序去处理图片,如图片翻转,灰度化,锐化,去噪等等。 |