开发经理
互联网
推荐课程
average > 0 ? $model->average . '分' : '10.0分' ?>

NLP自然语言处理算法及案例

李善思

前阿里巴巴 数据架构师

前阿里巴巴数据架构师,对大数据、自然语言处理、图像识别、Python、Java相关技术有深入的研究,积累了丰富的实践经验。在工业领域曾参与了燃煤优化、设备故障诊断项目,正泰光伏电池片和组件EL图像检测项目;在自然语言处理方面,担任导购机器人项目的架构师,主导开发机器人的语义理解、短文本相似度匹配、上下文理解,以及通过自然语言检索产品库,在项目中构建了NoSQL+文本检索等大数据架构,也同时负责问答对的整理和商品属性的提取,带领NLP团队构建语义解析层。具备深厚的大模型理论知识和实践经验,熟悉国内外大模型的发展趋势和应用场景。曾在实际项目中应用RAG,对色差检测有深入理解和实践操作、并使用大模型提取关键信息等。
重要参与项目:
1.正泰太阳能单多晶电池片(组件)的EL瑕疵检测:使用人工智能图像识别算法智能判断瑕疵,帮助节省人工。本项目还与MES对接得到太阳能组件信息以及瑕疵缺陷的标准(每个客户的瑕疵定义不同)用以帮助算法正确判断是否是缺陷。
2.化纤丝饼表面瑕疵检测项目:使用人工智能图像识别算法结合拍摄装置输入软硬一体的解决方案,并且与现场设备进行对接获取必要信息,帮助节省人工检测成本。
3.数字化工厂项目:针对工厂的数字化、自动化、智能化做详细的调研与方案的撰写。

前阿里巴巴数据架构师,对大数据、自然语言处理、图像识别、Python、Java相关技术有深入的研究,积累了丰富的实践经验。在工业领域曾参与了燃煤优化、设备故障诊断项目,正泰光伏电池片和组件EL图像检测项目;在自然语言处理方面,担任导购机器人项目的架构师,主导开发机器人的语义理解、短文本相似度匹配、上下文理解,以及通过自然语言检索产品库,在项目中构建了NoSQL+文本检索等大数据架构,也同时负责问答对的整理和商品属性的提取,带领NLP团队构建语义解析层。具备深厚的大模型理论知识和实践经验,熟悉国内外大模型的发展趋势和应用场景。曾在实际项目中应用RAG,对色差检测有深入理解和实践操作、并使用大模型提取关键信息等。 重要参与项目: 1.正泰太阳能单多晶电池片(组件)的EL瑕疵检测:使用人工智能图像识别算法智能判断瑕疵,帮助节省人工。本项目还与MES对接得到太阳能组件信息以及瑕疵缺陷的标准(每个客户的瑕疵定义不同)用以帮助算法正确判断是否是缺陷。 2.化纤丝饼表面瑕疵检测项目:使用人工智能图像识别算法结合拍摄装置输入软硬一体的解决方案,并且与现场设备进行对接获取必要信息,帮助节省人工检测成本。 3.数字化工厂项目:针对工厂的数字化、自动化、智能化做详细的调研与方案的撰写。

课程费用

6800.00 /人

课程时长

2

成为教练

课程简介

学习完本门课程,您将对自然语言处理技术有更深入的了解。掌握分词、词性标注、命名实体识别、文本分类、文本生成、聊天机器人等;课程基于时下比较流行的深度学习框架-PyTorch,其中更涉及深度学习主流框架LSTM模型以及自然语言处理的词向量。

目标收益

快速入门自然语言处理
掌握深度学习PyTorch框架使用方法
熟练进行项目开发
提供实战模板,快速提升深度学习的实际项目经验
了解目前技术趋势

培训对象

1. 有python开发基础的
2. 有机器学习经验的

课程大纲

第一章
自然语言处理定义及应用
自然语言处理应用案例讲解
自然语言的定义
应用现状
主流深度学习框架介绍
本课程需要用到的环境介绍与部署
1、Python
2、Pytorch
第二章
自然语言处理中的常用库介绍
1.Numpy&sklearn
2.gensim
3.NLTK
4.jieba
第三章
传统机器学习与神经网络
传统机器学习方式
1、Tf-idf讲解
2、朴素贝叶斯讲解
神经网络
1、激活函数
2、神经元
3、隐藏层
案例:新闻分类(垃圾邮件分类)
第四章
分词详解、词性标注与实体识别
分词算法讲解
1、语言模型和中文分词
2、基于词典分词
3、基于统计学分词
词性标注算法讲解(HMM)
命名实体识别算法讲解(CRF)
案例:中文分词实战
案例:中文命名实体识别实战
第五章
卷积网络与循环神经网络
卷积神经网络讲解
1、卷积层
2、池化层
示例:使用TextCNN文本分类
循环神经网络讲解
1、RNN
2、LSTM
3、GRU
使用RNN系列做文本分类
第六章
Seq2seq+attention详解
词向量
Attention注意力机制
Transformer机制
案例:诗歌生成
使用seq2seq打造聊天机器人
第七章
Bert详解
Bert模型本质内容
RoBert,tinyBert,Albert等派生框架
熟悉Bert训练方式
学会使用Bert处理下游任务
实战案例:
Bert处理意图识别任务
Bert处理中文阅读理解任务
第一章
自然语言处理定义及应用
自然语言处理应用案例讲解
自然语言的定义
应用现状
主流深度学习框架介绍
本课程需要用到的环境介绍与部署
1、Python
2、Pytorch
第二章
自然语言处理中的常用库介绍

1.Numpy&sklearn
2.gensim
3.NLTK
4.jieba
第三章
传统机器学习与神经网络

传统机器学习方式
1、Tf-idf讲解
2、朴素贝叶斯讲解
神经网络
1、激活函数
2、神经元
3、隐藏层
案例:新闻分类(垃圾邮件分类)
第四章
分词详解、词性标注与实体识别

分词算法讲解
1、语言模型和中文分词
2、基于词典分词
3、基于统计学分词
词性标注算法讲解(HMM)
命名实体识别算法讲解(CRF)
案例:中文分词实战
案例:中文命名实体识别实战
第五章
卷积网络与循环神经网络

卷积神经网络讲解
1、卷积层
2、池化层
示例:使用TextCNN文本分类
循环神经网络讲解
1、RNN
2、LSTM
3、GRU
使用RNN系列做文本分类
第六章
Seq2seq+attention详解

词向量
Attention注意力机制
Transformer机制
案例:诗歌生成
使用seq2seq打造聊天机器人
第七章
Bert详解

Bert模型本质内容
RoBert,tinyBert,Albert等派生框架
熟悉Bert训练方式
学会使用Bert处理下游任务
实战案例:
Bert处理意图识别任务
Bert处理中文阅读理解任务

活动详情

提交需求