课程简介
案例背景:
1.针对带有分子结构的文献或专利,专利分析师无法快速将对应的结构分离,无法快速识别专利保护边界,更无法通过结构进行文献或专利的检索。目前缺乏一套具有针对性的分子图像的提取工具。本案例讲述了如何快速提取专利、文献中的分子结构,使其快速获得文献中的分子结构。加快了医药工业中文献情报的处理速度。
2.通过知识图谱,可以快速搭建医药工业情报体系与药物知识发现平台。通过该平台可以将全球医药工业情报数据有序互联,构成一体化药物情报分析及知识发现平台。本案例通过知识图谱相关技术,为医药工业构建了情报探索体系与数字化研发体系。
解决思路:
1.在案例1中,包含了目标检测、马尔科夫逻辑网络等AI技术的行业应用。通过化学信息学编码相关技术,将算法应用于分子结构图像目标提取与结构推断。在项目中,重点强调了AI能力如何与行业相融合,切实加速产业发展。
2.在案例2中,利用知识图谱技术对药物情报与药物发现过程做了统一的平台整合。通过KG领域的通用技术,NLP等相关AI技术构建医药领域的知识模型。通过图计算等方法挖掘医药工业中的潜在知识,管理生产过程。
成果:
上述项目案例均已落地实施,加速了医药工业的产业升级。医药工业领域的数字化转型刚刚开始,后续还需持续探索。行业属性是技术应用的基础,只有真正把握行业发展的脉络,才能构建落地的产品。
目标收益
1.深刻理解业务在项目中的重要地位。
2.使用户体会AI技术如何应用于医药产业
3.梳理AI产品的构建过程
培训对象
课程内容
案例方向
大规模机器学习算法/机器学习框架及实践/图神经网络/知识图谱/AIops/AITest
案例背景
1.针对带有分子结构的文献或专利,专利分析师无法快速将对应的结构分离,无法快速识别专利保护边界,更无法通过结构进行文献或专利的检索。目前缺乏一套具有针对性的分子图像的提取工具。本案例讲述了如何快速提取专利、文献中的分子结构,使其快速获得文献中的分子结构。加快了医药工业中获取文献情报的速度。
2.通过知识图谱,可以快速搭建医药工业情报体系,将全球医药工业情报数据加工并关联起来,构成一体化知识图谱平台。本案例通过知识图谱将各类情报概念相互关联,构成企业级药物情报引擎。
收益
1.深刻理解业务在项目中的重要地位。
2.使用户体会AI技术如何应用于医药产业
3.梳理AI产品的构建过程
解决思路
1.在案例1中,包含了目标检测、马尔科夫逻辑网络等技术的应用。通过化学信息学编码相关技术,将算法应用于分子结构图像目标提取与结构推断。在项目中,CV监测阶段具有很多细节的技术问题,例如,如何检测非联通分量,如何确定马尔科夫逻辑网络的权重等。
2.在案例2中,利用知识图谱技术对药物情报体系做了统一的整合。主要使用了KG领域的通用技术,通过NLP等相关AI技术对实体进行抽取。在实体抽取过程中,在数据获取方面,具有诸多困难,在数据实体提取上,也存在数据处理等诸多问题。
结果
项目基本达到预期,分子图像识别项目准确率还需要进一步提高。在这些产品与项目中,个人深刻的体会有很多。首先,一定要围绕行业做产品,过分追求先进的技术没有意义。其次,在做产品前需要评估用户的需求和期望,合理计算投入产出比。