©北京泰科博思科技有限公司   /   京ICP备09107432号-1   /   网站建设:中企动力 北京

新闻中心

News Center

>
>
>
数据科学和机器学习:工业的机会

数据科学和机器学习:工业的机会

作者:
北京泰科
2022/07/26
浏览量
【摘要】:
为了将数据科学的好处扩展到工业企业的其他部分,提供商正在提供具有用户友好界面的数据科学解决方案,使开发人员和非开发人员都能够探索数据、生成模型和开发见解。

不断增加的数字化使更多的数据收集成为可能,并促进机器学习在多个行业的应用。对更多产品种类、可追溯性、生产效率和响应速度的需求推动了这些应用程序的采用。为了将数据科学的好处扩展到工业企业的其他部分,解决方案提供商正在提供具有用户友好界面的数据科学解决方案,使开发人员和非开发人员都能够探索数据、生成模型和开发见解。

—— Ebele Maduekwe Analyst

目录:

 

一、Executive Overview

信息技术(IT)、数据科学和操作技术(OT)的融合正在推动跨行业的机器学习(ML)解决方案的发展。随着IT领域的应用进入OT领域,数据科学正成为一种需求,特别是对于从航空航天、汽车、专业或宠物化学品和包装消费品等行业的数据中获得快速洞察。结合加速的市场动荡,工业终端用户正在寻找新的解决方案,从他们的运营中发现见解,以提高竞争优势。

 

从产品开发到供应链优化,工业供应商正在构建解决方案,以满足对敏捷性、生产可追溯性、效率和响应速度的需求。从R&D或生产数据中提取的可操作的见解被用于解决价值链上的挑战。实现这一目标的一种方法是使用数据科学应用程序,如从R&D到生活生产的机器学习。目前的应用程序可以帮助减少“死资本”——在这种情况下,非常昂贵的资源无法交付价值,可能会导致数百万美元的收入损失。

 

在工业中采用数据科学的一个主要挑战是技术知识的不足。这使得从过程数据中快速构建、建模和获得洞察变得困难。另一方面,通常很难雇用和保留专门技能;也就是说,由于激烈而昂贵的竞争,数据科学知识和领域专家知识的正确组合需要支持应用程序开发。

 

作为回应,供应商正在设计数据科学解决方案,帮助开发者和非开发者在其价值链中构建、共享和部署可操作和可复制的模型。因此,数据科学正在从传统的大量代码方法演变为易于使用的无/低代码解决方案。在这个无代码/低代码用户界面中,一系列涉众,包括操作主题专家,可以为业务需求构建、验证和部署模型。最终,最终用户将学会结合数据和专业知识,随着时间的推移改变他们的业务方式。这一组合将推动竞争优势,使更好地响应客户需求和市场信号的速度和灵活性。

 

二、Data Science and Machine Learning:Transforming Industry

数据科学是各种应用和行业的关键,从自动驾驶、语音和面部识别到催化剂设计和食品和饮料配方。如今,许多行业领导者都采用了模式识别和学习算法,可以提取流程、系统和人类行为的见解。这些技术为一个充满新可能性的世界打开了大门,并从根本上改变了我们所知道的传统工艺。例如,虚拟现实、混合现实和增强现实技术的进步使现场工作人员和机器操作人员的操作安全性得以提高。利用数据科学的精准医疗发展使制药公司能够提供新的方法来使用临床数据来实现个性化体验,并实现更快的治疗上市时间。使用机器学习的产品配方实时动态建模简化了材料科学公司的产品开发,而无需增加原型制作的成本,这有助于推动它们领先于市场竞争对手。

 

(1) Data at Your Fingertips

随着企业继续数字化,研发和制造过程的“数据化”正在增长。在此之前,“大数据”一词被用来描述收集、转换和分析大量数据的过程。今天,许多大数据技术在许多行业中被定期和大规模地使用。然而,技术和算法的进步表明,在某些行业,大数据并不总是开发可操作见解的必要条件。

通过构建数据管道来组合不同的数据源,用户可以访问来自研发、生产和业务流程的数据。这样就很容易将所需的数据带到最终用户的指尖。

 

(2) Human Factor: The Missing Link

尽管大数据技术正在工业中被采用,但现有的劳动力并不总是具备编写正确问题和提取正确见解所需的专业知识。终端用户可以聘请数据科学专家来构建和验证他们的业务或数据模型,但这需要广泛的领域知识,在实现价值之前仍然需要集成操作环境。此外,培训劳动力是昂贵和耗时的。在材料科学领域,专业知识包括各种材料的化学结构和分子特性方面的广泛知识。这些知识是指导从早期研发过程到生产过程的关键。在这方面,化学和统计学是建立适用的数据科学解决方案的主要基础。对于很少或没有编码经验的用户来说,结合低编码/无编码数据科学解决方案是缩小这种人力资本差距并从操作和实验室数据中创造价值的一种方法。使用低代码/无代码解决方案的可视化支持环境,研究人员、工程师和其他涉众可以自动化模型构建、工作流设计和生成见解。

 

(3)Embracing Data Science and Machine Learning:Application Building-Block Methods for Industry

随着工业应用的发展,跟上这种发展所需的工具和技能也在发生变化。数据分析的日益民主化要求为企业应用重新设计数据科学和机器学习交付。特别是,没有办法使用高成本技术知识的工业组织可以实现其数字化目标,或利用其现有的劳动力规模已经存在的解决方案。重新设计数据科学和机器学习代码交付的一种方法是创建应用程序构建块。这创造了一个低代码/无代码的环境,允许机器学习专业知识有限的劳动力在视觉支持的环境中通过自动化机器学习更快地构建和验证数据模型。

一个关键的优势是应用程序模型在构建和验证之后的标准化和可重用性。它允许工业终端用户独立于数据科学,并更专注于优化生产kpi。它还允许数据科学挑战的成功模型与整个业务的其他人一致地共享。另一个优势是可以释放劳动力生产力的限制,并以以前不可能的方式产生生产力回报。这意味着主题专家可以快速积累知识,将主题知识与数据科学见解结合起来。主题专业知识和数据科学的这种协同作用,允许业务流程快速转换,并区分工业企业为客户交付价值的方式。

 

三、The BIOVIA Solution for Data Science within Industry

BIOVIA是达索的一个品牌,提供了一套解决方案,支持材料科学中的机器学习。这些解决方案将机器学习技术结合到一套数据科学应用程序作为数据管道工具,称为BIOVIA Pipeline Pilot。Pipeline Pilot连接并组合来自多个来源的数据;它读取、处理和清理数据,并开发数据模型。它可以用于可视化结果,并允许在低代码/无代码用户界面中共享管道协议,并将其部署为企业应用程序。

 

BIOVIA Pipeline Pilot提供:

• 各种ML模型的预构建架构。

• 连续和动态的模型参数优化的基础上坚实的统计和物理基础。

• 低代码/无代码用户界面,利用数据可访问性,数据民主化,释放劳动力潜力。

• 敏捷和精益的数据模型开发,所有数据模型都具有 自我验证和透明性。

• 全球范围内的数据优化,以处理小型和大型数据集,并允许灵活适应变化的客户业务模式。

• ML技术可以

 

根据客户的数据需求,这些解决方案可以部署在本地,也可以部署在云中,或者两者混合部署。BIOVIA的业务模型利用数据科学为全球范围内的数据建模提供模块化解决方案。这允许BIOVIA与客户/终端用户合作,在整个转型过程中促进持续的业务参与和供应商信任。

 

案例研究 1:产品性能预测

快速设计出满足客户痛点的产品是材料科学增值的关键。传统上,材料科学公司在开发/改进一种新/现有产品时,需要面对昂贵的长时间设计和更长的测试时间,以确定其产品的关键性能是否有价值。

 

这种方法的一个问题是产品开发周期的不确定性。传统上,研究人员需要通过物理测试和他们自己的专业知识来设计新产品。为了解决这一问题,BIOVIA Pipeline Pilot包含一系列技术,如定量结构性能关系(QSPR)建模,允许材料科学研究人员利用现有数据,通过检查材料分子结构变化和感兴趣的物理性能之间的相关性来预测产品性能。QSPR模型利用遗传函数算法生成相互交叉/突变的随机模型,从而生成性能提高的下一代模型。有了这些知识,研究人员可以指导他们的研究,更深入地了解影响产品性能的关键因素。

 

BIOVIA Pipeline Pilot已将QSPR模型应用于缓蚀剂、traction流体、光学透明度、染料色牢度和洗涤剂制造中的表面活性剂分子。

 

案例研究 2:产品配方和设计

对于材料科学公司来说,优化产品设计对于改进新产品或现有产品、适应市场和消费者偏好并符合监管要求非常重要。对于供应商来说,遵守这些标准可能代价高昂,因为需要考虑不同的数据参数。

 

对于轮胎橡胶、食品饮料配方、锂离子电池电解质、润滑剂或高性能混凝土等配方产品,BIOVIA Pipeline Pilot可以通过帕累托分析预测原材料的最佳配方,以最大限度地提高强度和提供最佳性能/质量,同时最小化成本。换句话说,管道试点解决方案可以确定材料科学实验室在给定的价格点上不同工艺的原材料的最佳混合。例如,Pipeline Pilot可以用于确定在恶劣天气条件下最佳轮胎性能所需的聚合物的正确组合。它还允许科学家比较模型性能,优化附加参数,并可视化结果。

 

案例研究 3:使用图像分析进行质量控制

一旦产品被制定或创建,它们的质量就可以通过公司定义的基准进行检查。对于材料科学公司的某些产品,传统的分析方法可能无法提供最优的质量结果,而且成本高昂,需要大量劳动力。利用来自其他流程的数据,公司可以分析其产品或流程的质量,并根据预先确定的阈值对其进行基准测试。BIOVIA Pipeline Pilot包含大量的图像处理和分析工具的集合,用于使用图像分析的质量检查,托管在一个用户友好的低/非代码环节。

 

BIOVIA Pipeline Pilot:Training a Model for Image Analysis

预先验证的功能块使科学家可以很容易地拖放组件以实现可生产模型。使用深度学习技术,用户可以建立一个模型,训练它,并使用训练后的模型进行图像预测。该解决方案已成功用于检测有缺陷的微电路,材料分析,颗粒分析,以及用于洗涤剂中去除污渍的图像校准。

 

四、Conclusion

数据科学和ML解决方案带来的有益的颠覆性影响是显而易见的。将颠覆性的潜力转化为现实需要变革性的解决方案,以迎接材料科学驱动公司面临的挑战。行业领导者正在他们的过程中采用数据科学和机器学习,以获得竞争优势,并更快地提供新的和可操作的见解。

 

本文翻译自Dassault Systèmes , 点击下方阅读原文 ,访问原文英文链接。

 

北京泰科博思科技有限公司是BIOVIA Pipeline Pilot官方指定代理商,有关软件详情或者技术支持请咨询北京泰科。

 

电话:010-64951848

邮箱:sales@tech-box.com.cn

 

北京泰科为广大学习分子模拟科研人员提供了交流讨论平台,泰科建立了BIOVIA Pipeline Pilot交流群,群里有专业老师解答问题,如有兴趣一起交流,欢迎来电/邮申请入群,作者期待您的参与!

 

公司简介:

北京泰科博思科技有限公司(Beijing Tech-Box S&T Co. Ltd.)成立于2007年,是国内领先的分子模拟及虚拟仿真综合解决方案提供商。

 

北京泰科博思科技有限公司与国际领先的模拟软件厂商、开发团队深入合作,为高校、科研院所和企业在材料、化工、药物、生命科学、环境、人工智能及数据挖掘、虚拟仿真教学等领域提供专业的整体解决方案。用户根据需要在我们的平台上高效的进行各种模拟实验,指导实际的生产设计。

 

北京泰科博思科技有限公司拥有一支一流的技术服务团队和资深的专家咨询团队,以客户真正需求出发,服务客户,为客户创造价值。我们秉承“职业、敬业、担当、拼搏、合作”的企业精神,致力于用国际领先的软件产品和专业全面的技术支持服务,成为客户可信赖的合作伙伴。 

热门新闻

MOLPRO2024.1的新特性
对现有方法的各种错误修复和改进。
时间:
2024-02-28 10:23
Discovery Studio 2024,开启你的药物设计之旅!
增强新功能上线
时间:
2023-12-14 09:38
COSMOLOGIC 2024版本来啦,新功能概览!
预测电解质体系的热力学性质、高品质预测固体溶解度、预测温度相关输运性质......
时间:
2023-12-14 09:32
Turbomole 7.7版本功能介绍
Turbomole 7.7版本功能介绍
时间:
2023-11-30 13:37
北京泰科赞助参展2023年第八届制药工艺论坛
2023年11月4日-5日,北京泰科博思科技有限公司荣幸参加了于南京举办的第八届制药工艺论坛,并在此次盛会上展示了相关领域的模拟软件产品和解决方案。
时间:
2023-11-09 14:54
北京泰科与您相约“第八届制药工艺论坛”
2023年11月4-5日相约南京
时间:
2023-10-25 10:26
What's New in BIOVIA Materials Studio 2023
BIOIVA Materials Studio 2023让您比以往任何时候都更准确、更方便地模拟更多的材料属性。
时间:
2023-04-27 13:25
“协同推进、逐梦航天”I北京泰科参展第十届化学推进剂学术会议
北京泰科科技提供分子模拟手段在推进剂研发过程中的应用
时间:
2023-04-24 13:19
北京泰科与您相约第十届全国化学推进剂学术会议
北京泰科博思科技有限公司诚挚邀请您莅临本次会议,聚焦新技术,共谋新发展!
时间:
2023-04-17 10:44
北京泰科参加2023年达索系统VALUE WIDE 大中国区合作伙伴大会
展望2023, 北京泰科将秉承初心,以自身实力和精湛的服务,致力于用国际领先的软件产品和专业全面的技术支持服务,成为客户可信赖的合作伙伴。
时间:
2023-03-22 13:18