最新新闻
我要投稿
联系电话:027-87592219/20/21转188
投稿邮箱:tb@e-works.net.cn
您所在的位置:首页 > 智库 > 智能服务

网联汽车预测性维护背后的数据科学

发布时间:2017-10-19 作者:Srivatsan Pivotal  来源:微信
关键字:网联汽车 数据科学 
谈到Pivotal 使用数据科学为福特、宝马、奔驰和大众等汽车公司开发网联汽车应用,我们不得不先回顾下公司在数据科学领域的发展。早在网联汽车行业宣称将在 2020 年达到 45% 的复合年增长率之前,Pivotal 就已是该领域首批开始开发先进的数据科学驱动型应用的公司之一,亦是首批拿出汽车参考架构,用以开发实时的数据科学驱动型应用的公司之一。
    谈到Pivotal 使用数据科学为福特、宝马、奔驰和大众等汽车公司开发网联汽车应用,我们不得不先回顾下公司在数据科学领域的发展。早在网联汽车行业宣称将在 2020 年达到 45% 的复合年增长率之前,Pivotal 就已是该领域首批开始开发先进的数据科学驱动型应用的公司之一,亦是首批拿出汽车参考架构,用以开发实时的数据科学驱动型应用的公司之一。
 
    Pivotal 能将所有的必要组件(包括数据传输服务、云原生架构、大数据平台、大规模并行分析、内存中数据网格和数据科学工具包)组合在一起,以将创新的数据驱动型概念转化为实时的客户体验。公司一贯的开源理念以及恪守敏捷开发的最佳做法,已让其成为应用数据科学领域的全球领导者。
 
    虽然本文主要讨论的是预测性维修,但Pivotal的现场工程、数据科学和 Pivotal Labs 团队亦对很多网联汽车的以下用例进行了调研:驾驶员行为分析、安全性改进、燃油效率提高、远程访问、车内资讯娱乐、电子商务、车队管理、车间防撞系统、远程诊断、保险调整、车流避让等等。
 
    在下文中,我们将逐一介绍具体的数据科学问题、数据源、处理工作负载、特征创建方法以及应用于预测性维护的机器学习算法。然后,我们也将介绍如何实现这些见解并加以利用。
 
    预测性维护问题  
 
预测性维修问题
 
图 1:预测性维修问题
 
    图 1 显示了典型的预测性维护问题:根据车辆给出例如诊断故障代码 (DTC) 和出现故障代码时的其他车辆参数(里程表读数、车速、发动机温度、扭矩等)的数据,我们是否可以预测出车辆要进行的后续修理或维护?
 
    比如说:一辆汽车行驶了 5 个月,期间发送了一些 DTC 和其他车辆参数。在第 5 个月月末,这辆车在经销商的服务中心进行了一次正常维修计划之外的变速器维修。如果这辆车从第一个月就开始发出 DTC,那么根据发出的 DTC 和其他车辆参数,能否预测出这次计划外的变速器维修呢?
 
    DTC 是由车辆中的车载诊断系统发出的字母数字代码,通常在车辆传感器报告数值超出正常范围或超出可接受范围时发出信号。预测性维护问题十分棘手,因为 有了DTC 信号并不总是预示随后要进行维护工作。例如,DTC出现可能指示或报告传感器故障,但也可能是由受监视的系统或者其他矫枉过正的故障传感器引起的。
 
    更复杂的是,多个计划外维修或计划外作业可能会在同一天进行。并且,一些 DTC 可能会提示“请检查引擎灯”,但却没有立即显示实际需要进行哪些维修工作。此类情况下,训练有素的机修工会根据一或多个 DTC 来确定要采取的最佳行动。但是,要建立一种全面的、基于精细规则的诊断方法却很难。不过,我们可以进行合理的假设:只要给出足够的人工维修历史记录,同时给出引发维修工作的 DTC,那么一个基于机器学习的数据驱动型方案应该可以推断出 DTC 和修理工作之间的关系。
 
    为何要解决预测性维护问题?  
 
    解决预测性维修问题对各方都大有裨益。汽车制造商可以通过它来监控其车辆可能发生的问题,潜在防止NHTSA 召回事件的发生。此外,它还可以作为一种强大的质量保证工具,通过分析传感器数据与维护工作之间的相关性和因果关系来识别潜在错误/不可靠的部件。对于经销商而言,它提供了一种监控车辆潜在问题的工具,从而提醒上游的汽车公司或客户加以留意。这样的客户体验很有可能会提高客户满意度评分。
 
    构建的解决方案还可以作为汽车机修工的数字助理。对于车队管理公司而言,预测性维护让他们可以了解自己的资产和运营,可以确定哪些车辆可能需要离开马路进行修理,从而更好地管理车队和库存。对于最终客户而言,他们可能不再需要处理意外或计划外的车辆维修,并且能够获得对潜在严重故障的即时预测警报。
 
    预测性维护的数据源  
 
    1.概括来说,推断 DTC 和修理工作之间的关系需要两个主要数据源:
 
    2.车辆传感器数据,包括 DTC 和其他车辆参数;
 
    来自经销商或汽车修理工的修理数据和修理诊断数据。
 
    对第一种数据集,汽车制造商们会以不同的方式进行采样和数据传输。有些汽车公司仅在出现 DTC 时才记录车辆参数,而其他汽车公司则会以高频率(例如每秒一次)来对车辆参数进行采样。从数据科学和机器学习的角度来看,采集的数据自然是越多越好。所以,高频采样的做法是非常可取的。重要的是,高频数据让我们在开发预测模型时能够不至于过分依赖于实际的DTC,因为纷杂的车辆参数可能会错误地生成 DTC。
 
    然后说到修理数据。一旦车辆在一段时间内发出了一序列 DTC 且该序列DTC被我们观察到了,那么我们就需要标记该序列。理想情况下,若一时间窗口包含一组 DTC,则其会被标记为其结束时所执行的修理作业的类型。要推断 DTC 和修理工作之间的关系,需要有足够大量的历史修理数据。幸运的是,大多数汽车制造商都非常善于从经销商网络处收集保修索赔和修理数据。修理数据的质量是预测修理工作和构建基于 DTC 的模型的关键因素。
 
    此外还存在一个权衡问题。随着修理说明变得愈加精细(假设数据整洁度和数据质量得以保持),建模问题就变得愈加困难。这是因为用于对修理进行分类的类别数量越来越多,严格限制了可用于每种修理类型的训练示例的数量。
 
    举个例子,如果我们将问题限制在一个方面(比如说,确定汽车是否需要计划外的变速器、引擎或悬挂系统维修),那么这个问题就更加易于管理,因为整个数据集都可用于对模型进行训练。但如果要确定变速器、引擎或悬挂系统维修的细节(例如,找出子系统或需要处理的部件),那么我们就必须对可用数据集进行分组,并随后针对每个分类使用较小的数据集。
 
    在与汽车公司的合作中,我们侧重于以分层的方式对主系统和子系统维修工作进行预测。换句话说,我们会先预测哪些主系统(例如变速器、引擎或悬挂系统等)最有可能需要维修。然后再根据第一层预测结果,来预测哪些子系统(变速器、引擎或悬挂系统等的子系统)最有可能需要维修。
 
    此外,对延迟要求也要有所考虑,解决方案也会根据具体情况而有所不同。对于汽车制造商和经销商而言,批量监控车辆质量仍须执行。如果目的是基于 DTC 或其他参数集合来提醒客户靠边停车或实时调整汽车系统,那么就需要实时/近实时处理延迟要求。
 
    预测性维护的数据工作负载  
 
    预测性维护问题的数据源既包括结构化数据源(例如,包括年份、品牌、型号等字段的车辆数据,保修部分和索赔等),也包括非结构化数据源(维修顺序说明,DTC 的时间序列以及里程表读数、速度、发动机温度、发动机扭矩、加速度等车辆参数,通常都是时间序列)。要为这些数据源构建机器学习模型,有必要将这些不同的数据源摄取到能够实现统一处理的后端数据系统中。

2
本文来源于互联网,e-works本着传播知识、有益学习和研究的目的进行的转载,为网友免费提供,并以尽力标明作者与出处,如有著作权人或出版方提出异议,本站将立即删除。如果您对文章转载有任何疑问请告之我们,以便我们及时纠正。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。