动力电池大数据应用方法探讨.docx
电动化、网联化、智能化、共享化正在引领汽车行业革命,新能源汽车新四化使动力电池大数据应用成为可能。本文从实践的角度对动力电池大数据应用进行初步讨论,旨在通过数据化的工具、技术和方法,对动力电池应用的各个环节进行科学分析、引导和应用,从而达到优化动力电池应用效果和效率、降低成本、提高效益的目的。
动力电池大数据应用项目可按如下步骤开展,每个企业的情况均有不同,以下步骤可以根据实际情况进行调整。
1)业务初步需求分析,数据现状分析;2)数据探索,方案整理;3)方案评审、优化、确认;4)数据获取、存储、清洗、预处理;5)算法实现,结果校验;6)算法评审、优化、确认;7)工程代码开发;8)工程评审、优化、确认;9)UAT验收测试;10)部署上线;
业务初步需求分析,数据现状分析
2019年动力电池约占新能源汽车整车成本的30%~40%,以后可能会逐步降低。假设车辆续航400公里,电耗15kWh/百公里,电池包容量约为60kWh,电池包系统成本100美元/kWh(国际公认的目标),则电池包价格约为42000元/电池包(按汇率1:7计算),10万~20万级别车辆电池包成本约占42%~21%。注意上面计算电池包用的成本价、车辆用的零售价,因此如果车辆也按成本价计算,电池包的成本占比会更高。
面对占整车价值比例如此之高的一个关键零部件,主机厂没有想法是不可能的。研发、采购、制造、质量、销售、售后等部门都在绞尽脑汁。对研发来说,百公里电耗、SOC使用区间、充电兼容性、快慢充使用比例、充电接受能力、电池热管理、驾驶工况、电池容量衰减、电池内阻增大、电池一致性、电池日历寿命、电池循环寿命等都是重要指标,并且这些指标在实验室无法完全通过测试获取。对采购来说,电池质保条款、电池供应商选择需要有大量数据做支撑。对制造和质量来说,电池故障率是重要指标,并且只能通过车辆实际运行的数据来反应。对销售来说,电池在线可视化、电池体检、电池预警、二手车电池残值评估是能够打消客户疑虑并获取客户信任的重要手段。对售后来说,电池故障诊断、电池体检、电池预警、电池安全事故分析等使用大数据的方法可以极大提高效率。
由于传统车企没有电池回收这个业务,因此现在电池回收业务属于车企哪个部门的都有,比较混乱,但是电池回收对电池余能的判断需求是明确的,也是梯次回收价格的计算依据,使用大数据的方法可以极大程度降低检测成本,并且提高效率。业务部门把以上需求抛出来的时候,他们对动力电池数据可能完全没有概念。是否有数据?有哪些数据?数据字段定义?数据字段与业务的关系?数据存在哪?有多少数据?时间跨度多大?数据质量如何?更新频率?以上问题都需要数据挖掘人员与业务人员进行详细探讨,以便数据挖掘人员对数据现状有初步概念,并对业务有初步了解,了解业务背景下哪些是常见的数据,不同场景会导致数据如何变化,分析中涉及哪些关键字段或场景数据等,业务人员丰富的经验会帮助数据挖掘人员少走很多弯路。
数据探索,方案整理
经过需求分析、数据现状分析,数据挖掘人员在业务提供的样例数据上进行数据探索,探索维度包括数据缺失、数据异常、数据重复、数据概览、数据相关性等,并进行数据预处理。数据预处理后,如果仅需要计算指标,则根据业务需求进行指标计算;如果需要使用机器学习算法,则需要确认机器学习算法需要的特征和标签,选择合适的模型进行建模、训练和调优,并输出结果。将以上工作整理汇总形成数
据分析报告,并拟定动力电池大数据应用的初步方案。动力电池的指标、特征、标签都具有非常强的专业属性,只有对动力电池有深入了解、并且对数据有深入了解才能拟订出这些指标、特征、标签的计算方法,如果有同时具备动力电池和数据挖掘专业能力的人员最好,如果没有则需要动力电池和数据挖掘专业人员紧密配合。3)方案评审、优化、确认
将数据分析报告与业务人员进行深入沟通,特别是通过数据得到的指标和模型输出的结果与业务人员沟通来初步验证结论的正确性、可靠性和可行性,并对结果进行修正。业务方和数据挖掘方共同对方案进行评审,根据评审结果进行优化,之后双方确认。这里可能涉及理念的冲突,特别是大数据、AI被过度宣传的背景下,业务人员可能对数据挖掘期待过高,认为只要提出需求提供了数据,那么任何目标都是可以实现的。例如:能在电池发生着火前一个小时提前预警吗?能预测一下这块电池的剩余寿命吗?这两个问题涉及到非常多边界条件,如果不定义清楚是没办法回答的,然而只要涉及到边界条件,业务就有可能觉得方案一点都不智能不好用。沟通过程需要双方开诚布公,在某个关键点上达成一致,在此基础上确认双方认可的方案。
数据获取、存储、清洗、预处理
通过数据文件、数据库、API等途径获取数据,使用拟定的方案对数据进行清洗和预处理。中国新能源汽车的发展确实是走在世界