首页
关于我们
公司简介
专业团队
合作案例
产品详情
最新资讯
公司动态
知识分享
产品中心
ASPICE
ISO26262
ISO21434
敏捷SPICE
资质培训
工具链
DPAI
低空飞行器
机器人
工程服务
培训课程
联系我们
人才招聘
用心服务·专业技术·合作发展 13524704775
NEWS

最新资讯

当前位置:首页 - 最新资讯 - 知识分享

亚远景-ISO/PAS 8800中的数据管理、数据完整性与数据集全生命周期要求

发表时间:2026-03-02 作者:亚远景科技 返回列表

一、数据管理:以安全为核心,覆盖全流程

ISO/PAS 8800将数据管理定义为AI系统安全开发的基石,其核心要求包括:

  1. 数据质量与多样性

    • 场景覆盖:训练数据需覆盖99%常规场景(如晴天、城市道路)及100%极端场景(如暴雨、夜间低光、冰雪路面)。例如,吉利汽车通过合成数据技术生成暴雨场景数据,将模型在未知场景下的识别准确率从85%提升至92%。

    • 无偏性:行人检测数据需包含不同肤色、体型、年龄的样本,标注误差率≤1%(如车道线标注误差≤5厘米)。地平线公司通过Label Studio标注平台确保数据一致性,并记录标注人员资质与审核流程。

    • 可追溯性:数据需记录来源(如摄像头型号、采集时间)、采集条件(如光照强度、车速)及标注过程(如人工审核次数)。MUNIK公司采用数据质量看板实时监控数据完整性、标注准确率等关键指标。

  2. 数据隐私与合规

    • 要求数据匿名化处理,与欧盟GDPR形成技术衔接,避免跨境传输风险。例如,中国《数据安全法》要求关键数据本地化存储,企业需建立属地化合规团队,通过“标准解读指南”实现全球协同。

  3. 工具支持

    • 数据清洗工具:如Google Cloud Data Fusion、Apache NiFi,用于自动化去噪。

    • 数据标注平台:如Label Studio,确保标注一致性。

    • 数据监控工具:如Great Expectations,实时验证数据分布是否符合预期。

二、数据完整性:从采集到应用的全程保障

数据完整性是确保AI系统决策可靠性的关键,ISO/PAS 8800提出以下要求:

  1. 采集阶段

    • 多源数据融合:通过多传感器(如摄像头、雷达、激光雷达)采集数据,降低单一传感器失效风险。例如,特斯拉Autopilot采用8摄像头+1毫米波雷达方案,在摄像头失效时由雷达接管感知任务。

    • 数据校验:记录数据来源、采集条件及标注过程,确保数据可追溯。例如,MUNIK公司通过数据质量看板监控数据完整性,误判率降低72%。

  2. 处理阶段

    • 数据清洗:去除噪声数据(如模糊图像、错误标注),提升数据质量。例如,吉利汽车采用数据清洗工具清洗数据,误判率降低72%。

    • 数据增强:通过合成数据、旋转、翻转等技术扩充数据集,提升模型泛化能力。例如,地平线公司通过数据增强技术将模型在未知场景下的识别准确率提升7%。

  3. 应用阶段

    • 实时监控:部署后持续监控传感器数据分布变化(如冬季路面摩擦系数改变),通过OTA更新推送优化后的模型版本。例如,MUNIK公司通过实时监控摄像头数据质量,发现污损时10秒内触发警报并切换至备用传感器。

    • 模型鲁棒性:设置动态置信度阈值(如0.95),当预测概率低于阈值时触发警报并切换至备用传感器或人工接管模式。例如,地平线征程5计算方案通过多模型投票机制,部署YOLO、Faster R-CNN等独立训练的模型,对检测结果进行投票决策,提升容错率。

三、数据集全生命周期:从需求到退役的闭环管理

ISO/PAS 8800定义了数据集全生命周期的六大阶段,形成闭环管理体系:

  1. 需求定义

    • 明确AI系统的功能边界与安全目标(如“自动驾驶系统在极端天气下的安全停车”),确保安全需求与车辆使用场景匹配。例如,吉利汽车通过ISO/PAS 8800认证后,其智能驾驶系统覆盖99.8%的复杂场景,百万公里实车验证未发生因AI失效导致的安全事故。

  2. 系统设计

    • 结合AI技术特性(如深度学习、强化学习)设计安全架构,采用冗余设计(如多传感器融合)降低系统性失效风险。例如,特斯拉Autopilot的8摄像头+1毫米波雷达方案,在摄像头失效时由雷达接管感知任务。

  3. 数据管理

    • 要求训练数据具备多样性、无偏性和可追溯性,通过数据清洗工具去除噪声数据。例如,吉利与腾讯、华为合作开发多模态感知数据集,通过合成数据技术生成暴雨场景数据,提升模型泛化能力。

  4. 验证测试

    • 通过仿真测试、场景覆盖分析(如corner cases)验证模型性能,引入对抗样本测试用例识别潜在攻击风险。例如,地平线公司通过仿真测试覆盖10万+边缘场景,构建“安全感知孪生模型”,识别传统测试未覆盖的“传感器干扰攻击”风险。

  5. 安全分析与风险缓解

    • 使用FMEA(失效模式与影响分析)识别对抗样本攻击、概念漂移等AI特有风险,并通过冗余系统或异常检测机制缓解。例如,MUNIK公司在感知系统中部署双激光雷达+三摄像头方案,结合冗余算法,将系统失效概率从0.1%降至0.01%。

  6. 持续监控与退役

    • 持续监控:部署后实时监控传感器健康度(如摄像头污损、雷达信号干扰)和模型输出置信度,当预测概率低于阈值时触发警报(如切换至人工接管模式),并通过OTA更新优化模型(如改进夜间感知能力)。例如,吉利汽车建立云端安全运营中心(SOC),将系统干预响应时间缩短至0.3秒。

    • 退役与报废:数据或某些元素不再使用时,需有规范流程完成下线清理,避免数据泄露风险。



推荐阅读:


亚远景-ASPICE评估:汽车软件开发过程评估的方法与经验总结

亚远景-ISO/PAS 8800与全球汽车AI监管趋同下的中国企业合规策略与技术适配

亚远景-ASPICE与ISO 26262:汽车软件安全与质量的双标

亚远景-ASPICE评估:汽车软件开发过程评估的有效方法

亚远景-ISO 26262与ISO 21434:汽车安全标准的双基石

亚远景-从标准到文化:ISO/PAS 8800能否定义“可信AI”的全球伦理?




推荐服务:

点击查看亚远景ASPICE咨询、评估、“认证”、培训服务

点击查看亚远景ISO26262咨询、认证、培训服务

点击查看亚远景ASPICE、ISO26262培训课程

点击查看亚远景ASPICE、ISO26262实施工具-APMS研发过程管理平台



咨询