如祺数据

如祺数据资产

亿级多模态全场景数据
助力模型高效迭代,定义可信任的AI未来

Behavioral Data

行为数据

真实场景数据·低成本采集·模型训练直用

基于真实驾驶场景,采集车辆前方感知范围内的障碍物位置、运动轨迹与相对速度,精准还原每一次加减速、变道、跟车的真实决策依据。

车载激光LiDAR

前视固态激光(M1P、只前窄前宽可见)、强度值、坐标值、时间戳

毫米波雷达

车辆正前方区域障碍物信息:包括相对位置、相对速度、加速度、障碍物数量

底盘CAN

时间戳、车速、4轮速、档位、前轮转角、总里程

车载惯导

时间戳、车辆位置、车辆姿态(四元数)、位置精度、速度、速度精度、IMU原始6轴陀螺加表

周视摄像头

标准7V分辨率1024x512(前宽、前窄、前左、前右、后左、后右、正后)

感知结果数据

车道线感知结果、障碍物感知结果

  • 车载激光LiDAR
  • 毫米波雷达
  • 底盘CAN
  • 车载惯导
  • 周视摄像头
  • 感知结果数据

数据采集日产能

  • 网约车场景
    1600H,130TB
  • 专项场景
    800H,70TB

数据分布

  • 广州
  • 上海
  • 重庆
  • 沈阳
Synthetic Data

合成数据

让 Corner Case 不再稀缺

成本更低 ·响应更快· 覆盖更全

基于真实采集数据扩展生成多样化训练场景,低成本填补视角盲区、补齐 Corner Case。

  • 光照变化

    光照变化

    一键切换白天、黄昏、夜间——基于物理引擎渲染,支持任意时段、任意光源组合,光影变化自然真实。

  • 天气变化

    天气变化

    晴/雨/雾/雪一键切换,场景天气自由组合,每一帧渲染均符合物理光学逻辑,让感知模型在各类天气下都能稳定识别。

  • 他车增删

    支持场景内新增或删减任意类型的其他车辆,构建多样的交通参与者环境。

  • 他车编辑

    支持对场景内其他车辆的车型替换,或轨迹编辑,搭配自适应交通流变化功能,构建复杂多变的交通环境。

  • 自车变道

    支持场景内自车轨迹编辑,搭配自适应交通流变化能力,构建复杂衍生交通环境。

  • 座舱合成数据

    音频+视觉同步 · 长尾场景全覆盖 · 隐私合规无忧

    座舱数据合成

    基于真实座舱采集数据仿真重建生成多模态座舱训练数据,让模型在真实上路前见过更多Corner Case。

Multimodal Training Dataset

多模态
训练数据集

数据开箱即用·训练无缝对接

亿级多模态数据资产,涵盖图像、文本、音频、视频全模态支持大模型垂类训练与场景定制。

数据类型数据内容应用方向
图像数据通用品类图片视觉感知模型训练
文本数据权威新闻资讯语言模型预训练
文本数据小说/叙事类创意写作类模型
音频数据BGM/背景音效语音合成模型
音频数据播客/对谈对话模型/语音识别
音频数据方言口音语音识别泛化
音频数据客服语音对话客服对话/意图识别
垂类行业-医疗医疗影像医疗影像分析模型
垂类行业-医疗中医药材数据中医AI/知识图谱

如祺数据
为行业打造高质量
AI数据