如祺数据资产

亿级多模态全场景数据
助力模型高效迭代，定义可信任的AI未来

标注数据
行为数据
合成数据
多模态训练数据集

Labeled Data

标注数据

行车场景

同源底图，多元素统一标注 · 精度更高，模型收敛更快

实现信号灯、车道线、障碍物等多元素空间对齐、时序一致、逻辑互洽，大幅提升模型训练效果

2D 信号灯
10+道路类型 · 15+信号灯种类 · 800万+标注帧数
3D 行车OD
目标ID一致 · 位置精确贴合 · 时序完全对齐
4D 道路元素
空间精准· 时序连贯 · 拓扑完整

场景覆盖

新旧车道

隧道

磨损车道

高速道路

城市道路

白天逆光

夜间无路灯

十字路口

上下坡

拥堵

匝道/分合流

通畅

施工区域

弯道

掉头

减速区域

高架

临时施工

泊车场景

精准还原全场景泊车环境

基于Fisheye、3D点云数据逐帧还原位置、尺寸,BEV数据精准标注车位轮廓、类型与状态

支持4种泊车场景
垂直泊车平行泊车斜向泊车路边泊车
覆盖4种复杂环境
有车位线无车位线狭窄车位障碍物泊车

语义分割数据集
类别丰富 · 语义明确 · 边界精准
像素级标注精度 · 全天候场景覆盖 · 开箱即用格式
OCC数据
空间连续 · 时序稳定 · 占据精确
3D空间感知增强 · 填补遮挡盲区 · 支持定制分辨率

Behavioral Data

行为数据

真实场景数据·低成本采集·模型训练直用

基于真实驾驶场景，采集车辆前方感知范围内的障碍物位置、运动轨迹与相对速度，精准还原每一次加减速、变道、跟车的真实决策依据。

前视固态激光（M1P、只前窄前宽可见）、强度值、坐标值、时间戳

车辆正前方区域障碍物信息：包括相对位置、相对速度、加速度、障碍物数量

时间戳、车速、4轮速、档位、前轮转角、总里程

时间戳、车辆位置、车辆姿态（四元数）、位置精度、速度、速度精度、IMU原始6轴陀螺加表

标准7V分辨率1024x512（前宽、前窄、前左、前右、后左、后右、正后）

车道线感知结果、障碍物感知结果

车载激光LiDAR
毫米波雷达
底盘CAN
车载惯导
周视摄像头
感知结果数据

数据采集日产能

网约车场景
1600H，130TB
专项场景
800H，70TB

数据分布

广州
上海
重庆
沈阳

Synthetic Data

合成数据

让 Corner Case 不再稀缺

成本更低 ·响应更快· 覆盖更全

基于真实采集数据扩展生成多样化训练场景，低成本填补视角盲区、补齐 Corner Case。

光照变化
一键切换白天、黄昏、夜间——基于物理引擎渲染，支持任意时段、任意光源组合，光影变化自然真实。
天气变化
晴/雨/雾/雪一键切换，场景天气自由组合，每一帧渲染均符合物理光学逻辑，让感知模型在各类天气下都能稳定识别。

他车增删
支持场景内新增或删减任意类型的其他车辆，构建多样的交通参与者环境。
他车编辑
支持对场景内其他车辆的车型替换，或轨迹编辑，搭配自适应交通流变化功能，构建复杂多变的交通环境。
自车变道
支持场景内自车轨迹编辑，搭配自适应交通流变化能力，构建复杂衍生交通环境。

座舱合成数据
音频+视觉同步 · 长尾场景全覆盖 · 隐私合规无忧
基于真实座舱采集数据仿真重建生成多模态座舱训练数据，让模型在真实上路前见过更多Corner Case。

Multimodal Training Dataset

多模态
训练数据集

数据开箱即用·训练无缝对接

亿级多模态数据资产，涵盖图像、文本、音频、视频全模态支持大模型垂类训练与场景定制。

数据类型	数据内容	应用方向
图像数据	通用品类图片	视觉感知模型训练
文本数据	权威新闻资讯	语言模型预训练
文本数据	小说/叙事类	创意写作类模型
音频数据	BGM/背景音效	语音合成模型
音频数据	播客/对谈	对话模型/语音识别
音频数据	方言口音	语音识别泛化
音频数据	客服语音对话	客服对话/意图识别
垂类行业-医疗	医疗影像	医疗影像分析模型
垂类行业-医疗	中医药材数据	中医AI/知识图谱

如祺数据资产

标注数据

行车场景

2D 信号灯

3D 行车OD

4D 道路元素

场景覆盖

泊车场景

支持4种泊车场景

覆盖4种复杂环境

语义分割数据集

OCC数据

行为数据

数据采集日产能

数据分布

合成数据

光照变化

天气变化

他车增删

他车编辑

自车变道

座舱合成数据

多模态训练数据集

如祺数据为行业打造高质量AI数据

多模态
训练数据集

如祺数据
为行业打造高质量
AI数据