2025自动驾驶数据标注企业TOP10榜单揭晓

《中商产业研究院》的一份报告预测,2025年,中国自动驾驶市场规模将接近4500亿元,自动驾驶技术的发展,需要海量、高质量的数据支撑,这些数据经过清洗和标注,才能成为机器可识别的训练数据。数据标注行业,无疑是AI时代的新基建行业。

感知、决策、执行,是自动驾驶的核心技术体系,其中,数据标注在车身感知、环境感知都扮演了重要角色。IDC预计,2025年,中国人工智能数据采集、标注服务市场规模将达到123.4亿元,自动驾驶是需求巨大且增长迅速的一个领域。

进入2025年,自动驾驶标注市场迎来变革的契机。

一是AI技术发展带来的自动化升级,可能会让这个劳动密集型的行业升级换代,另外,主机厂激增的复杂需求,也让那些优秀公司更容易实现身位的领先。

2025年,创业邦首次启动自动驾驶数据标注的榜单评选,旨在挖掘这一新兴行业在这一轮变革中的创新力量。

20250304-150634.jpg

行业需要效率变革,AI被给予厚望

2022年,是AI爆发的元年,也是自动驾驶爆发的元年。以人工标注为主的数据标注市场,将迎来一次大变革。

推动自动驾驶数据标注变革的最直接原因,是车载激光雷达在智能汽车的广泛应用。作为自动驾驶“眼睛”的激光雷达传感器精度更高,产生的数据更大、更复杂。比如激光雷达生成的是三维点云数据,相比二维图像,点云数据更复杂,标注时需要处理空间中的点集。此外,激光雷达的数据是连续性的,需要跨帧标注,种种原因,使得自动驾驶场景数据标注的需求量呈几何倍增长。

与此同时,自动驾驶的端到端技术革命正在掀起。无论是蔚小理等造车新势力,还是大众等传统车企,亦或是华为,都在逐步引进端到端技术,将自动驾驶的规则导向彻底转变成了数据导向。

以特斯拉FSD 为例,特斯拉 FSD每天从车队中收集的数据量高达 PB 级(1PB = 1024TB)。数据处理成为自动驾驶流程中的重中之重。特斯拉前AI高级总监Andrej Karpathy 曾表示,特斯拉自动驾驶部门将3/4的精力用在采集、清洗、分类、标注高质量的数据上面,只有1/4的用于算法探索和模型创建。

特斯拉在2023年将 FSD 代码量削减99%,让大模型更加依赖大数据“喂养”。但大模型本身存在难以解释的“黑盒效应”。因此,只能投喂更多的高质量数据,来尽可能修正错误与幻觉。

这对数据集的量级和传感模态都提出扩充需求。大量数据的需求,成为了数据标注行业变革的催化剂,原先“人海战术”式的数据标注难以应对这样的规模。

AI预标注的介入,成为数据标注企业的新质生产力。数据标注企业开始形成人机协同的智能化标注平台,行业内也开始进行自动化标注的探索。

尽管行业内对自动标注概念的意见不一,但在自动驾驶爆发元年的2022年,各家数据标注企业开始发力智能平台的布局。

以曼孚科技为例,曼孚科技推出的第三代 MindFlow SEED(下称“ SEED 平台”)通过引入驾驶数据建立RLHF(人类反馈强化学习)。在RLHF的帮助下,AI能快速掌握了人类经验。基于深度学习与计算机视觉构建大模型,曼孚科技可实现复杂场景下数据的高效处理与全自动化标注。

4D点云分割场景(2).jpg

基于积累的海量数据与标注经验,曼孚科技综合运用业界领先的模型结构,形成一套从数据预处理、算法推断到结果精修的完整算法链路,匹配不同应用场景。其中,典型场景效率可提升10倍以上,精准度达到99.99%以上。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 2025年3月4日 下午2:49
下一篇 2025年3月5日 上午10:09

热点文章

分享本页
返回顶部