万字长文详解自动驾驶汽车技术：从感知、定位、处理规划到执行

Sep 12, 2020

🔖自动驾驶

感知

摄像头

CCD 传感器 将电荷传输到芯片的特定角落进行读取，图像质量高
CMOS 传感器 每个像素都有自己的晶体管来读取与光的相互作用，功耗低，更容易制造
热成像相机 可以探测热物体（如行人或动物）和峰值照明情况（如隧道末端）
多个指向同一方向的传感器组成的 立体相机 可以生成三维立体视图
缺少发射源会降低干扰
弱光或恶劣天气条件下 适应性差 👎
数据量大 👎

超声波雷达

短距离有效
驻车辅助

毫米波雷达

容易被 金属物体 反射
容易从 曲面反弹，可能对此类物体视而不见
空间分辨率低，对目标的形状信息不多，很难区分多个目标 👎

4D成像雷达

使用更高能量的 77-79GHz 电波
可以扫描 100 度的视野，最远可达 300米
高分辨率

激光雷达

机械扫描激光雷达

视野广阔，技术成熟
比较大，昂贵 👎

基于微机电系统（MEMS）的激光雷达

通过一个或多个微小的 倾斜镜 来分配激光脉冲，倾斜镜的角度由施加在倾斜镜上的 电压控制

闪光激光雷达

在一次闪光中 散射激光束 照亮整个场景，返回的光被一个由微型传感器组成的 网格捕获
主要挑战是精确性

相控阵激光雷达

将激光束送入 一排发射器 中，这些发射器可以 改变穿过的光的速度和相位

超材料

将激光照射到动态可调谐的超材料上，这些人工构造的超曲面上的微小组件可以被动态调整以减慢激光束的部分速度，通过干涉，激光束将指向一个新的方向
由比尔盖茨资助的初创企业 Lumotive 声称，其基于超材料的激光雷达可以水平扫描 120 度，垂直扫描 25 度

地理定位

GPS

受到 云层覆盖 和 信号反射 等环境因素的影响 👎
信号还可能 被人造物体（如隧道或大型结构物）阻挡 👎

惯性测量单元(IMU)

使用 陀螺仪 和 加速度计 外推可用数据

航位推算法

使用 车轮周长、速度和方向盘数据，根据偶尔收到的GPS数据和 最后已知的位置 计算位置

高清地图

精度 < 1分米
通过对HD地图中已知目标的距离进行 三角剖分，可以确定车辆的 精确定位
可以表示 车道、几何图形、交通标志、路面以及树木 等物体的位置
以图层表示
挑战在于 生成高清晰度地图并使其保持最新的巨大努力，以及存储和传输这些地图所需的 大量数据存储和带宽

处理以及学习

同步定位与映射（SLAM）

定位需要一个地图，而定位需要一个好的位置估计
传感器融合 是将来自多个传感器的数据与数据库相结合，以获得更好的信息的过程
多层次 的过程

机器学习

卷积神经网络（CNN）

主要用于处理 图像和空间信息，提取感兴趣的特征，识别环境中的目标
由一个 卷积层 组成：一组滤波器，试图区分图像的元素或输入数据来标记它们
输出被输入到一个算法中，该算法将它们结合起来预测图像的最佳描述
最后一个软件组件通常称为 对象分类器，因为它可以对图像中的对象进行分类，例如街道标志或其他汽车

递归神经网络（RNN）

处理 视频等时间信息 的强大工具
前面步骤的输出作为输入输入输入到网络中，从而允许 信息和知识在网络中持续存在 并被上下文化

深度强化学习（DRL）

结合了 深度学习（DL） 和 强化学习
DRL方法允许软件定义的“代理”学习使用奖励功能在虚拟环境中实现其目标的最佳可能操作
主要挑战是 设计正确的奖励功能 来驾驶车辆

收集数据

需要在表示 真实场景的数据集 上对算法进行训练
数据集的一部分用于培训，另一部分用于 验证和测试
许多数据集，包括 街道对象的语义分割、标志分类、行人检测和深度预测，已经被包括Aptiv、Lyft、Waymo和Baidu在内的研究人员和公司公开提供
司机驾驶 原型车 收集和标记大量数据，代价高昂
模拟器 的虚拟场景由人类定义，比真实车辆所经历的随机性小

路径规划

voronoi图

占用网格算法

驾驶走廊算法

机器学习

执行

体系结构

分布式

每个 传感单元 处理其 原始数据 并与网络中的其他节点通信
在驱动和感知阶段之间引入了延迟，并增加了 数据验证的挑战

集中式

所有的 远程控制单元（RCU） 都直接连接到一个 中央控制点，该控制点收集所有信息并执行 传感器融合 过程
需要一台功能强大的 中央计算机，还需要一个 高带宽 的重型线束

混合解决方案

将在更高抽象级别工作的 中央单元 与执行专用传感器处理和/或执行决策算法的域结合起来

其他挑战

功率、热管理、重量、尺寸