Perception Deployment Engineer

Caterpillar · Industrial · Beijing, China +1

This role focuses on deploying, optimizing, and validating deep learning perception models on embedded platforms for autonomous mining vehicles. It involves using tools like TensorRT and CUDA for inference acceleration, performance analysis, and system-level engineering in a Linux Embedded environment. Collaboration with algorithm, fusion, system, and hardware teams is crucial for integration and evolution, as well as problem-solving during full-process debugging and testing.

What you'd actually do

  1. 负责深度学习感知模型在车端嵌入式平台的部署、优化与验证:
  2. 在 Jetson / Orin 等 NVIDIA 嵌入式平台完成模型落地
  3. 使用 TensorRT、CUDA、cuDNN、ONNX Runtime 等工具进行端侧推理加速
  4. 针对延迟、吞吐量、内存占用、功耗等指标进行性能分析与优化
  5. 在 Linux Embedded 环境下开展系统级工程工作,包括:
  6. 驱动与系统配置协作
  7. 交叉编译、系统服务调试
  8. Docker / DeepStream / ROS2 等运行环境构建与维护
  9. 与算法、融合、系统及硬件团队紧密协作,完成感知模块在整车系统中的稳定集成与长期演进。
  10. 分担并支撑现有点云算法链路,在全流程联调和测试阶段参与问题定位与 Bug 排查,提高整体迭代效率。

Skills

Required

  • C++
  • Python
  • 激光雷达点云相关经验
  • 深度学习模型从训练到端侧部署的基本流程
  • 嵌入式平台实际落地经验
  • 问题拆解能力
  • 系统联调阶段独立推进问题定位与解决

Nice to have

  • 多线程并行
  • CUDA 加速
  • 目标检测
  • 目标分割
  • Jetson / Orin 等 NVIDIA 车端或机器人平台的真实项目经验
  • ROS2
  • DeepStream
  • 系统稳定性
  • 可维护性
  • 可扩展性

What the JD emphasized

  • 嵌入式平台
  • 端侧推理加速
  • 性能分析与优化
  • Linux Embedded 环境
  • 系统级工程工作
  • 模型落地
  • 实际落地经验

Other signals

  • deployment
  • optimization
  • embedded platforms
  • inference acceleration
  • performance analysis