3.精通C++,熟悉多线程编程、内存管理及性能分析工具(如Perf、Valgrind)
4.熟悉量化、稀疏化、投机推理、蒸馏等至少一项模型优化技术
5.熟悉 TensorRT、TensorRT-LLM、MLC-LLM、vLLM 等 至少一种推理引擎框架
6.熟悉GPU 架构和计算原理,有使用 CUDA、triton 等工具编写高性能自定义算子经验优先
7.有大语言模型、自动驾驶大模型、具身大模型在端侧部署优化经验优先

1. 精通Java/Python,对各种AI算法有一定的了解,有丰富的算法工程集成,并有大模型部署、性能优化和落地经验;
2. 有搜广推相关场景经验,对搜广推任意架构有一定的了解;
3. 深入了解transformers、vllm、sglang、tensorrt框架中的一种或多种,有多类模型的优化经验者优先;
4. 有扎实的编程基础、良好的编程风格和工作习惯,实际动手能力强;
5. 有良好的沟通表达能力和团队精神,有很好的通过技术解决真实问题创造业务价值的意愿。