职位详情

AIinfra工程师

面议
北京
2026届
硕士及以上
先生
职位关键词
电子信息类 · 计算机类

投递时间:2025年07月15日-2025年10月15日

职位描述:
岗位职责: 1、参与滴滴内部post-training框架研发,聚焦LLM+RL方向,设计框架架构与技术路线,提升其扩展性、稳定性与效率; 2、优化框架性能,如训练速度、显存占用等,降低训练成本,为LLM+RL训练提供有力技术支撑; 3、协同业务团队,将LLM能力在业务场景落地,根据业务需求定制训练方案并评估验证模型; 4、关注行业前沿,引入有价值的技术到公司框架和模型中,探索新算法与方法,推动技术创新。 岗位要求: 1、2026届毕业生,本科及以上学历,计算机科学、数学、统计学、自动化等相关专业; 2、熟悉Post-Training流程,深入了解RL领域,包括但不限于RM、PPO、DPO、GRPO等算法; 3、具备大模型训练框架开发能力,包括pytorch、megatron等; 4、具备强化学习框架开发能力,包括openRLHF、verl等; 5、具备一线的C++/Python工程能力,精通数据结构和常用算法,掌握各种编译、调试、性能分析工具,熟悉并行编程(CUDA/Triton等)优先。
滴滴出行科技有限公司
研究和试验发展 | 小于50人
招聘简章更新于2025-11-28

errorerrorerrorerror