职位详情

智能体算法工程师

300-800元/天
杭州
5天/周
硕士及以上
王女士
职位关键词
实习3个月深度学习 · 大模型算法算法工程化经验 · 发表算法相关优秀论文 · 参加算法相关竞赛/获奖 · 团队管理经验 · 优秀开源项目经历

投递时间:2025年12月31日-2026年01月30日

职位描述:
职位描述 1.负责Agent场景的效果优化,深入研究LLM后训练相关技术,包括CPT/SFT/RLHF/RLVR等,提高算法准确率和效率。 2.构建大规模高质量的数据(数据建设、数据抓取与解析、数据合成等),探究线上真实场景数据到RL过程的数据飞轮。 3.跟踪LLM领域的最新研究成果,用以持续提升算法应用效果,研究方向包括但不限于强化学习中的奖励模型的优化和创新,AgentRL,可验证奖励的构建和扩充。 4.深度参与产品研发和业务落地,将优化算法应用于具体业务场景,推动智能体技术的产业化落地。 职位要求 1.硕士及以上学历,计算机、人工智能、机器学习等相关专业,优秀的代码能力,掌握常用编程语言和算法(985,211大学硕士以上优先) 2.深入理解大语言模型的原理与架构,熟悉智能体技术的基本概念与应用场景,掌握深度学习、强化学习的基本理论与方法。 3.在大模型领域,主导过有影响力的项目或论文者优先;熟悉大模型训练、RL算法者优先。 4.具备良好的团队协作能力与沟通能力,能够与跨学科团队紧密合作,共同推动项目进展。 5.有较强的业务问题到算法模型的建模能力,有强烈的技术好奇心、自驱力和进取心,能及时关注和学习业界最佳实践。 我们不是普通写代码的,我们是清华NLP团队在工业界的延伸。在这里你能接触到学术界最新的Idea~去大厂你是第50000号员工,来这里你是Agent架构的奠基人。你的代码将定义这个行业未来的工作流。
杭州微瞬智能科技有限公司
为你推荐
校招网申杭州本科及以上毕业时间不限
得物App电子商务
杭州硕士及以上5天/周转正面议
杭州微瞬智能科技有限公司
杭州本科及以上毕业时间不限
中国铁塔股份有限公司浙江省分公司
杭州学历不限2026届
海信集团家用电器
杭州硕士及以上毕业时间不限
浙江交科交通科技有限公司
杭州硕士及以上毕业时间不限
浙江交科交通科技有限公司
校招网申杭州学历不限毕业时间不限
浙江省环境科技股份有限公司
杭州博士及以上毕业时间不限
Vivo
杭州博士及以上毕业时间不限
Vivo