职位关键词
投递时间:2025年11月28日-2026年02月28日
职位描述:
岗位职责:
1、跟踪前沿关键技术,复现并改进相关算法模型;
2、理解用户需求,参与基于大模型的相关应用研发;
3、参与医疗、金融、政务行业大模型研发工作;
3、参与AI助手、写作辅助、Agent实现大模型关键技术产品研发;
4、参与大模型数据前处理、模型训练和优化等工作;
5.、参与团队内部的技术分享和交流。
任职要求:
1、计算机、软件工程、数学或统计学等相关专业,985或211高校硕士及以上学历,C9高校优先考虑;
2、熟悉自然语言处理(NLP)的基础理论和算法,掌握常见深度学习框架,并具有较好的实践能力;
3、熟悉常见LLM基础原理及差异,了解Self-Attention,KV-Cache等相关技术基本原理;
4、了解模型并行、序列并行、Attention优化等模型训练优化技术原理,有过SFT、强化学习大模型训练经验;
5、具备良好的团队合作精神,能够积极主动地与团队成员沟通和协作;
有相关实习经验者优先。