职位详情

大模型研发工程师

面议
北京
毕业时间不限
学历不限
先生
职位关键词

投递时间:

职位描述:
岗位职责: 1、参与大语言模型的核心技术研发:参与大规模语言模型(LLM)在训练、微调、推理优化、模型架构探索(如MoE)、长上下文处理、多模态融合等一个或多个关键方向的研究与工程实践;2、算法实现与优化:负责将前沿算法、论文思路转化为可运行的代码,并进行性能调优(如分布式训练优化、计算效率提升、显存优化);3、数据处理与构建:参与大规模、高质量训练数据的收集、清洗、预处理及评估数据集的构建工作,理解数据对模型性能的关键影响;4、模型评估与实验分析:设计并执行模型训练和评估实验,分析实验结果,撰写技术报告,为模型改进提供数据支持;5、技术调研与跟踪:持续跟踪国内外大模型领域(LLM,VLM,Agent等)的最新研究进展(论文、开源项目、技术博客),并能进行深入理解和分析;6、工具与平台支持:熟悉并运用主流深度学习框架(如PyTorch)、分布式训练框架(如DeepSpeed,FSDP)、大模型开发工具链(如HuggingFaceTransformers,vLLM)等;7、参与将大模型技术应用于实际业务场景的研发工作,如智能对话、内容生成、代码辅助、知识问答等;
北京数慧时空信息技术有限公司
互联网 | 100-499人
为你推荐
校招网申北京本科及以上毕业时间不限
北京开源芯片研究院
校招网申北京本科及以上毕业时间不限
北京开源芯片研究院
北京硕士及以上毕业时间不限
中国航空发动机集团有限公司
北京本科及以上2026届
中国有研科技集团有限公司
北京硕士及以上5天/周
人民邮电出版社
北京硕士及以上5天/周
北京韬安律师事务所
校招网申北京本科及以上毕业时间不限
北元电器电气机械/器材
北京本科及以上毕业时间不限
北京南口斯凯孚铁路轴承有限公司
北京本科及以上毕业时间不限
北京欣天和怡