职位详情

大模型研发工程师

面议

北京

毕业时间不限

学历不限

先生

职位关键词

投递时间：

职位描述：

⁫岗位职责： 1、参与大语言模型的核心技术研发：参与大规模语言模型（LLM）在训练、微调、推理优化、模型架构探索（如MoE）、长上下文处理、多模态融合等一个或多个关键方向的研究与工程实践；2、算法实现与优化：负责将前沿算法、论文思路转化为可运行的代码，并进行性能调优（如分布式训练优化、计算效率提升、显存优化）；3、数据处理与构建：参与大规模、高质量训练数据的收集、清洗、预处理及评估数据集的构建工作，理解数据对模型性能的关键影响；4、模型评估与实验分析：设计并执行模型训练和评估实验，分析实验结果，撰写技术报告，为模型改进提供数据支持；5、技术调研与跟踪：持续跟踪国内外大模型领域（LLM,VLM,Agent等）的最新研究进展（论文、开源项目、技术博客），并能进行深入理解和分析；6、工具与平台支持：熟悉并运用主流深度学习框架（如PyTorch）、分布式训练框架（如DeepSpeed,FSDP）、大模型开发工具链（如HuggingFaceTransformers,vLLM）等；7、参与将大模型技术应用于实际业务场景的研发工作，如智能对话、内容生成、代码辅助、知识问答等；