职位关键词
投递时间:
职位描述:
岗位职责:
1、参与大语言模型的核心技术研发:参与大规模语言模型(LLM)在训练、微调、推理优化、模型架构探索(如MoE)、长上下文处理、多模态融合等一个或多个关键方向的研究与工程实践;2、算法实现与优化:负责将前沿算法、论文思路转化为可运行的代码,并进行性能调优(如分布式训练优化、计算效率提升、显存优化);3、数据处理与构建:参与大规模、高质量训练数据的收集、清洗、预处理及评估数据集的构建工作,理解数据对模型性能的关键影响;4、模型评估与实验分析:设计并执行模型训练和评估实验,分析实验结果,撰写技术报告,为模型改进提供数据支持;5、技术调研与跟踪:持续跟踪国内外大模型领域(LLM,VLM,Agent等)的最新研究进展(论文、开源项目、技术博客),并能进行深入理解和分析;6、工具与平台支持:熟悉并运用主流深度学习框架(如PyTorch)、分布式训练框架(如DeepSpeed,FSDP)、大模型开发工具链(如HuggingFaceTransformers,vLLM)等;7、参与将大模型技术应用于实际业务场景的研发工作,如智能对话、内容生成、代码辅助、知识问答等;