职位详情

视频生成模型加速工程师

面议
上海
2026届
本科及以上
先生
职位关键词

投递时间:2025年07月15日-2025年10月15日

职位描述:
岗位职责: 1、模型算法与架构优化:实现模型压缩技术(量化、剪枝、蒸馏等)、开发针对特定模型架构的专用优化算法、设计高效的分布式推理架构,支持大规模并发服务 2、模型推理优化:优化视频生成DiT模型的推理效率,降低显存占用和计算延迟、研究加速Auto-regressive模型方案 3、系统工程实现:开发高性能的自定义CUDAkernel和算子,集成和优化推理框架,构建高可用的模型服务系统 4、性能调优与监控:建立模型性能基准测试体系,分析和解决推理过程中的性能瓶颈,持续优化大规模GPU集群的资源利用率 岗位要求: 1、学历背景:计算机科学、软件工程、人工智能等相关专业本科及以上学历 2、编程能力:精通Python、C++,熟悉CUDA编程,具备扎实的算法和数据结构基础 3、深度学习基础:深入理解深度学习原理,熟练使用PyTorch等主流框架,熟悉模型量化技术(INT8、FP16、混合精度等) 4、系统能力:了解计算机系统架构,具备基本的性能分析和调优能力,熟悉KV-cache优化等技术 5、学习能力:对前沿AI技术有强烈兴趣,具备快速学习新技术的能力
上海米哈游网络科技股份有限公司
互联网和相关服务 | 50-99人
招聘简章更新于2025-11-30

图片图片图片图片