职位关键词
投递时间:2025年07月15日-2025年10月15日
职位描述:
岗位职责:
1、统一视频模型架构设计
2、前沿技术探索与实现,探索DiffusionModel、Auto-regressiveModel在视频生成和理解的统一建模
3、研究文本-视频-音频多模态对齐技术和条件控制方法
4、大规模音视频理解和生成模型训练及优化
岗位要求:
1、学历背景:计算机科学、人工智能、电子工程、数学等相关专业硕士及以上学历
2、有大模型(文本、语音、视频、图像等)训练经验,对模型架构有深刻理解和优化经验
3、研究能力:具备独立的科研思维,能够阅读前沿论文并提出创新性改进方案,有生成模型或理解模型,统一模型的相关文章或项目经验
4、工程经验:熟悉分布式训练、混合精度训练等优化技术