职位关键词
投递时间:2025年11月03日-2026年02月03日
职位描述:
职位描述
1.参与操作系统的维护,负责RockyLinux、Ubuntu系统的镜像维护、镜像升级、配置更新等
2.参与GPU集群的维护,负责Kubernetes集群的正常运行,深入scheduler并研发GPU调度能力
3.参与ElasticSearch分析相关日志、运营数据并计划下一步动作以提升利用率、稳定性、降低成本等
4.参与AI框架的测试工作,负责sglang、vllm等AI框架并测试各模型在此框架上的的性能以及优化
5.参与AI模型的分发、部署,负责大模型基于p2p、mirror等技术的网络分发工作
职位要求
1.本科及以上学历,学士及以上学位,计算机类、通信类相关专业
2.了解RockyLinux(RHEL)、Ubuntu操作系统
3.了解Kubernetes集群管理以及Python、Golang开发语言者优先
4.具备较强的学习能力,思路清晰,灵活应变能力
5.具备出色的沟通技巧、优秀文字表达能力
6.具有团队合作精神和进取精神