职位关键词
投递时间:2025年12月11日-2026年03月11日
职位描述:
岗位职责:
1、参与大语言模型(LLM)、视觉模型(VLM/LVM)在端侧设备(如手机、嵌入式设备)上的部署与优化;
2、负责模型量化等模型轻量化技术的研究与实现;
3、推动模型在GPU、NPU等硬件平台上的高效推理;
4、配合算法团队完成模型部署流程的自动化与标准化;
5、探索大模型在移动端的性能优化方案,提升推理速度和资源利用率;
6、与安卓应用开发团队协作,实现模型在移动端的集成与部署。
任职资格:
1、应届本科生、硕士生,计算机、人工智能、电子工程、自动化等相关专业;
2、对大模型(LLM/VLM/LVM)有基本概念理解,了解其结构与训练过程;
3、熟悉Python、Java或C++编程语言,具备良好的代码能力;
4、具备基本的安卓开发知识(如Java、AndroidStudio、APK构建流程);
5、熟悉GPU的使用,了解CUDA、TensorRT等工具者优先;
6、有大模型相关开发或部署经验者优先;
7、有模型量化、模型压缩、模型部署相关项目经验者优先;
加分项:
1、有HuggingFace、PyTorch、ONNX、TensorFlowLite等框架使用经验;
2、有参与开源项目或在GitHub上有相关项目贡献;
3、有较强的逻辑思维能力、学习能力与团队协作精神。