职位详情

高级Python研发工程师(AI工程/大模型后台方向)

面议
西安
毕业时间不限
本科及以上
先生
职位关键词

投递时间:2026年01月29日-2026年04月29日

职位描述:
岗位职责: 1、AI应用平台后端开发: ①基于FastAPI/Flask搭建高性能的大模型应用后端,实现多模态交互、会话管理、权限控制等核心功能; ②设计并实现RAG(检索增强生成) 完整链路:包括文档解析(PDF/Word)、分块(Chunking)、向量化存储、混合检索(Hybrid Search)与重排序(Rerank)。 2、大模型推理服务(Model Serving): ①负责私有化大模型的部署与加速,使用 vLLM / TGI / TensorRT-LLM 等框架,优化推理吞吐量(Throughput)和首字延迟(TTFT); ②设计GPU资源调度机制,解决多用户并发请求下的显存排队与负载均衡问题。 3、系统架构与国产化适配: ①负责系统的容器化(Docker)与编排(K8s),适应内网/离线环境的交付要求; ②对接国产化算力环境(如华为昇腾、海光DCU),解决国产硬件下的算子兼容性与环境依赖问题。 4、工程规范与性能优化: ①主导代码Review,建立单元测试与CI/CD流程,确保军工级软件交付质量; ②优化长文本处理、流式输出(Streaming)等场景下的网络传输与前端交互体验。 岗位要求: 1、A本科及以上学历,计算机、电子、通信等相关专业,5年以上同岗位工作经验; 2、语言与框架: ①精通Python,深刻理解 Asyncio/Coroutines 异步编程原理; ②精通FastAPI/Flask等Web框架,有大型RESTful API设计经验。 3、AI工程经验: ①熟悉 LangChain / LlamaIndex 等应用开发框架,理解Agent(智能体)的工作流编排; ②熟悉向量数据库(Milvus / PgVector / Weaviate / Elasticsearch)的原理、部署与调优; ③有实际的大模型私有化部署经验,了解量化(Quantization)、显存优化等技术。 4、系统基础: ①熟悉Linux系统编程,熟练使用 Docker、Docker-compose; ②熟练使用Redis(缓存/队列)、Celery(异步任务)、PostgreSQL/MySQL。 5、业务匹配度: ①有ToB/ToG 私有化交付经验,能接受偶尔的现场部署或封闭开发; ②能快速阅读英文技术文档(HuggingFace/Github Issues)。 6、加分项: ①有华为昇腾(CANN/MindSpore)开发或迁移经验; ②有Nginx/Kong网关配置经验,懂WebSocket/SSE协议; ③熟悉GraphRAG(知识图谱结合RAG)技术路径。
中电科星河北斗技术(西安)有限公司
计算机软件 | 100-499人