职位关键词
投递时间:2026年01月26日-2026年04月26日
职位描述:
岗位职责:
1. AI应用平台后端开发:(1)基于FastAPI/Flask搭建高性能的大模型应用后端,实现多模态交互、会话管理、权限控制等核心功能;(2)设计并实现RAG(检索增强生成)完整链路:包括文档解析(PDF/Word)、分块(Chunking)、向量化存储、混合检索(Hybrid Search)与重排序(Rerank)。2.大模型推理服务(Model Serving):(1)负责私有化大模型的部署与加速,使用 vLLM / TGI / TensorRT-LLM 等框架,优化推理吞吐量(Throughput)和首字延迟(TTFT);(2)设计GPU资源调度机制,解决多用户并发请求下的显存排队与负载均衡问题。3.系统架构与国产化适配:(1)负责系统的容器化(Docker)与编排(K8s),适应内网/离线环境的交付要求;(2)对接国产化算力环境(如华为昇腾、海光DCU),解决国产硬件下的算子兼容性与环境依赖问题。4.工程规范与性能优化:(1)主导代码Review,建立单元测试与CI/CD流程,确保军工级软件交付质量;(2)优化长文本处理、流式输出(Streaming)等场景下的网络传输与前端交互体验。
岗位要求:
1.本科及以上学历,计算机、电子、通信等相关专业,5年以上同岗位工作经验;2.语言与框架:(1)精通Python,深刻理解 Asyncio/Coroutines 异步编程原理;(2)精通FastAPI/Flask等Web框架,有大型RESTful API设计经验。3. AI工程经验:(1)熟悉 LangChain / LlamaIndex 等应用开发框架,理解Agent(智能体)的工作流编排;(2)熟悉向量数据库(Milvus / PgVector / Weaviate / Elasticsearch)的原理、部署与调优;(3)有实际的大模型私有化部署经验,了解量化(Quantization)、显存优化等技术。4.系统基础:(1)熟悉Linux系统编程,熟练使用 Docker、Docker-compose;(2)熟练使用Redis(缓存/队列)、Celery(异步任务)、PostgreSQL/MySQL。5. 业务匹配度:(1)有ToB/ToG 私有化交付经验,能接受偶尔的现场部署或封闭开发;(2)能快速阅读英文技术文档(HuggingFace/Github Issues)。6. 加分项:(1)有华为昇腾(CANN/MindSpore)开发或迁移经验;(2)有Nginx/Kong网关配置经验,懂WebSocket/SSE协议;(3)熟悉GraphRAG(知识图谱结合RAG)技术路径。