返回职位列表
AI Infra
高级 AI 工程师(AI Agent 与 LLM Infra)
构建 Agent 架构、LLM 协议集成、AI-native 开发流程和生产级 AI 服务。
北京 / 武汉 / 长沙 / 深圳
全职
AI Infra
职位详情
你会负责
- 设计和实现具备复杂推理、多步规划与自我修正能力的 AI Agent 系统。
- 研究和集成 OpenAI、Anthropic、MCP 等主流协议,优化模型调用、上下文利用和推理稳定性。
- 通过 AI-native workflow 表达高层架构意图并推动快速实现。
- 把前沿 AI 研究转化为可扩展的生产服务,在高并发下保持低延迟和稳定响应。
我们希望你具备
- 深入理解 Transformer、attention、KV Cache optimization、quantization 和 tokenization。
- 熟悉低层 LLM interaction protocol,包括 streaming、state management 和 function calling 边界情况。
- 熟悉端到端 RAG 优化,包括 chunking、reranking 和 multimodal data integration。
- 熟练使用 Claude Code、Cursor、Codex 等现代 AI 开发工具,并具备良好代码品味和架构判断。
- 具备 Python、Rust、Go 或 Node.js 等语言中的异步编程和系统架构能力。
- 有 vector database、graph database 和 high-performance cache 经验。
- 能够设计和运行 AI accuracy 与 safety evaluation framework。
加分项
- 有 distributed AI system、multi-agent collaboration network 或 autonomous workflow 经验。
- 了解 local inference acceleration 或 fine-tuning 等 LLM infrastructure。
- 有活跃 GitHub、技术社区项目或高质量技术写作。
我们提供
- 支持主流 AI 开发工具、IDE 和模型 API 订阅。
- 扁平团队,支持快速 AI-native 产品迭代。
- 近距离参与前沿 AI 技术和协议,并影响下一代 AI 应用形态。