返回职位列表

AI Infra

高级 AI 工程师（AI Agent 与 LLM Infra）

构建 Agent 架构、LLM 协议集成、AI-native 开发流程和生产级 AI 服务。

北京 / 武汉 / 长沙 / 深圳全职 AI Infra

职位详情

你会负责

设计和实现具备复杂推理、多步规划与自我修正能力的 AI Agent 系统。
研究和集成 OpenAI、Anthropic、MCP 等主流协议，优化模型调用、上下文利用和推理稳定性。
通过 AI-native workflow 表达高层架构意图并推动快速实现。
把前沿 AI 研究转化为可扩展的生产服务，在高并发下保持低延迟和稳定响应。

我们希望你具备

深入理解 Transformer、attention、KV Cache optimization、quantization 和 tokenization。
熟悉低层 LLM interaction protocol，包括 streaming、state management 和 function calling 边界情况。
熟悉端到端 RAG 优化，包括 chunking、reranking 和 multimodal data integration。
熟练使用 Claude Code、Cursor、Codex 等现代 AI 开发工具，并具备良好代码品味和架构判断。
具备 Python、Rust、Go 或 Node.js 等语言中的异步编程和系统架构能力。
有 vector database、graph database 和 high-performance cache 经验。
能够设计和运行 AI accuracy 与 safety evaluation framework。

加分项

有 distributed AI system、multi-agent collaboration network 或 autonomous workflow 经验。
了解 local inference acceleration 或 fine-tuning 等 LLM infrastructure。
有活跃 GitHub、技术社区项目或高质量技术写作。

我们提供

支持主流 AI 开发工具、IDE 和模型 API 订阅。
扁平团队，支持快速 AI-native 产品迭代。
近距离参与前沿 AI 技术和协议，并影响下一代 AI 应用形态。