返回职位列表

AI Infra

高级 AI 工程师(AI Agent 与 LLM Infra)

构建 Agent 架构、LLM 协议集成、AI-native 开发流程和生产级 AI 服务。

北京 / 武汉 / 长沙 / 深圳 全职 AI Infra

职位详情

你会负责

  • 设计和实现具备复杂推理、多步规划与自我修正能力的 AI Agent 系统。
  • 研究和集成 OpenAI、Anthropic、MCP 等主流协议,优化模型调用、上下文利用和推理稳定性。
  • 通过 AI-native workflow 表达高层架构意图并推动快速实现。
  • 把前沿 AI 研究转化为可扩展的生产服务,在高并发下保持低延迟和稳定响应。

我们希望你具备

  • 深入理解 Transformer、attention、KV Cache optimization、quantization 和 tokenization。
  • 熟悉低层 LLM interaction protocol,包括 streaming、state management 和 function calling 边界情况。
  • 熟悉端到端 RAG 优化,包括 chunking、reranking 和 multimodal data integration。
  • 熟练使用 Claude Code、Cursor、Codex 等现代 AI 开发工具,并具备良好代码品味和架构判断。
  • 具备 Python、Rust、Go 或 Node.js 等语言中的异步编程和系统架构能力。
  • 有 vector database、graph database 和 high-performance cache 经验。
  • 能够设计和运行 AI accuracy 与 safety evaluation framework。

加分项

  • 有 distributed AI system、multi-agent collaboration network 或 autonomous workflow 经验。
  • 了解 local inference acceleration 或 fine-tuning 等 LLM infrastructure。
  • 有活跃 GitHub、技术社区项目或高质量技术写作。

我们提供

  • 支持主流 AI 开发工具、IDE 和模型 API 订阅。
  • 扁平团队,支持快速 AI-native 产品迭代。
  • 近距离参与前沿 AI 技术和协议,并影响下一代 AI 应用形态。