面向真实应用
围绕长文档、代码生成、智能体和私有化部署中的实际推理压力,定义系统和芯片优化目标。
团队与招聘
君子务本在北京、武汉、长沙、深圳招募软件、系统与芯片方向的工程伙伴,一起把真实推理负载中的瓶颈转化为可部署的高性能基础设施。
加入后做什么
我们关注的问题很具体:长上下文怎样跑得更快,KV Cache 怎样放得更近,数据怎样少搬运,芯片内部带宽怎样用起来,功耗和部署成本怎样降下来。适合想把硬核研究和工程能力落到真实产品里的人。
围绕长文档、代码生成、智能体和私有化部署中的实际推理压力,定义系统和芯片优化目标。
从 Runtime、Compiler、Kernel 到芯片架构、验证和物理实现,参与一条完整的高性能推理路线。
这里有工程落地,也有可持续研究的问题,适合资深工程师、青年研究者、博士后和优秀学生一起推进。
开放方向
负责 SoC 与模块级 DFT 方案、测试电路、测试向量、时序约束和 bring-up 支持。
查看详情 物理设计参与低功耗物理实现、floorplan、place-and-route、signoff closure 与物理验证。
查看详情 系统架构定义 AI accelerator 产品与架构方案,协调软件、硬件和大模型工作负载方向。
查看详情 前端设计负责 NoC network 与 memory controller 相关前端设计和优化。
查看详情 前端设计负责 NPU 与计算子系统前端设计,贴近推理核心的数据路径和时序约束。
查看详情 前端设计负责 SoC integration、CRG、DFT 协作和前端 RTL 优化。
查看详情 芯片验证搭建 UVM 验证环境,开发测试用例,完成仿真调试、回归测试和覆盖率收敛。
查看详情 芯片验证主导子系统或整机验证架构,负责复杂模块验证与覆盖率闭环。
查看详情 LLM Runtime负责 LLM Serving Runtime 与 KV Cache 系统,覆盖调度、batching、profiling 与原型系统 bring-up。
查看详情 LLM Compiler负责 compiler、kernel 与 memory layout 能力,把硬件特性转化为可测量的推理性能。
查看详情 实习参与 benchmark、simulator、compiler/runtime 原型、operator mapping 与真实系统验证。
查看详情 AI Infra构建 Agent 架构、LLM 协议集成、AI-native 开发流程和生产级 AI 服务。
查看详情 架构建模建设 AI accelerator functional model,支持架构验证、NPU 软硬件开发和性能分析。
查看详情加入我们