🔍
跨岗位语义干扰
扁平向量池中「前端开发」与「后端开发」高度相似,检索结果互相污染
→ T-RAG 树状索引按部门/岗位分支隔离,检索时先定位分支再语义匹配
📎
非文本简历解析
35% 简历为图片/PDF,纯文本 RAG 无法处理,候选人覆盖面严重不足
→ 多模态解析器(OCR + 视觉 Embedding),覆盖率 65%→95%
🔒
PII 数据合规
简历含身份证号、薪资等敏感信息,不可上传云端或进入向量库明文存储
→ NER 自动脱敏 + 加密存储 + 本地部署 + 全链路审计
⚡
筛选结果为空
硬条件过严导致无匹配候选人,传统 RAG 直接返回空结果,用户体验差
→ Agentic 自校正:自动放宽条件重试 ≤ 3 次,仍空则给出优化建议
📊
知识实时性
岗位模型频繁调整,招聘数据每日万级新增,向量索引需快速同步
→ T-RAG 增量更新单节点(非全量重建)+ API 回调实时刷新
🎯
多步骤任务编排
招聘流程涉及检索、解析、筛选、执行等多个步骤,步骤间有依赖和条件分支
→ Router Agent 统一调度,条件判断 + 循环重试 + 失败回退