大模型上下文窗口到一百万了。资料全塞进去,检索系统是不是可以退休了?
上下文越大,企业在检索系统上花的钱反而越多。
你塞一百本书进去,模型可能只认真看了开头和结尾几本。
以前理解 RAG,是"模型读不了太多,先帮他筛一筛"。
现在模型能读了,RAG 的价值变了——它决定什么信息能进决策流程,什么不能进。
你还查不出来。
检索链路天然就是一道防火墙。
"模型看到了不该看的, 某个回答里顺嘴就说出来了。 这不是答错, 是事故。"
没有溯源,就没有信任。没有信任,就没有落地。
长上下文不是 RAG 的对手,是 RAG 的解放。
把一堆材料无差别地倒进模型,就像把建材全堆工地上让工人自己挑。
检索负责海选,长窗口负责精读。这才是企业 AI 的落地范式。