← → / ESC
Enterprise AI · 2026
01 / 11
The Question

RAG
过时了么?

大模型上下文窗口到一百万了。资料全塞进去,检索系统是不是可以退休了?

百万上下文时代·企业 AI 落地范式
RAG vs Long Context · 2026
— Cover —
Data · Key Numbers
02 / 11
Counter-intuitive

反常识的数据

上下文越大,企业在检索系统上花的钱反而越多。

Accuracy Drop
30%+
关键信息藏在中段时
模型提取准确率暴跌
Cost Multiplier
10-20x
长上下文查询成本
相比 RAG 的倍数
Context Window
1Mtokens
约三四本《红楼梦》
但能装不代表会用
Page 02 · Key Numbers
Data
Act I · The Problem
03 / 11
Act I

能装
不叫会用

你塞一百本书进去,模型可能只认真看了开头和结尾几本。

Act I · The Problem
— · —
Insight · Value Shift
04 / 11
Reframe

不再是筛子,
是道门。

以前理解 RAG,是"模型读不了太多,先帮他筛一筛"。
现在模型能读了,RAG 的价值变了——它决定什么信息能进决策流程,什么不能进。

RAG 在这里干嘛?不是帮模型少读,是帮模型读对。先把最相关的片段捞出来,去掉噪声,让模型在干净的材料上做判断。
— 帮模型聚焦
Page 04 · From Filter to Gateway
Insight
Comparison · Paradigm
05 / 11
Before / After

暴力投喂 vs 精准投喂

Before · 全塞进去

百万 Token 暴力加载

  • 每次回答重读全部文档
  • 成本是 RAG 的 10-20 倍
  • 中段信息准确率暴跌 30%+
  • 模型容易"混搭编造"
After · RAG 精准检索

先查后问,精准投喂

  • 只检索最相关的几页
  • 成本可控,响应秒级
  • 消除噪声,聚焦推理
  • 每个结论可溯源验证
Page 05 · Paradigm Shift
Before / After
The Risk · Enterprise
06 / 11
The Real Fear

企业最怕什么? 不是 AI 答不上来, 是 AI 一本正经地 胡说八道。

你还查不出来。

Page 06 · The Real Fear
— · —
Solution · Three Pillars
07 / 11
RAG's Triple Firewall

三重防线

检索链路天然就是一道防火墙。

聚焦
先捞最相关的片段,去掉噪声。模型在干净材料上做判断,不在海量文本里硬找。
溯源
结论来自哪份文件、哪一页、哪一段。错了能定位,对了能验证。
权限
检索阶段按角色过滤。不该你看的文档,根本不进模型视线。
Page 07 · RAG Firewall
Solution
Takeaway · Compliance
08 / 11
The Line
"模型看到了不该看的, 某个回答里顺嘴就说出来了。 这不是答错, 是事故。"

没有溯源,就没有信任。没有信任,就没有落地。

Page 08 · Compliance Risk
— · —
Act II · The Solution
09 / 11
Act II

分工协作

长上下文不是 RAG 的对手,是 RAG 的解放。

Act II · Collaboration
— · —
Evolution · Long RAG
10 / 11
Evolution

RAG 的进化

Before · 4K Context

文档切得稀碎

  • 模型只有 4K 上下文
  • 文档必须切碎检索
  • 语义断裂,"他"是谁都不知道
  • 效果差不是检索不行,是上下文太短
After · 1M Context + RAG

检索海选,长窗精读

  • 先检索锁定最相关的完整文档
  • 再用长上下文做深度推理
  • 语义完整,上下文充分
  • 检索建立边界,长窗口负责思考
Page 10 · Long Context RAG
Evolution
Closing · The Takeaway
11 / 11
Final Word

能盖房吗?能。 但你敢住吗?

把一堆材料无差别地倒进模型,就像把建材全堆工地上让工人自己挑。
检索负责海选,长窗口负责精读。这才是企业 AI 的落地范式。

RAG + Long Context·2026
Thanks · Enterprise AI Paradigm
— End —