mirror of https://github.com/QwenLM/qwen-code.git synced 2026-05-02 21:50:52 +00:00

秦奇 4eb19a94c0 docs(design): add TUI optimization design documents

Add comprehensive design docs covering three workstreams:
- Startup performance & MCP initialization optimization
- Screen flickering analysis and solutions (DECSET 2026, throttling)
- Rendering performance & extensibility (markdown caching, marked parser, themes)

Generated with AI

Co-authored-by: Qwen-Coder <qwen-coder@alibabacloud.com>

2026-04-20 14:13:45 +08:00

16 KiB

Raw Blame History

TUI 优化：屏幕闪烁

详细设计文档 2/3 — 解决流式输出、窄屏、终端 resize 等场景下的屏幕闪烁问题。

1. 问题分析

1.1 闪烁的根本原因

Ink 6.2.3 的渲染模型决定了闪烁问题的根源：

全量重绘：每次 React 状态变更，Ink 对整个动态区域执行 eraseLines(N) + 重新输出。eraseLines 会逐行发出 ERASE_LINE + CURSOR_UP 序列对，然后重写所有内容。
超高重绘频率：流式输出时每个内容 chunk（可包含一到多个 token）触发一次状态更新和重绘，高频时可达 50+ 次/秒。
全屏回退路径：当动态内容高度超过终端高度时，Ink 切换到 clearTerminal + 全量重写，产生整屏闪烁。

1.2 当前缓解措施

terminalRedrawOptimizer.ts

位于 packages/cli/src/ui/utils/terminalRedrawOptimizer.ts，通过拦截 stdout.write() 优化 ANSI 序列：

// 核心优化：折叠重复的 ERASE_LINE + CURSOR_UP 序列
// 原始序列（N 行）:
//   ESC[2K ESC[1A  ESC[2K ESC[1A  ... ESC[2K ESC[G
// 优化后:
//   ESC[NA  ESC[2K ESC[1B  ESC[2K ESC[1B  ... ESC[NA ESC[G

局限：

仅优化光标移动模式，不减少实际输出字节数
不解决 Ink 全量重绘的根本问题
不支持同步输出协议
对全屏清除路径无效

Static/Dynamic 分离

packages/cli/src/ui/components/MainContent.tsx 使用 Ink 的 <Static> 组件分离已完成内容和流式内容：

// Static 区域：已完成的历史消息，追加后不再更新
<Static items={mergedHistory}>
  {(item) => <HistoryItemDisplay key={item.key} ... />}
</Static>

// Dynamic 区域：当前流式内容，每帧重绘
<Box>
  {pendingHistoryItems.map((item) => <HistoryItemDisplay ... />)}
</Box>

局限：

当流式内容本身超过终端高度时仍会触发全屏重绘
refreshStatic() 使用 clearTerminal 导致整屏闪烁（resize、compact 切换等场景）

1.3 具体闪烁场景

场景	触发条件	严重程度	代码位置
流式输出	每个内容 chunk 触发 React re-render	高	`useGeminiStream` hook
长输出超屏	动态内容高度 > 终端行数	严重	Ink 内部 `eraseLines` 路径
终端 resize	`refreshStatic()` 调用 `clearTerminal`	中	`AppContainer.tsx:1508-1517`
Compact 模式切换	历史合并触发 `refreshStatic()`	中	`MainContent.tsx:80`
窄屏布局抖动	布局重算导致内容高度反复变化	中	Ink 布局引擎
tmux/SSH	终端复用器放大闪烁效果	严重	终端环境因素

1.4 社区反馈

qwen-code#1778：流式输出时屏幕闪烁
qwen-code#2748：MCP 加载时闪烁 + 慢启动
claude-code#9935：tmux 中 4,000-6,700 次/秒滚动事件
claude-code#37283：长输出全屏闪烁
claude-code#10794：SSH 远程场景闪烁加剧

2. 解决方案

2.1 [P0] 同步输出 — DECSET 2026

原理：同步输出协议允许应用通过转义序列告知终端"我正在更新帧，请暂缓显示直到帧完成"。

CSI ? 2026 h    ← Begin Synchronized Update（暂停显示）
... 帧内容 ...
CSI ? 2026 l    ← End Synchronized Update（刷新显示）

终端支持情况：

终端	支持版本
kitty	0.17.0+
foot	1.0+
WezTerm	所有版本
iTerm2	3.5+
Windows Terminal	1.18+
Contour	0.3.0+
tmux	3.4+ (透传)
不支持的终端	静默忽略序列，零副作用

实现方案：

在现有的 terminalRedrawOptimizer.ts 中扩展 optimizedWrite。

需要确认的前提：Ink 是否每帧只调用一次 stdout.write()？当前优化器的 optimizeMultilineEraseLines() 处理的是单次 write 内的 ANSI 序列折叠，这暗示 Ink 大概率将完整帧内容在单次 write 中输出。如果确认如此，BSU/ESU 可直接包裹单次 write：

const BSU = '\x1b[?2026h';  // Begin Synchronized Update
const ESU = '\x1b[?2026l';  // End Synchronized Update

const optimizedWrite = function (
  this: NodeJS.WriteStream,
  chunk: unknown,
  encodingOrCallback?: BufferEncoding | ((error?: Error | null) => void),
  callback?: (error?: Error | null) => void,
) {
  let optimizedChunk = chunk;
  if (typeof chunk === 'string') {
    optimizedChunk = optimizeMultilineEraseLines(chunk);
    // 检测是否包含帧更新（包含擦除序列即视为帧更新）
    if (chunk.includes(ERASE_LINE) || chunk.includes('\x1b[2J')) {
      optimizedChunk = BSU + optimizedChunk + ESU;
    }
  }
  return originalWrite.call(this, optimizedChunk as string | Uint8Array, ...);
};

如果 Ink 每帧多次 write：需要改用帧缓冲策略 — 在 idle tick 中收集所有 write 调用，合并后统一输出。实现更复杂但同样可行。

验证步骤：在优化器中添加临时计数器，统计单次 React render 触发多少次 stdout.write()。

影响范围：仅 packages/cli/src/ui/utils/terminalRedrawOptimizer.ts

风险评估：极低

不支持的终端静默忽略 BSU/ESU 序列
可通过 QWEN_CODE_LEGACY_ERASE_LINES=1 完全禁用
Claude Code 在 src/ink/terminal.ts 中已使用相同方案

预期收益：

消除大部分可见的帧撕裂和闪烁
tmux 场景下效果最为显著（从数千次/秒滚动事件降至帧率级别）
不改变渲染管线，仅改变终端侧行为

2.2 [P0] 流式更新节流

现状：LLM 流式输出的每个内容 chunk 都触发 React 状态更新。虽然不是逐 token 更新（而是按 API 返回的 chunk 粒度），但在高速流式输出时仍可能产生每秒 50+ 次 re-render。人眼对文本更新的感知频率约 15-20fps，大量渲染被浪费。

方案：在流式 hook 中实现 chunk 缓冲 + 定时刷新。

// packages/cli/src/ui/hooks/useGeminiStream.ts（概念实现）

const chunkBufferRef = useRef<string>('');
const flushTimerRef = useRef<NodeJS.Timeout | null>(null);
const FLUSH_INTERVAL_MS = 60; // ≈16fps，足够文本展示

const flushBuffer = useCallback(() => {
  if (chunkBufferRef.current) {
    setStreamingContent((prev) => prev + chunkBufferRef.current);
    chunkBufferRef.current = '';
  }
  flushTimerRef.current = null;
}, []);

const onContentChunk = useCallback(
  (chunk: string) => {
    chunkBufferRef.current += chunk;
    if (!flushTimerRef.current) {
      flushTimerRef.current = setTimeout(flushBuffer, FLUSH_INTERVAL_MS);
    }
  },
  [flushBuffer],
);

// 流结束时立即刷新
const onStreamEnd = useCallback(() => {
  if (flushTimerRef.current) clearTimeout(flushTimerRef.current);
  flushBuffer();
}, [flushBuffer]);

影响范围：packages/cli/src/ui/hooks/useGeminiStream.ts

具体切入点：handleContentEvent() 回调（第 664 行），该函数在每个内容 chunk 到达时调用 setPendingHistoryItem()（第 690 行）触发 React 状态更新。节流层应在 setPendingHistoryItem 调用之前缓冲内容。

风险评估：低

60ms 延迟对用户不可感知
流结束时立即刷新确保最终内容完整
如有问题可调整 FLUSH_INTERVAL_MS 或通过环境变量禁用

预期收益：stdout.write 调用从 50+/秒降至 < 20/秒，直接减少 60%+ 的渲染开销。

2.3 [P1] 动态内容高度管理 + 渐进提升

现状：当流式内容超过终端高度时，Ink 触发全屏重绘。constrainHeight 状态标志虽然存在（AppContainer.tsx:1482），但计算不够精确。

方案：实现"渐进提升"（Progressive Promotion）模式 — 随着流式内容增长，将已完成的块从动态区域提升到 <Static> 区域。

核心逻辑：

流式输出开始
  ├─ 新 token 追加到 pendingContent
  ├─ 检查 pendingContent 高度 vs 可用动态区域高度
  │   ├─ 高度安全 → 继续累积
  │   └─ 接近阈值 →
  │       ├─ 使用 findLastSafeSplitPoint() 找到安全分割点
  │       ├─ 分割点之前的内容 → 提升到 history (Static)
  │       └─ 分割点之后的内容 → 保留在 pending (Dynamic)
  └─ 流结束 → 全部提升到 history

findLastSafeSplitPoint() 已存在于 packages/cli/src/ui/utils/markdownUtilities.ts，专为此类场景设计：

不在代码块内部分割
优先在段落边界 \n\n 分割
回退到行边界 \n

影响范围：

packages/cli/src/ui/components/MainContent.tsx — 实现提升逻辑
packages/cli/src/ui/AppContainer.tsx — 改进高度计算
packages/cli/src/ui/hooks/useGeminiStream.ts — 在流式处理中调用分割

风险评估：中

分割可能导致部分 Markdown 上下文丢失（如跨段落的列表）→ 通过保守的分割策略缓解
频繁提升可能导致 <Static> 闪烁 → 设置最小提升间隔（如 500ms）

预期收益：动态内容始终控制在终端高度内，永远不触发 Ink 的全屏重绘路径。

2.4 [P1] 智能 refreshStatic()

现状：refreshStatic() 在 AppContainer.tsx 中通过 clearTerminal（完整的 ESC[2J ESC[3J ESC[H）实现全屏清除后重新挂载：

// AppContainer.tsx 当前实现
const refreshStatic = useCallback(() => {
  process.stdout.write(ansiEscapes.clearTerminal);
  setHistoryRemountKey((prev) => prev + 1); // 触发 <Static> 重新渲染
}, []);

触发场景：

终端 resize（300ms debounce）：AppContainer.tsx:1508-1517
Compact 模式合并：MainContent.tsx:80
手动清屏：AppContainer.tsx:1200
Auth 变更：AppContainer.tsx:498

方案：

Resize 优化：仅重绘动态区域而非全屏清除

const handleResize = useCallback(
  debounce(() => {
    // 不再 clearTerminal，仅更新布局尺寸
    updateTerminalDimensions();
    // 只在宽度变化时才需要重新渲染（高度变化不影响已渲染内容）
    if (widthChanged) {
      refreshStatic(); // 宽度变化时仍需全量重绘（行包装会变）
    }
  }, 500),
  [],
);

Compact 模式合并：使用增量更新而非全量重绘
- 仅当合并确实改变了可见内容时触发刷新
- 增加合并去抖动间隔
增加 resize debounce 到 500ms（从 300ms），因为 resize 事件通常成组到达

影响范围：packages/cli/src/ui/AppContainer.tsx（第 462-464, 1508-1517 行）

2.5 [P2] 双缓冲 + Diff Patch（Phase 3）

现状：Ink 每帧都向 stdout 写入完整的新内容。

方案：维护一个 2D 字符网格作为"后缓冲区"，每次渲染时仅输出与当前缓冲区不同的单元格。

架构设计：

React 状态更新
  → Ink 渲染管线（产出新帧文本）
    → ScreenBuffer.diff(oldFrame, newFrame)
      → 产出 Patch 列表 [{row, col, content, style}]
        → 序列化为最小 ANSI 序列
          → 单次 stdout.write(BSU + patches + ESU)

核心数据结构：

interface Cell {
  char: string; // 单个字符/grapheme cluster
  styleId: number; // 内化的样式 ID
  hyperlinkId: number; // 内化的超链接 ID
}

class ScreenBuffer {
  private cells: Cell[][]; // rows × cols
  private width: number;
  private height: number;

  diff(newBuffer: ScreenBuffer): Patch[];
  apply(patches: Patch[]): string; // 生成 ANSI 序列
}

风险评估：高

需要拦截 Ink 的输出层或 fork Ink
字符宽度计算（CJK、emoji）需要精确匹配 Ink 的计算
样式边界的 diff 比纯文本 diff 复杂得多

参考：Claude Code 在 src/ink/screen.ts 中实现了完整的双缓冲 + StylePool + CharPool，是最成熟的参考实现。

建议：先评估 Phase 1 的同步输出 + 节流效果。如果已满足需求，可降低此方案优先级。

2.6 [P2] DECSTBM 滚动区域优化（Phase 3）

原理：使用 CSI DECSTBM（Set Top and Bottom Margins）设定终端滚动区域，当内容需要滚动时发出 CSI n S（scroll up）指令，由终端硬件执行滚动而非重写整个视口。

前置条件：需要双缓冲（2.5）作为基础。

参考：Claude Code 的 src/ink/render-node-to-output.ts 实现了自适应 drain 策略：

xterm.js：5 行以下即时，12 行以上平滑步进
原生终端：待处理行数的 3/4，最少 4 行

3. 竞品参考

Claude Code 防闪烁架构

Claude Code 的自研 Ink 内核提供了五层防闪烁保护：

层级	机制	对应文件
1. 帧缓冲	frontFrame/backFrame 双缓冲	`src/ink/ink.tsx:99-100`
2. Diff 渲染	逐 cell 比较，仅输出变更	`src/ink/log-update.ts`
3. 原子帧	BSU/ESU 同步输出包裹	`src/ink/terminal.ts`
4. 硬件滚动	DECSTBM 滚动区域	`src/ink/render-node-to-output.ts`
5. 布局感知	布局稳定时窄范围 diff	`src/ink/render-node-to-output.ts:34-42`

关键洞察：Claude Code 的经验表明，同步输出（第 3 层）是单项收益最大的优化，而双缓冲 + diff（第 1-2 层）提供了最彻底的解决方案。我们的 Phase 1 策略（同步输出 + 节流）可以以约 10% 的实现成本获得约 70% 的效果。

4. 实施优先级与里程碑

优先级	方案	周次	风险	预期收益
P0	同步输出 DECSET 2026	1	极低	消除帧撕裂，tmux 效果显著
P0	流式更新节流 60ms	1	低	stdout.write -60%+
P1	渐进提升到 Static	6-7	中	消除长输出全屏闪烁
P1	智能 refreshStatic()	8-9	中	resize 不再全屏闪烁
P2	双缓冲 + diff patch	11-13	高	stdout 字节/帧 -80%
P2	DECSTBM 滚动区域	13+	高	滚动性能接近原生

5. 验证方案

5.1 定量指标

指标	当前估计	Phase 1 目标	Phase 3 目标
stdout.write 调用/秒（流式）	50+	< 20	< 16
stdout 字节/帧（增量更新）	全帧大小	全帧大小（同步包裹）	仅变更 cell
tmux 滚动事件/秒	4,000-6,700	< 100	< 20
可见闪烁（主观）	严重	轻微/无	无

5.2 测试场景

场景	测试方法	验收标准
正常流式输出	生成 500 token 响应	无可见闪烁
超长输出	生成 5000+ 行响应	不触发全屏清除
终端 resize	快速拖拽窗口大小	无全屏闪烁
窄屏 (< 40 列)	将终端缩至 30 列	布局优雅降级，无抖动
tmux 内运行	tmux 分屏环境	滚动事件 < 100/秒
SSH 远程	高延迟网络	闪烁不加剧
kitty/WezTerm	支持 DECSET 2026 的终端	零帧撕裂
Terminal.app	不支持 DECSET 2026	行为不变（不退化）

5.3 向后兼容

QWEN_CODE_LEGACY_ERASE_LINES=1：禁用所有 stdout 拦截优化（已有）
QWEN_CODE_LEGACY_RENDERING=1：新增，禁用同步输出 + 节流
不支持 DECSET 2026 的终端：序列被静默忽略，零风险

16 KiB Raw Blame History Unescape Escape