docs(design): add TUI optimization design documents

Add comprehensive design docs covering three workstreams:
- Startup performance & MCP initialization optimization
- Screen flickering analysis and solutions (DECSET 2026, throttling)
- Rendering performance & extensibility (markdown caching, marked parser, themes)

Generated with AI

Co-authored-by: Qwen-Coder <qwen-coder@alibabacloud.com>
This commit is contained in:
秦奇 2026-04-20 14:13:45 +08:00
parent 6c999fe29f
commit 4eb19a94c0
4 changed files with 1397 additions and 0 deletions

View file

@ -0,0 +1,392 @@
# TUI 优化:屏幕闪烁
> 详细设计文档 2/3 — 解决流式输出、窄屏、终端 resize 等场景下的屏幕闪烁问题。
## 1. 问题分析
### 1.1 闪烁的根本原因
Ink 6.2.3 的渲染模型决定了闪烁问题的根源:
1. **全量重绘**:每次 React 状态变更Ink 对整个动态区域执行 `eraseLines(N)` + 重新输出。`eraseLines` 会逐行发出 `ERASE_LINE + CURSOR_UP` 序列对,然后重写所有内容。
2. **超高重绘频率**:流式输出时每个内容 chunk可包含一到多个 token触发一次状态更新和重绘高频时可达 50+ 次/秒。
3. **全屏回退路径**当动态内容高度超过终端高度时Ink 切换到 `clearTerminal` + 全量重写,产生整屏闪烁。
### 1.2 当前缓解措施
#### terminalRedrawOptimizer.ts
位于 `packages/cli/src/ui/utils/terminalRedrawOptimizer.ts`,通过拦截 `stdout.write()` 优化 ANSI 序列:
```typescript
// 核心优化:折叠重复的 ERASE_LINE + CURSOR_UP 序列
// 原始序列N 行):
// ESC[2K ESC[1A ESC[2K ESC[1A ... ESC[2K ESC[G
// 优化后:
// ESC[NA ESC[2K ESC[1B ESC[2K ESC[1B ... ESC[NA ESC[G
```
**局限**
- 仅优化光标移动模式,不减少实际输出字节数
- 不解决 Ink 全量重绘的根本问题
- 不支持同步输出协议
- 对全屏清除路径无效
#### Static/Dynamic 分离
`packages/cli/src/ui/components/MainContent.tsx` 使用 Ink 的 `<Static>` 组件分离已完成内容和流式内容:
```typescript
// Static 区域:已完成的历史消息,追加后不再更新
<Static items={mergedHistory}>
{(item) => <HistoryItemDisplay key={item.key} ... />}
</Static>
// Dynamic 区域:当前流式内容,每帧重绘
<Box>
{pendingHistoryItems.map((item) => <HistoryItemDisplay ... />)}
</Box>
```
**局限**
- 当流式内容本身超过终端高度时仍会触发全屏重绘
- `refreshStatic()` 使用 `clearTerminal` 导致整屏闪烁resize、compact 切换等场景)
### 1.3 具体闪烁场景
| 场景 | 触发条件 | 严重程度 | 代码位置 |
| ---------------- | -------------------------------------- | -------- | ---------------------------- |
| 流式输出 | 每个内容 chunk 触发 React re-render | 高 | `useGeminiStream` hook |
| 长输出超屏 | 动态内容高度 > 终端行数 | 严重 | Ink 内部 `eraseLines` 路径 |
| 终端 resize | `refreshStatic()` 调用 `clearTerminal` | 中 | `AppContainer.tsx:1508-1517` |
| Compact 模式切换 | 历史合并触发 `refreshStatic()` | 中 | `MainContent.tsx:80` |
| 窄屏布局抖动 | 布局重算导致内容高度反复变化 | 中 | Ink 布局引擎 |
| tmux/SSH | 终端复用器放大闪烁效果 | 严重 | 终端环境因素 |
### 1.4 社区反馈
- **qwen-code#1778**:流式输出时屏幕闪烁
- **qwen-code#2748**MCP 加载时闪烁 + 慢启动
- **claude-code#9935**tmux 中 4,000-6,700 次/秒滚动事件
- **claude-code#37283**:长输出全屏闪烁
- **claude-code#10794**SSH 远程场景闪烁加剧
## 2. 解决方案
### 2.1 [P0] 同步输出 — DECSET 2026
**原理**[同步输出协议](https://gist.github.com/christianparpart/d8a62cc1ab659194f6ca7e8e5b1b1814) 允许应用通过转义序列告知终端"我正在更新帧,请暂缓显示直到帧完成"。
```
CSI ? 2026 h ← Begin Synchronized Update暂停显示
... 帧内容 ...
CSI ? 2026 l ← End Synchronized Update刷新显示
```
**终端支持情况**
| 终端 | 支持版本 |
|---|---|
| kitty | 0.17.0+ |
| foot | 1.0+ |
| WezTerm | 所有版本 |
| iTerm2 | 3.5+ |
| Windows Terminal | 1.18+ |
| Contour | 0.3.0+ |
| tmux | 3.4+ (透传) |
| 不支持的终端 | 静默忽略序列,零副作用 |
**实现方案**
在现有的 `terminalRedrawOptimizer.ts` 中扩展 `optimizedWrite`
**需要确认的前提**Ink 是否每帧只调用一次 `stdout.write()`?当前优化器的 `optimizeMultilineEraseLines()` 处理的是**单次 write 内**的 ANSI 序列折叠,这暗示 Ink 大概率将完整帧内容在单次 write 中输出。如果确认如此BSU/ESU 可直接包裹单次 write
```typescript
const BSU = '\x1b[?2026h'; // Begin Synchronized Update
const ESU = '\x1b[?2026l'; // End Synchronized Update
const optimizedWrite = function (
this: NodeJS.WriteStream,
chunk: unknown,
encodingOrCallback?: BufferEncoding | ((error?: Error | null) => void),
callback?: (error?: Error | null) => void,
) {
let optimizedChunk = chunk;
if (typeof chunk === 'string') {
optimizedChunk = optimizeMultilineEraseLines(chunk);
// 检测是否包含帧更新(包含擦除序列即视为帧更新)
if (chunk.includes(ERASE_LINE) || chunk.includes('\x1b[2J')) {
optimizedChunk = BSU + optimizedChunk + ESU;
}
}
return originalWrite.call(this, optimizedChunk as string | Uint8Array, ...);
};
```
**如果 Ink 每帧多次 write**:需要改用帧缓冲策略 — 在 idle tick 中收集所有 write 调用,合并后统一输出。实现更复杂但同样可行。
**验证步骤**:在优化器中添加临时计数器,统计单次 React render 触发多少次 `stdout.write()`
**影响范围**:仅 `packages/cli/src/ui/utils/terminalRedrawOptimizer.ts`
**风险评估****极低**
- 不支持的终端静默忽略 BSU/ESU 序列
- 可通过 `QWEN_CODE_LEGACY_ERASE_LINES=1` 完全禁用
- Claude Code 在 `src/ink/terminal.ts` 中已使用相同方案
**预期收益**
- 消除大部分可见的帧撕裂和闪烁
- tmux 场景下效果最为显著(从数千次/秒滚动事件降至帧率级别)
- 不改变渲染管线,仅改变终端侧行为
### 2.2 [P0] 流式更新节流
**现状**LLM 流式输出的每个内容 chunk 都触发 React 状态更新。虽然不是逐 token 更新(而是按 API 返回的 chunk 粒度),但在高速流式输出时仍可能产生每秒 50+ 次 re-render。人眼对文本更新的感知频率约 15-20fps大量渲染被浪费。
**方案**:在流式 hook 中实现 chunk 缓冲 + 定时刷新。
```typescript
// packages/cli/src/ui/hooks/useGeminiStream.ts概念实现
const chunkBufferRef = useRef<string>('');
const flushTimerRef = useRef<NodeJS.Timeout | null>(null);
const FLUSH_INTERVAL_MS = 60; // ≈16fps足够文本展示
const flushBuffer = useCallback(() => {
if (chunkBufferRef.current) {
setStreamingContent((prev) => prev + chunkBufferRef.current);
chunkBufferRef.current = '';
}
flushTimerRef.current = null;
}, []);
const onContentChunk = useCallback(
(chunk: string) => {
chunkBufferRef.current += chunk;
if (!flushTimerRef.current) {
flushTimerRef.current = setTimeout(flushBuffer, FLUSH_INTERVAL_MS);
}
},
[flushBuffer],
);
// 流结束时立即刷新
const onStreamEnd = useCallback(() => {
if (flushTimerRef.current) clearTimeout(flushTimerRef.current);
flushBuffer();
}, [flushBuffer]);
```
**影响范围**`packages/cli/src/ui/hooks/useGeminiStream.ts`
**具体切入点**`handleContentEvent()` 回调(第 664 行),该函数在每个内容 chunk 到达时调用 `setPendingHistoryItem()`(第 690 行)触发 React 状态更新。节流层应在 `setPendingHistoryItem` 调用之前缓冲内容。
**风险评估**:低
- 60ms 延迟对用户不可感知
- 流结束时立即刷新确保最终内容完整
- 如有问题可调整 `FLUSH_INTERVAL_MS` 或通过环境变量禁用
**预期收益**`stdout.write` 调用从 50+/秒降至 < 20/直接减少 60%+ 的渲染开销
### 2.3 [P1] 动态内容高度管理 + 渐进提升
**现状**当流式内容超过终端高度时Ink 触发全屏重绘。`constrainHeight` 状态标志虽然存在(`AppContainer.tsx:1482`),但计算不够精确。
**方案**:实现"渐进提升"Progressive Promotion模式 — 随着流式内容增长,将已完成的块从动态区域提升到 `<Static>` 区域。
**核心逻辑**
```
流式输出开始
├─ 新 token 追加到 pendingContent
├─ 检查 pendingContent 高度 vs 可用动态区域高度
│ ├─ 高度安全 → 继续累积
│ └─ 接近阈值 →
│ ├─ 使用 findLastSafeSplitPoint() 找到安全分割点
│ ├─ 分割点之前的内容 → 提升到 history (Static)
│ └─ 分割点之后的内容 → 保留在 pending (Dynamic)
└─ 流结束 → 全部提升到 history
```
`findLastSafeSplitPoint()` 已存在于 `packages/cli/src/ui/utils/markdownUtilities.ts`,专为此类场景设计:
- 不在代码块内部分割
- 优先在段落边界 `\n\n` 分割
- 回退到行边界 `\n`
**影响范围**
- `packages/cli/src/ui/components/MainContent.tsx` — 实现提升逻辑
- `packages/cli/src/ui/AppContainer.tsx` — 改进高度计算
- `packages/cli/src/ui/hooks/useGeminiStream.ts` — 在流式处理中调用分割
**风险评估**:中
- 分割可能导致部分 Markdown 上下文丢失(如跨段落的列表)→ 通过保守的分割策略缓解
- 频繁提升可能导致 `<Static>` 闪烁 → 设置最小提升间隔(如 500ms
**预期收益**:动态内容始终控制在终端高度内,永远不触发 Ink 的全屏重绘路径。
### 2.4 [P1] 智能 refreshStatic()
**现状**`refreshStatic()``AppContainer.tsx` 中通过 `clearTerminal`(完整的 `ESC[2J ESC[3J ESC[H`)实现全屏清除后重新挂载:
```typescript
// AppContainer.tsx 当前实现
const refreshStatic = useCallback(() => {
process.stdout.write(ansiEscapes.clearTerminal);
setHistoryRemountKey((prev) => prev + 1); // 触发 <Static> 重新渲染
}, []);
```
触发场景:
- 终端 resize300ms debounce`AppContainer.tsx:1508-1517`
- Compact 模式合并:`MainContent.tsx:80`
- 手动清屏:`AppContainer.tsx:1200`
- Auth 变更:`AppContainer.tsx:498`
**方案**
1. **Resize 优化**:仅重绘动态区域而非全屏清除
```typescript
const handleResize = useCallback(
debounce(() => {
// 不再 clearTerminal仅更新布局尺寸
updateTerminalDimensions();
// 只在宽度变化时才需要重新渲染(高度变化不影响已渲染内容)
if (widthChanged) {
refreshStatic(); // 宽度变化时仍需全量重绘(行包装会变)
}
}, 500),
[],
);
```
2. **Compact 模式合并**:使用增量更新而非全量重绘
- 仅当合并确实改变了可见内容时触发刷新
- 增加合并去抖动间隔
3. **增加 resize debounce 到 500ms**(从 300ms因为 resize 事件通常成组到达
**影响范围**`packages/cli/src/ui/AppContainer.tsx`(第 462-464, 1508-1517 行)
### 2.5 [P2] 双缓冲 + Diff PatchPhase 3
**现状**Ink 每帧都向 stdout 写入完整的新内容。
**方案**:维护一个 2D 字符网格作为"后缓冲区",每次渲染时仅输出与当前缓冲区不同的单元格。
**架构设计**
```
React 状态更新
→ Ink 渲染管线(产出新帧文本)
→ ScreenBuffer.diff(oldFrame, newFrame)
→ 产出 Patch 列表 [{row, col, content, style}]
→ 序列化为最小 ANSI 序列
→ 单次 stdout.write(BSU + patches + ESU)
```
**核心数据结构**
```typescript
interface Cell {
char: string; // 单个字符/grapheme cluster
styleId: number; // 内化的样式 ID
hyperlinkId: number; // 内化的超链接 ID
}
class ScreenBuffer {
private cells: Cell[][]; // rows × cols
private width: number;
private height: number;
diff(newBuffer: ScreenBuffer): Patch[];
apply(patches: Patch[]): string; // 生成 ANSI 序列
}
```
**风险评估**:高
- 需要拦截 Ink 的输出层或 fork Ink
- 字符宽度计算CJK、emoji需要精确匹配 Ink 的计算
- 样式边界的 diff 比纯文本 diff 复杂得多
**参考**Claude Code 在 `src/ink/screen.ts` 中实现了完整的双缓冲 + StylePool + CharPool是最成熟的参考实现。
**建议**:先评估 Phase 1 的同步输出 + 节流效果。如果已满足需求,可降低此方案优先级。
### 2.6 [P2] DECSTBM 滚动区域优化Phase 3
**原理**:使用 CSI DECSTBMSet Top and Bottom Margins设定终端滚动区域当内容需要滚动时发出 `CSI n S`scroll up指令由终端硬件执行滚动而非重写整个视口。
**前置条件**需要双缓冲2.5)作为基础。
**参考**Claude Code 的 `src/ink/render-node-to-output.ts` 实现了自适应 drain 策略:
- xterm.js5 行以下即时12 行以上平滑步进
- 原生终端:待处理行数的 3/4最少 4 行
## 3. 竞品参考
### Claude Code 防闪烁架构
Claude Code 的自研 Ink 内核提供了五层防闪烁保护:
| 层级 | 机制 | 对应文件 |
| ------------ | --------------------------- | ---------------------------------------- |
| 1. 帧缓冲 | frontFrame/backFrame 双缓冲 | `src/ink/ink.tsx:99-100` |
| 2. Diff 渲染 | 逐 cell 比较,仅输出变更 | `src/ink/log-update.ts` |
| 3. 原子帧 | BSU/ESU 同步输出包裹 | `src/ink/terminal.ts` |
| 4. 硬件滚动 | DECSTBM 滚动区域 | `src/ink/render-node-to-output.ts` |
| 5. 布局感知 | 布局稳定时窄范围 diff | `src/ink/render-node-to-output.ts:34-42` |
**关键洞察**Claude Code 的经验表明,同步输出(第 3 层)是**单项收益最大**的优化,而双缓冲 + diff第 1-2 层)提供了最彻底的解决方案。我们的 Phase 1 策略(同步输出 + 节流)可以以约 10% 的实现成本获得约 70% 的效果。
## 4. 实施优先级与里程碑
| 优先级 | 方案 | 周次 | 风险 | 预期收益 |
| ------ | -------------------- | ----- | ---- | ------------------------- |
| P0 | 同步输出 DECSET 2026 | 1 | 极低 | 消除帧撕裂tmux 效果显著 |
| P0 | 流式更新节流 60ms | 1 | 低 | stdout.write -60%+ |
| P1 | 渐进提升到 Static | 6-7 | 中 | 消除长输出全屏闪烁 |
| P1 | 智能 refreshStatic() | 8-9 | 中 | resize 不再全屏闪烁 |
| P2 | 双缓冲 + diff patch | 11-13 | 高 | stdout 字节/帧 -80% |
| P2 | DECSTBM 滚动区域 | 13+ | 高 | 滚动性能接近原生 |
## 5. 验证方案
### 5.1 定量指标
| 指标 | 当前估计 | Phase 1 目标 | Phase 3 目标 |
| ---------------------------- | ----------- | -------------------- | ------------ |
| stdout.write 调用/秒(流式) | 50+ | < 20 | < 16 |
| stdout 字节/帧(增量更新) | 全帧大小 | 全帧大小(同步包裹) | 仅变更 cell |
| tmux 滚动事件/秒 | 4,000-6,700 | < 100 | < 20 |
| 可见闪烁(主观) | 严重 | 轻微/无 | 无 |
### 5.2 测试场景
| 场景 | 测试方法 | 验收标准 |
| -------------- | ----------------------- | -------------------- |
| 正常流式输出 | 生成 500 token 响应 | 无可见闪烁 |
| 超长输出 | 生成 5000+ 行响应 | 不触发全屏清除 |
| 终端 resize | 快速拖拽窗口大小 | 无全屏闪烁 |
| 窄屏 (< 40 ) | 将终端缩至 30 | 布局优雅降级无抖动 |
| tmux 内运行 | tmux 分屏环境 | 滚动事件 < 100/ |
| SSH 远程 | 高延迟网络 | 闪烁不加剧 |
| kitty/WezTerm | 支持 DECSET 2026 的终端 | 零帧撕裂 |
| Terminal.app | 不支持 DECSET 2026 | 行为不变(不退化) |
### 5.3 向后兼容
- `QWEN_CODE_LEGACY_ERASE_LINES=1`:禁用所有 stdout 拦截优化(已有)
- `QWEN_CODE_LEGACY_RENDERING=1`:新增,禁用同步输出 + 节流
- 不支持 DECSET 2026 的终端:序列被静默忽略,零风险