From b3b98540d59ede2c1b44316a392b30ea3014bed3 Mon Sep 17 00:00:00 2001
From: "mingholy.lmh" <mingholy.lmh@alibaba-inc.com>
Date: Mon, 16 Mar 2026 11:10:40 +0800
Subject: [PATCH 1/2] feat: increase DEFAULT_OUTPUT_TOKEN_LIMIT from 8K to 16K

Co-authored-by: Qwen-Coder <qwen-coder@alibabacloud.com>
---
 packages/core/src/core/tokenLimits.ts | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/core/src/core/tokenLimits.ts b/packages/core/src/core/tokenLimits.ts
index 2807e56c1..364e10279 100644
--- a/packages/core/src/core/tokenLimits.ts
+++ b/packages/core/src/core/tokenLimits.ts
@@ -9,7 +9,7 @@ type TokenCount = number;
 export type TokenLimitType = 'input' | 'output';
 
 export const DEFAULT_TOKEN_LIMIT: TokenCount = 131_072; // 128K (power-of-two)
-export const DEFAULT_OUTPUT_TOKEN_LIMIT: TokenCount = 8_192; // 8K tokens
+export const DEFAULT_OUTPUT_TOKEN_LIMIT: TokenCount = 16_384; // 16K tokens
 
 /**
  * Accurate numeric limits:

From b9baf183b0f164f640884c921fbfc9318fc0c974 Mon Sep 17 00:00:00 2001
From: "mingholy.lmh" <mingholy.lmh@alibaba-inc.com>
Date: Mon, 16 Mar 2026 12:27:22 +0800
Subject: [PATCH 2/2] feat: add qwen fallback pattern with 8k output token
 limit

Co-authored-by: Qwen-Coder <qwen-coder@alibabacloud.com>
---
 .../core/openaiContentGenerator/provider/dashscope.test.ts    | 4 ++--
 packages/core/src/core/tokenLimits.ts                         | 1 +
 2 files changed, 3 insertions(+), 2 deletions(-)

diff --git a/packages/core/src/core/openaiContentGenerator/provider/dashscope.test.ts b/packages/core/src/core/openaiContentGenerator/provider/dashscope.test.ts
index e1ecb61b6..024e9a28c 100644
--- a/packages/core/src/core/openaiContentGenerator/provider/dashscope.test.ts
+++ b/packages/core/src/core/openaiContentGenerator/provider/dashscope.test.ts
@@ -817,12 +817,12 @@ describe('DashScopeOpenAICompatibleProvider', () => {
       const request: OpenAI.Chat.ChatCompletionCreateParams = {
         model: 'unknown-model',
         messages: [{ role: 'user', content: 'Hello' }],
-        max_tokens: 10000, // Exceeds the default limit
+        max_tokens: 20000, // Exceeds the default limit
       };
 
       const result = provider.buildRequest(request, 'test-prompt-id');
 
-      expect(result.max_tokens).toBe(8192); // Should be limited to default output limit (8K)
+      expect(result.max_tokens).toBe(16384); // Should be limited to default output limit (16K)
     });
 
     it('should preserve other request parameters when limiting max_tokens', () => {
diff --git a/packages/core/src/core/tokenLimits.ts b/packages/core/src/core/tokenLimits.ts
index 364e10279..b566a01dc 100644
--- a/packages/core/src/core/tokenLimits.ts
+++ b/packages/core/src/core/tokenLimits.ts
@@ -166,6 +166,7 @@ const OUTPUT_PATTERNS: Array<[RegExp, TokenCount]> = [
   [/^qwen3\.5/, LIMITS['64k']],
   [/^coder-model$/, LIMITS['64k']],
   [/^qwen3-max/, LIMITS['64k']],
+  [/^qwen/, LIMITS['8k']], // Qwen fallback (VL, turbo, plus, etc.): 8K
 
   // DeepSeek
   [/^deepseek-reasoner/, LIMITS['64k']],