update speed test

2025-09-10 23:34:35 +00:00 · 2025-04-22 07:38:05 +00:00 · 2025-04-22 07:38:05 +00:00 · b17ab8653c
commit b17ab8653c
parent f5287e908a
4 changed files with 66 additions and 31 deletions
--- a/ktransformers/server/schemas/legacy/completions.py
+++ b/ktransformers/server/schemas/legacy/completions.py
@ -1,17 +1,17 @@
 from typing import List, Optional
 from enum import Enum
 from pydantic import BaseModel, Field
-
+from ktransformers.server.config.config import Config
 from ..base import Object

 class CompletionCreate(BaseModel):
    model: str
    prompt: str | List[str]
    stream: bool = False
-    temperature: Optional[float] = Field(default=0.6)
-    top_p: Optional[float] = Field(default=1)
-    max_tokens: Optional[int] = Field(default=50)
-    max_completion_tokens: Optional[int] = Field(default=50)
+    temperature: Optional[float] = Field(default=Config().temperature)
+    top_p: Optional[float] = Field(default=Config().top_p)
+    max_tokens: Optional[int] = Field(default=Config().max_new_tokens)
+    max_completion_tokens: Optional[int] = Field(default=Config().max_new_tokens)
    
    def get_tokenizer_messages(self):
        if isinstance(self.prompt,List):