Update completions.py

2025-09-07 13:09:50 +00:00 · 2025-03-26 15:39:46 +08:00 · 2025-03-26 15:39:46 +08:00 · 84164f584c
commit 84164f584c
parent 52fa671c10
1 changed files with 12 additions and 4 deletions
--- a/ktransformers/server/api/ollama/completions.py
+++ b/ktransformers/server/api/ollama/completions.py
@ -85,7 +85,11 @@ async def generate(request: Request, input: OllamaGenerateCompletionRequest):
        return check_link_response(request, inner())
    else:
        complete_response = ""
-        async for token in interface.inference(input.prompt, id):
+        async for res in interface.inference(input.prompt, id):
            if isinstance(res, RawUsage):
                raw_usage = res
            else: 
                token, finish_reason = res
                complete_response += token
        response = OllamaGenerationResponse(
            model=config.model_name,
@ -187,7 +191,11 @@ async def chat(request: Request, input: OllamaChatCompletionRequest):
        complete_response = ""
        eval_count = 0 
-        async for token in interface.inference(prompt, id):
+        async for res in interface.inference(prompt, id):
            if isinstance(res, RawUsage):
                raw_usage = res
            else: 
                token, finish_reason = res
                complete_response += token
            eval_count += 1