koboldcpp

mirror of https://github.com/LostRuins/koboldcpp.git synced 2026-05-23 04:19:08 +00:00

History

Concedo 718dc159b6 Merge branch 'upstream' into concedo_experimental # Conflicts: # CMakeLists.txt # docs/speculative.md # ggml/src/ggml-cuda/CMakeLists.txt # ggml/src/ggml-hexagon/ggml-hexagon.cpp # ggml/src/ggml-hexagon/htp/hmx-matmul-ops.c # ggml/src/ggml-hexagon/htp/hmx-ops.h # ggml/src/ggml-hexagon/htp/main.c # ggml/src/ggml-hexagon/htp/matmul-ops.c # ggml/src/ggml-hexagon/htp/rope-ops.c # ggml/src/ggml-hexagon/htp/ssm-conv.c # ggml/src/ggml-opencl/ggml-opencl.cpp # scripts/snapdragon/adb/run-bench.sh # scripts/snapdragon/adb/run-cli.sh # scripts/snapdragon/adb/run-completion.sh # scripts/snapdragon/adb/run-mtmd.sh # scripts/snapdragon/windows/run-bench.ps1 # scripts/snapdragon/windows/run-cli.ps1 # scripts/snapdragon/windows/run-completion.ps1 # scripts/snapdragon/windows/run-mtmd.ps1 # src/llama-vocab.cpp # tests/test-backend-ops.cpp # tools/batched-bench/CMakeLists.txt # tools/batched-bench/batched-bench.cpp # tools/cli/CMakeLists.txt # tools/cli/README.md # tools/cli/cli.cpp # tools/completion/CMakeLists.txt # tools/completion/README.md # tools/llama-bench/CMakeLists.txt # tools/llama-bench/llama-bench.cpp # tools/mtmd/CMakeLists.txt # tools/mtmd/tests/test-deepseek-ocr.py # tools/mtmd/tests/tests-requirements.txt # tools/perplexity/CMakeLists.txt # tools/perplexity/perplexity.cpp # tools/quantize/CMakeLists.txt # tools/server/CMakeLists.txt # tools/server/README.md # ty.toml		2026-05-21 23:47:21 +08:00
..
bench	Merge branch 'upstream' into concedo_experimental	2026-03-22 23:39:13 +08:00
tests	Merge branch 'upstream' into concedo_experimental	2026-05-18 21:27:23 +08:00
chat-llama2.sh
chat.mjs
chat.sh
main.cpp	app : introduce the llama unified executable (#23296 )	2026-05-20 13:22:22 +02:00
README-dev.md	ui: Restructure repo to use `tools/ui` folder and `ui` / `UI` / `llama-ui` / `LLAMA_UI` naming (#23064 )	2026-05-16 02:02:40 +02:00
server-chat.cpp	Support for Codex CLI by skipping unsupported Responses tools (#23041 )	2026-05-15 09:03:24 +02:00
server-chat.h	server: (router) Forward form-data to model server (Fixes #22044 ) (#22118 )	2026-04-27 23:55:00 +02:00
server-common.cpp	common : delegate assistant continuation to underlying template handlers (#23089 )	2026-05-17 13:36:05 +02:00
server-common.h	logs : reduce (#23021 )	2026-05-14 13:05:52 +03:00
server-context.cpp	mtmd: fit_params now take into account mmproj (#21489 )	2026-05-20 11:27:44 +02:00
server-context.h	ui: Restructure repo to use `tools/ui` folder and `ui` / `UI` / `llama-ui` / `LLAMA_UI` naming (#23064 )	2026-05-16 02:02:40 +02:00
server-cors-proxy.h	server: (router) Forward form-data to model server (Fixes #22044 ) (#22118 )	2026-04-27 23:55:00 +02:00
server-http.cpp	cmake : fix LLAMA_BUILD_UI logic (#23190 )	2026-05-17 14:42:26 -04:00
server-http.h	server: support Vertex AI compatible API (#22545 )	2026-05-08 15:23:04 +02:00
server-models.cpp	ui: Refactor models store, MCP service, and gate logs behind VITE_DEBUG (#23236 )	2026-05-18 16:09:40 +02:00
server-models.h	ui: Restructure repo to use `tools/ui` folder and `ui` / `UI` / `llama-ui` / `LLAMA_UI` naming (#23064 )	2026-05-16 02:02:40 +02:00
server-queue.cpp	server : print warning when HTTP timeout exceeded (#22907 )	2026-05-10 22:00:18 +03:00
server-queue.h	server: allow router to report child instances sleep status (#20849 )	2026-03-22 18:33:52 +01:00
server-task.cpp	common : delegate assistant continuation to underlying template handlers (#23089 )	2026-05-17 13:36:05 +02:00
server-task.h	common : delegate assistant continuation to underlying template handlers (#23089 )	2026-05-17 13:36:05 +02:00
server-tools.cpp	server : validate --tools CLI argument against known tool names (#22538 )	2026-05-05 06:35:27 +03:00
server-tools.h	server: add built-in tools backend support (#20898 )	2026-03-27 10:07:11 +01:00
server.cpp	app : introduce the llama unified executable (#23296 )	2026-05-20 13:22:22 +02:00