koboldcpp

mirror of https://github.com/LostRuins/koboldcpp.git synced 2026-06-01 06:00:36 +00:00

History

Concedo 4e358265a3 Merge commit '`8387ffb28d`' into concedo_experimental # Conflicts: # docs/backend/VirtGPU.md # docs/backend/ZenDNN.md # ggml/src/ggml-cpu/amx/amx.cpp # ggml/src/ggml-cpu/amx/mmq.cpp # ggml/src/ggml-sycl/add-id.cpp # ggml/src/ggml-virtgpu/backend/backend-dispatched-backend.cpp # ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer-type.cpp # ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer.cpp # ggml/src/ggml-virtgpu/backend/backend-dispatched.cpp # ggml/src/ggml-virtgpu/backend/backend-dispatched.gen.h # ggml/src/ggml-virtgpu/backend/backend-dispatched.h # ggml/src/ggml-virtgpu/backend/backend-virgl-apir.h # ggml/src/ggml-virtgpu/backend/backend.cpp # ggml/src/ggml-virtgpu/backend/shared/api_remoting.h # ggml/src/ggml-virtgpu/backend/shared/apir_backend.gen.h # ggml/src/ggml-virtgpu/backend/shared/apir_backend.h # ggml/src/ggml-virtgpu/backend/shared/apir_cs.h # ggml/src/ggml-virtgpu/backend/shared/apir_cs_ggml.h # ggml/src/ggml-virtgpu/backend/shared/apir_cs_rpc.h # ggml/src/ggml-virtgpu/ggml-backend-buffer-type.cpp # ggml/src/ggml-virtgpu/ggml-backend-device.cpp # ggml/src/ggml-virtgpu/ggml-backend-reg.cpp # ggml/src/ggml-virtgpu/ggml-backend.cpp # ggml/src/ggml-virtgpu/ggml-remoting.h # ggml/src/ggml-virtgpu/include/apir_hw.h # ggml/src/ggml-virtgpu/regenerate_remoting.py # ggml/src/ggml-virtgpu/virtgpu-forward-backend.cpp # ggml/src/ggml-virtgpu/virtgpu-forward-buffer-type.cpp # ggml/src/ggml-virtgpu/virtgpu-forward-buffer.cpp # ggml/src/ggml-virtgpu/virtgpu-forward-device.cpp # ggml/src/ggml-virtgpu/virtgpu-forward-impl.h # ggml/src/ggml-virtgpu/virtgpu-forward.gen.h # ggml/src/ggml-virtgpu/virtgpu.cpp # ggml/src/ggml-virtgpu/virtgpu.h # ggml/src/ggml-zendnn/CMakeLists.txt # ggml/src/ggml-zendnn/ggml-zendnn.cpp # src/CMakeLists.txt # tests/CMakeLists.txt # tests/test-tokenizer-0.sh # tools/cli/README.md # tools/completion/README.md # tools/imatrix/imatrix.cpp # tools/server/README.md		2026-02-28 12:45:16 +08:00
..
bench	Merge branch 'upstream' into concedo_experimental	2025-08-23 11:35:28 +08:00
public	feat: Add code blocks full height setting to parameter sync service (#19835 )	2026-02-23 22:30:13 +01:00
public_legacy	docs : Minor cleanups (#19252 )	2026-02-02 08:38:55 +02:00
public_simplechat	Merge branch 'upstream' into concedo_experimental	2025-05-03 12:15:36 +08:00
tests	Merge commit '`8387ffb28d`' into concedo_experimental	2026-02-28 12:45:16 +08:00
themes	Merge branch 'upstream' into concedo_experimental	2026-02-03 19:00:42 +08:00
webui	Merge commit '`8c2c0108dd`' into concedo_experimental	2026-02-26 16:30:37 +08:00
chat-llama2.sh	scripts : make the shell scripts cross-platform (#14341 )	2025-06-30 10:17:18 +02:00
chat.mjs	llama : move end-user examples to tools directory (#13249 )	2025-05-02 20:27:13 +02:00
chat.sh	scripts : make the shell scripts cross-platform (#14341 )	2025-06-30 10:17:18 +02:00
README-dev.md	server: add auto-sleep after N seconds of idle (#18228 )	2025-12-21 02:24:42 +01:00
server-common.cpp	server : support multi-modal context checkpoints (#19849 )	2026-02-25 15:14:27 +02:00
server-common.h	server : support multi-modal context checkpoints (#19849 )	2026-02-25 15:14:27 +02:00
server-context.cpp	server : support multiple model aliases via comma-separated --alias (#19926 )	2026-02-27 07:05:23 +01:00
server-context.h	server : support multiple model aliases via comma-separated --alias (#19926 )	2026-02-27 07:05:23 +01:00
server-http.cpp	server: fix query params lost when proxying requests in multi-model router mode (#19854 )	2026-02-24 21:46:06 +01:00
server-http.h	server: fix query params lost when proxying requests in multi-model router mode (#19854 )	2026-02-24 21:46:06 +01:00
server-models.cpp	server : support multiple model aliases via comma-separated --alias (#19926 )	2026-02-27 07:05:23 +01:00
server-models.h	server : support multiple model aliases via comma-separated --alias (#19926 )	2026-02-27 07:05:23 +01:00
server-queue.cpp	server: improve slots scheduling for n_cmpl (#18789 )	2026-01-15 17:10:28 +01:00
server-queue.h	server: improve slots scheduling for n_cmpl (#18789 )	2026-01-15 17:10:28 +01:00
server-task.cpp	server : enable multi-modal prompt caching (#19877 )	2026-02-25 15:15:42 +02:00
server-task.h	server : support multi-modal context checkpoints (#19849 )	2026-02-25 15:14:27 +02:00
server.cpp	server : support multiple model aliases via comma-separated --alias (#19926 )	2026-02-27 07:05:23 +01:00