koboldcpp

mirror of https://github.com/LostRuins/koboldcpp.git synced 2025-09-14 19:09:45 +00:00

History

luoyu-intel d08c20edde [SYCL] Fix the sub group size of Intel (#8106 ) * use warp_size macro for all sycl kernels * fix mask of permute_sub_group_by_xor * fix rms_norm with correct warp number * fix rms_norm_f32/group_norm_f32 * move norm to norm.cpp file * fix quantize bug * fix mmvq's batch size		2024-07-02 10:16:00 +08:00
..
ggml-cuda	CUDA: refactor and optimize IQ MMVQ (#8215 )	2024-07-01 20:39:06 +02:00
ggml-sycl	[SYCL] Fix the sub group size of Intel (#8106 )	2024-07-02 10:16:00 +08:00
kompute@4565194ed7	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
kompute-shaders	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
vulkan-shaders	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
CMakeLists.txt	[SYCL] Fix the sub group size of Intel (#8106 )	2024-07-02 10:16:00 +08:00
ggml-alloc.c	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-backend-impl.h	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-backend.c	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-blas.cpp	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-common.h	CUDA: refactor and optimize IQ MMVQ (#8215 )	2024-07-01 20:39:06 +02:00
ggml-cuda.cu	CUDA: refactor and optimize IQ MMVQ (#8215 )	2024-07-01 20:39:06 +02:00
ggml-impl.h	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-kompute.cpp	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-metal.m	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-metal.metal	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-quants.c	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-quants.h	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-rpc.cpp	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-sycl.cpp	[SYCL] Fix the sub group size of Intel (#8106 )	2024-07-02 10:16:00 +08:00
ggml-vulkan-shaders.hpp	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml-vulkan.cpp	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
ggml.c	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
sgemm.cpp	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00
sgemm.h	llama : reorganize source code + improve CMake (#8006 )	2024-06-26 18:33:02 +03:00