koboldcpp

593 commits 3 branches 196 tags 386 MiB

Author	SHA1	Message	Date
0cc4m	b6b39960c0	Use compile args for preprocessing constants	2023-05-21 08:17:17 +02:00
0cc4m	a1657d0233	Add OpenCL compile options	2023-05-21 07:53:22 +02:00
0cc4m	e41a7ae40c	Fix convert_row_f16 kernel issue	2023-05-21 07:53:22 +02:00
0cc4m	457eff920e	Deduplicate dequant kernels	2023-05-21 07:53:22 +02:00
0cc4m	42e1a2ba3d	Fix tensor load to device Co-authored-by: Johannes Gäßler <johannesg@5d6.de>	2023-05-21 07:50:27 +02:00
0cc4m	cda2d488f9	Fix error in convert f16 to f32 kernel call	2023-05-21 07:49:54 +02:00
0cc4m	915d0d1168	Generate dequant_mul_mat kernels from simple templates	2023-05-21 07:49:24 +02:00
0cc4m	cb588e2aa4	Add remaining dequant_mul_mat functions	2023-05-21 07:47:18 +02:00
0cc4m	8c7a7cea2e	Fix dequant_mul_mat kernel	2023-05-21 07:44:49 +02:00
0cc4m	5f610c90bf	Fix bugs in dequant_mul_mat code	2023-05-21 07:44:48 +02:00
0cc4m	17e53dbb7e	Refactor OpenCL code to work more like the CUDA code, add missing functions	2023-05-21 07:42:06 +02:00
0cc4m	a7e3bee4cc	Move back to C++ for OpenCL	2023-05-21 06:17:31 +02:00

Renamed from ggml-opencl.c (Browse further)