kvcache-ai-ktransformers

mirror of https://github.com/kvcache-ai/ktransformers.git synced 2025-09-15 01:29:42 +00:00

History

BITcyman 7c4cb520bd [feature] support q2_k & q3_k dequantize on gpu		2024-08-12 12:53:12 +00:00
..
custom_gguf	[feature] support q2_k & q3_k dequantize on gpu	2024-08-12 12:53:12 +00:00
gptq_marlin	[ADD] support multi-gpu qlen>1 q5_k	2024-08-12 11:41:26 +00:00
binding.cpp	[feature] support q2_k & q3_k dequantize on gpu	2024-08-12 12:53:12 +00:00
setup.py	[ADD] support multi-gpu qlen>1 q5_k	2024-08-12 11:41:26 +00:00