kvcache-ai-ktransformers

mirror of https://github.com/kvcache-ai/ktransformers.git synced 2025-09-08 21:49:39 +00:00

History

SkqLiao 19c824f9d0 change cpu-infer due to actual cpu cores on self-hosted server.		2025-03-20 10:10:52 +08:00
..
configs	update rope calculation; update modeling.py; update gate for moe	2025-02-01 07:32:21 +00:00
ktransformers_ext	⚡ update compile option for avx512vpopcntdq	2025-03-06 12:18:04 +08:00
models	optimize gguf dequant, save mem, support Q2_K	2025-02-22 06:13:01 +00:00
operators	use compile for gate, slight performance improvement	2025-03-14 12:43:28 +00:00
optimize	use compile for gate, slight performance improvement	2025-03-14 12:43:28 +00:00
server	Merge pull request #842 from BITcyman/fix-openai_chat_completion	2025-03-07 22:56:19 +08:00
tests	change cpu-infer due to actual cpu cores on self-hosted server.	2025-03-20 10:10:52 +08:00
util	fix flashinfer precision	2025-03-07 14:07:00 +00:00
website	✨: refactor local_chat and fix message slice bug in server	2024-11-04 14:02:19 +08:00
__init__.py	Update __init__.py	2025-03-07 22:08:48 +08:00
local_chat.py	fix-singleton	2025-03-14 04:16:53 +00:00
local_chat_test.py	local chat for cicd test	2025-03-15 02:31:19 +08:00