koboldcpp

Concedo eb30b29d69 Merge branch 'upstream' into concedo_experimental # Conflicts: # .github/workflows/gguf-publish.yml # CODEOWNERS # examples/sycl/test.sh # pyproject.toml # tools/mtmd/CMakeLists.txt # tools/mtmd/README.md	2026-05-08 14:48:57 +08:00
..
afmoe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
apertus.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
arcee.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
arctic.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
arwkv7.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
baichuan.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
bailingmoe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
bailingmoe2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
bert.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
bitnet.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
bloom.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
chameleon.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
chatglm.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
codeshell.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
cogvlm.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
cohere2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
command-r.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
dbrx.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
deci.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
deepseek.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
deepseek2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
deepseek2ocr.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
delta-net-base.cpp	graph : remove redundant GDN state transposes (#20443 )	2026-03-13 22:12:54 +02:00
dots1.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
dream.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
ernie4-5-moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
ernie4-5.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
eurobert.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
exaone-moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
exaone.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
exaone4.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
falcon-h1.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
falcon.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
gemma-embedding.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
gemma.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
gemma2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
gemma3.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
gemma3n.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
gemma4.cpp	Merge commit '`935a340292`' into concedo_experimental	2026-05-06 21:02:25 +08:00
glm-dsa.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
glm4-moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
glm4.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
gpt2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
gptneox.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
granite-hybrid.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
granite-moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
granite.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
grok.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
grovemoe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
hunyuan-dense.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
hunyuan-moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
hunyuan-vl.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
internlm2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
jais.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
jais2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
jamba.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
jina-bert-v2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
jina-bert-v3.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
kimi-linear.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
lfm2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
lfm2moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
llada-moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
llada.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
llama-embed.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
llama.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
llama4.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
maincoder.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
mamba-base.cpp	model : wire up Nemotron-H tensors for NVFP4 support (#20561 )	2026-03-16 09:19:16 +01:00
mamba.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
mamba2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
mimo2.cpp	model: Add Mimo v2.5 model support (#22493 )	2026-05-07 13:21:58 +02:00
minicpm.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
minicpm3.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
minimax-m2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
mistral3.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
mistral4.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
models.h	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
modern-bert.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
mpt.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
nemotron-h-moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
nemotron-h.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
nemotron.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
neo-bert.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
nomic-bert-moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
nomic-bert.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
olmo.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
olmo2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
olmoe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
openai-moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
openelm.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
orion.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
paddleocr.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
pangu-embed.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
phi2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
phi3.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
phimoe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
plamo.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
plamo2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
plamo3.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
plm.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
qwen.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
qwen2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
qwen2moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
qwen2vl.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
qwen3.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
qwen3moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
qwen3next.cpp	Merge commit '`935a340292`' into concedo_experimental	2026-05-06 21:02:25 +08:00
qwen3vl.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
qwen3vlmoe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
qwen35.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
qwen35moe.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
refact.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
rnd1.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
rwkv6-base.cpp	models : deduplicate delta-net graphs for Qwen family (#19597 )	2026-02-16 14:35:04 +02:00
rwkv6.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
rwkv6qwen2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
rwkv7-base.cpp	models : deduplicate delta-net graphs for Qwen family (#19597 )	2026-02-16 14:35:04 +02:00
rwkv7.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
seed-oss.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
smallthinker.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
smollm3.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
stablelm.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
starcoder.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
starcoder2.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
step35.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
t5.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
t5encoder.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
wavtokenizer-dec.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00
xverse.cpp	model: move `load_hparams` and `load_tensors` to per-model definition (#22004 )	2026-05-04 12:36:59 +02:00

afmoe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

apertus.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

arcee.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

arctic.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

arwkv7.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

baichuan.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

bailingmoe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

bailingmoe2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

bert.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

bitnet.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

bloom.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

chameleon.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

chatglm.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

codeshell.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

cogvlm.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

cohere2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

command-r.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

dbrx.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

deci.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

deepseek.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

deepseek2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

deepseek2ocr.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

delta-net-base.cpp

graph : remove redundant GDN state transposes (#20443 )

2026-03-13 22:12:54 +02:00

dots1.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

dream.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

ernie4-5-moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

ernie4-5.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

eurobert.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

exaone-moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

exaone.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

exaone4.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

falcon-h1.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

falcon.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

gemma-embedding.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

gemma.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

gemma2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

gemma3.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

gemma3n.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

gemma4.cpp

Merge commit '935a340292' into concedo_experimental

2026-05-06 21:02:25 +08:00

glm-dsa.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

glm4-moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

glm4.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

gpt2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

gptneox.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

granite-hybrid.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

granite-moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

granite.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

grok.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

grovemoe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

hunyuan-dense.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

hunyuan-moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

hunyuan-vl.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

internlm2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

jais.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

jais2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

jamba.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

jina-bert-v2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

jina-bert-v3.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

kimi-linear.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

lfm2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

lfm2moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

llada-moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

llada.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

llama-embed.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

llama.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

llama4.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

maincoder.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

mamba-base.cpp

model : wire up Nemotron-H tensors for NVFP4 support (#20561 )

2026-03-16 09:19:16 +01:00

mamba.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

mamba2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

mimo2.cpp

model: Add Mimo v2.5 model support (#22493 )

2026-05-07 13:21:58 +02:00

minicpm.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

minicpm3.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

minimax-m2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

mistral3.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

mistral4.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

models.h

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

modern-bert.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

mpt.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

nemotron-h-moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

nemotron-h.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

nemotron.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

neo-bert.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

nomic-bert-moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

nomic-bert.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

olmo.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

olmo2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

olmoe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

openai-moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

openelm.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

orion.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

paddleocr.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

pangu-embed.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

phi2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

phi3.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

phimoe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

plamo.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

plamo2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

plamo3.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

plm.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

qwen.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

qwen2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

qwen2moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

qwen2vl.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

qwen3.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

qwen3moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

qwen3next.cpp

Merge commit '935a340292' into concedo_experimental

2026-05-06 21:02:25 +08:00

qwen3vl.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

qwen3vlmoe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

qwen35.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

qwen35moe.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

refact.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

rnd1.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

rwkv6-base.cpp

models : deduplicate delta-net graphs for Qwen family (#19597 )

2026-02-16 14:35:04 +02:00

rwkv6.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

rwkv6qwen2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

rwkv7-base.cpp

models : deduplicate delta-net graphs for Qwen family (#19597 )

2026-02-16 14:35:04 +02:00

rwkv7.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

seed-oss.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

smallthinker.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

smollm3.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

stablelm.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

starcoder.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

starcoder2.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

step35.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

t5.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

t5encoder.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

wavtokenizer-dec.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00

xverse.cpp

model: move load_hparams and load_tensors to per-model definition (#22004 )

2026-05-04 12:36:59 +02:00