Merge pull request #1090 from kvcache-ai/Atream-patch-1

Update attention.py
2025-09-16 10:09:42 +00:00 · 2025-04-09 10:54:37 +08:00 · 2025-04-09 10:54:37 +08:00 · 9037bf30d5
commit 9037bf30d5
parent 94476ce5cc 3b9e16cec7
1 changed files with 2 additions and 1 deletions
--- a/ktransformers/operators/attention.py
+++ b/ktransformers/operators/attention.py
@ -435,6 +435,7 @@ class KDeepseekV2Attention(BaseInjectedModule, DeepseekV2Attention):
                    kv_len_arr = torch.tensor([position_ids[0, -1].item()+1], dtype=torch.int32, device=self.device)
                    self.mla_wrapper.plan(qo_indptr,None,None,
                                        kv_len_arr,
+                                        None,
                                        self.num_heads,
                                        self.kv_lora_rank,
                                        self.qk_rope_head_dim,