From 3b9e16cec79116ca801b4092c53afd48a444b921 Mon Sep 17 00:00:00 2001
From: Atream <80757050+Atream@users.noreply.github.com>
Date: Wed, 9 Apr 2025 10:54:00 +0800
Subject: [PATCH] Update attention.py

---
 ktransformers/operators/attention.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/ktransformers/operators/attention.py b/ktransformers/operators/attention.py
index 2f39aa6..2d242f6 100644
--- a/ktransformers/operators/attention.py
+++ b/ktransformers/operators/attention.py
@@ -435,6 +435,7 @@ class KDeepseekV2Attention(BaseInjectedModule, DeepseekV2Attention):
                     kv_len_arr = torch.tensor([position_ids[0, -1].item()+1], dtype=torch.int32, device=self.device)
                     self.mla_wrapper.plan(qo_indptr,None,None,
                                         kv_len_arr,
+                                        None,
                                         self.num_heads,
                                         self.kv_lora_rank,
                                         self.qk_rope_head_dim,
@@ -849,4 +850,4 @@ class flashinfer_attn(BaseInjectedModule, DeepseekV2Attention):
         attn_output = attn_output.transpose(0, 1)
         attn_output = attn_output.reshape(q_len, self.num_heads * self.v_head_dim)
         attn_output = self.o_proj(attn_output, num_tokens_tensors)
-        return attn_output
\ No newline at end of file
+        return attn_output