Fix kt-kernel for new wrapper (#1588)

* update README for kt-kernel * style: format C++ and Python code in kt-kernel - Format C++ files: task_queue, ext_bindings, and MoE operators - Format Python utility modules: amx, llamafile, and loader - Improve code readability and consistency
2026-04-28 11:49:51 +00:00 · 2025-11-10 21:47:34 +08:00 · 2025-11-10 21:47:34 +08:00 · 94c25626dc
commit 94c25626dc
parent 9bc00e587b
10 changed files with 219 additions and 179 deletions
--- a/kt-kernel/python/init.py
+++ b/kt-kernel/python/init.py
@ -6,8 +6,8 @@ KT-Kernel provides high-performance kernel operations for KTransformers,
 including CPU-optimized MoE inference with AMX, AVX, and KML support.

 Example usage:
-    >>> from kt_kernel import AMXMoEWrapper
-    >>> wrapper = AMXMoEWrapper(
+    >>> from kt_kernel import KTMoEWrapper
+    >>> wrapper = KTMoEWrapper(
    ...     layer_idx=0,
    ...     num_experts=8,
    ...     num_experts_per_tok=2,
@ -15,9 +15,10 @@ Example usage:
    ...     moe_intermediate_size=14336,
    ...     num_gpu_experts=2,
    ...     cpuinfer_threads=32,
-    ...     subpool_count=2,
-    ...     amx_weight_path="/path/to/weights",
-    ...     chunked_prefill_size=512
+    ...     threadpool_count=2,
+    ...     weight_path="/path/to/weights",
+    ...     chunked_prefill_size=512,
+    ...     method="AMXINT4"
    ... )
 """