MoE

KT-FT v0.6.1: Closing the Loop from MoE Fine-Tuning to Local Serving

KT-FT v0.6.1 connects MoE SFT and local SGLang serving into an end-to-end loop; split LoRA serving bridges KT expert and SGLang non-expert adapters for Qwen3.5 MoE.

May 29, 2026

KTransformers + LLaMA-Factory + SGLang: Low-Cost Local Fine-Tuning and Inference

A low-cost, low-memory end-to-end fine-tuning and inference workflow for large MoE models with KTransformers, LLaMA-Factory, and SGLang.

Nov 1, 2025