command: $HOME/bin/llama.cpp/build/bin/llama-server --model $HOME/bin/Qwen3.6-35B-A3B-MTP-UD-IQ4_XS.gguf --port 7104 --host 127.0.0.1 --ctx-size 131072 --n-gpu-layers -1 --jinja --flash-attn on --parallel 1 --threads 16 --cache-type-k q8_0 --cache-type-v q8_0 --spec-type draft-mtp --spec-draft-n-max 2 --chat-template-kwargs \{\"preserve_thinking\":true\}
