command: $HOME/bin/llama.cpp/build/bin/llama-server     --model $HOME/bin/Qwen3.6-35B-A3B-MTP-UD-IQ4_XS.gguf     --port 7104     --host 127.0.0.1     --ctx-size 131072     --n-gpu-layers -1     --jinja     --flash-attn on     --parallel 1 --threads 16     --cache-type-k q8_0 --cache-type-v q8_0     --spec-type draft-mtp --spec-draft-n-max 2     --chat-template-kwargs '{"preserve_thinking":true}'
