.gitignore
.gitmodules
LICENSE
MANIFEST.in
README.md
pyproject.toml
setup.py
.github/scripts/generate-pep503-index.py
.github/workflows/build-everything.yml
.github/workflows/build-wheels-cpu.yml
.github/workflows/build-wheels-cuda.yml
.github/workflows/build-wheels-macos.yml
.github/workflows/build-wheels-rocm.yml
.github/workflows/build-wheels-vulkan.yml
llama.cpp/CMakeLists.txt
llama.cpp/requirements.txt
llama.cpp/cmake/arm64-apple-clang.cmake
llama.cpp/cmake/arm64-linux-clang.cmake
llama.cpp/cmake/arm64-windows-llvm.cmake
llama.cpp/cmake/build-info.cmake
llama.cpp/cmake/common.cmake
llama.cpp/cmake/download-models.cmake
llama.cpp/cmake/git-vars.cmake
llama.cpp/cmake/license.cmake
llama.cpp/cmake/llama-config.cmake.in
llama.cpp/cmake/llama.pc.in
llama.cpp/cmake/riscv64-spacemit-linux-gnu-gcc.cmake
llama.cpp/cmake/x64-windows-llvm.cmake
llama.cpp/common/CMakeLists.txt
llama.cpp/common/arg.cpp
llama.cpp/common/arg.h
llama.cpp/common/base64.hpp
llama.cpp/common/build-info.cpp.in
llama.cpp/common/build-info.h
llama.cpp/common/chat-auto-parser-generator.cpp
llama.cpp/common/chat-auto-parser-helpers.cpp
llama.cpp/common/chat-auto-parser-helpers.h
llama.cpp/common/chat-auto-parser.h
llama.cpp/common/chat-diff-analyzer.cpp
llama.cpp/common/chat-peg-parser.cpp
llama.cpp/common/chat-peg-parser.h
llama.cpp/common/chat.cpp
llama.cpp/common/chat.h
llama.cpp/common/common.cpp
llama.cpp/common/common.h
llama.cpp/common/console.cpp
llama.cpp/common/console.h
llama.cpp/common/debug.cpp
llama.cpp/common/debug.h
llama.cpp/common/download.cpp
llama.cpp/common/download.h
llama.cpp/common/fit.cpp
llama.cpp/common/fit.h
llama.cpp/common/hf-cache.cpp
llama.cpp/common/hf-cache.h
llama.cpp/common/http.h
llama.cpp/common/json-partial.cpp
llama.cpp/common/json-partial.h
llama.cpp/common/json-schema-to-grammar.cpp
llama.cpp/common/json-schema-to-grammar.h
llama.cpp/common/llguidance.cpp
llama.cpp/common/log.cpp
llama.cpp/common/log.h
llama.cpp/common/ngram-cache.cpp
llama.cpp/common/ngram-cache.h
llama.cpp/common/ngram-map.cpp
llama.cpp/common/ngram-map.h
llama.cpp/common/ngram-mod.cpp
llama.cpp/common/ngram-mod.h
llama.cpp/common/peg-parser.cpp
llama.cpp/common/peg-parser.h
llama.cpp/common/preset.cpp
llama.cpp/common/preset.h
llama.cpp/common/reasoning-budget.cpp
llama.cpp/common/reasoning-budget.h
llama.cpp/common/regex-partial.cpp
llama.cpp/common/regex-partial.h
llama.cpp/common/sampling.cpp
llama.cpp/common/sampling.h
llama.cpp/common/speculative.cpp
llama.cpp/common/speculative.h
llama.cpp/common/unicode.cpp
llama.cpp/common/unicode.h
llama.cpp/common/jinja/caps.cpp
llama.cpp/common/jinja/caps.h
llama.cpp/common/jinja/lexer.cpp
llama.cpp/common/jinja/lexer.h
llama.cpp/common/jinja/parser.cpp
llama.cpp/common/jinja/parser.h
llama.cpp/common/jinja/runtime.cpp
llama.cpp/common/jinja/runtime.h
llama.cpp/common/jinja/string.cpp
llama.cpp/common/jinja/string.h
llama.cpp/common/jinja/utils.h
llama.cpp/common/jinja/value.cpp
llama.cpp/common/jinja/value.h
llama.cpp/examples/CMakeLists.txt
llama.cpp/examples/batched/CMakeLists.txt
llama.cpp/examples/batched/batched.cpp
llama.cpp/examples/convert-llama2c-to-ggml/CMakeLists.txt
llama.cpp/examples/convert-llama2c-to-ggml/convert-llama2c-to-ggml.cpp
llama.cpp/examples/debug/CMakeLists.txt
llama.cpp/examples/debug/debug.cpp
llama.cpp/examples/deprecation-warning/deprecation-warning.cpp
llama.cpp/examples/diffusion/CMakeLists.txt
llama.cpp/examples/diffusion/diffusion-cli.cpp
llama.cpp/examples/diffusion/diffusion.cpp
llama.cpp/examples/diffusion/diffusion.h
llama.cpp/examples/embedding/CMakeLists.txt
llama.cpp/examples/embedding/embedding.cpp
llama.cpp/examples/eval-callback/CMakeLists.txt
llama.cpp/examples/eval-callback/eval-callback.cpp
llama.cpp/examples/gen-docs/CMakeLists.txt
llama.cpp/examples/gen-docs/gen-docs.cpp
llama.cpp/examples/gguf/CMakeLists.txt
llama.cpp/examples/gguf/gguf.cpp
llama.cpp/examples/gguf-hash/CMakeLists.txt
llama.cpp/examples/gguf-hash/gguf-hash.cpp
llama.cpp/examples/gguf-hash/deps/rotate-bits/rotate-bits.h
llama.cpp/examples/gguf-hash/deps/sha1/sha1.c
llama.cpp/examples/gguf-hash/deps/sha1/sha1.h
llama.cpp/examples/gguf-hash/deps/sha256/sha256.c
llama.cpp/examples/gguf-hash/deps/sha256/sha256.h
llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.c
llama.cpp/examples/gguf-hash/deps/xxhash/xxhash.h
llama.cpp/examples/idle/CMakeLists.txt
llama.cpp/examples/idle/idle.cpp
llama.cpp/examples/llama.android/lib/src/main/cpp/CMakeLists.txt
llama.cpp/examples/llama.android/lib/src/main/cpp/ai_chat.cpp
llama.cpp/examples/llama.android/lib/src/main/cpp/logging.h
llama.cpp/examples/lookahead/CMakeLists.txt
llama.cpp/examples/lookahead/lookahead.cpp
llama.cpp/examples/lookup/CMakeLists.txt
llama.cpp/examples/lookup/lookup-create.cpp
llama.cpp/examples/lookup/lookup-merge.cpp
llama.cpp/examples/lookup/lookup-stats.cpp
llama.cpp/examples/lookup/lookup.cpp
llama.cpp/examples/model-conversion/requirements.txt
llama.cpp/examples/parallel/CMakeLists.txt
llama.cpp/examples/parallel/parallel.cpp
llama.cpp/examples/passkey/CMakeLists.txt
llama.cpp/examples/passkey/passkey.cpp
llama.cpp/examples/retrieval/CMakeLists.txt
llama.cpp/examples/retrieval/retrieval.cpp
llama.cpp/examples/save-load-state/CMakeLists.txt
llama.cpp/examples/save-load-state/save-load-state.cpp
llama.cpp/examples/simple/CMakeLists.txt
llama.cpp/examples/simple/simple.cpp
llama.cpp/examples/simple-chat/CMakeLists.txt
llama.cpp/examples/simple-chat/simple-chat.cpp
llama.cpp/examples/simple-cmake-pkg/CMakeLists.txt
llama.cpp/examples/speculative/CMakeLists.txt
llama.cpp/examples/speculative/speculative.cpp
llama.cpp/examples/speculative-simple/CMakeLists.txt
llama.cpp/examples/speculative-simple/speculative-simple.cpp
llama.cpp/examples/sycl/CMakeLists.txt
llama.cpp/examples/sycl/ls-sycl-device.cpp
llama.cpp/examples/training/CMakeLists.txt
llama.cpp/examples/training/finetune.cpp
llama.cpp/ggml/CMakeLists.txt
llama.cpp/ggml/cmake/FindNCCL.cmake
llama.cpp/ggml/cmake/GitVars.cmake
llama.cpp/ggml/cmake/common.cmake
llama.cpp/ggml/cmake/ggml-config.cmake.in
llama.cpp/ggml/include/ggml-alloc.h
llama.cpp/ggml/include/ggml-backend.h
llama.cpp/ggml/include/ggml-blas.h
llama.cpp/ggml/include/ggml-cann.h
llama.cpp/ggml/include/ggml-cpp.h
llama.cpp/ggml/include/ggml-cpu.h
llama.cpp/ggml/include/ggml-cuda.h
llama.cpp/ggml/include/ggml-hexagon.h
llama.cpp/ggml/include/ggml-metal.h
llama.cpp/ggml/include/ggml-opencl.h
llama.cpp/ggml/include/ggml-openvino.h
llama.cpp/ggml/include/ggml-opt.h
llama.cpp/ggml/include/ggml-rpc.h
llama.cpp/ggml/include/ggml-sycl.h
llama.cpp/ggml/include/ggml-virtgpu.h
llama.cpp/ggml/include/ggml-vulkan.h
llama.cpp/ggml/include/ggml-webgpu.h
llama.cpp/ggml/include/ggml-zdnn.h
llama.cpp/ggml/include/ggml-zendnn.h
llama.cpp/ggml/include/ggml.h
llama.cpp/ggml/include/gguf.h
llama.cpp/ggml/src/CMakeLists.txt
llama.cpp/ggml/src/ggml-alloc.c
llama.cpp/ggml/src/ggml-backend-dl.cpp
llama.cpp/ggml/src/ggml-backend-dl.h
llama.cpp/ggml/src/ggml-backend-impl.h
llama.cpp/ggml/src/ggml-backend-meta.cpp
llama.cpp/ggml/src/ggml-backend-reg.cpp
llama.cpp/ggml/src/ggml-backend.cpp
llama.cpp/ggml/src/ggml-common.h
llama.cpp/ggml/src/ggml-impl.h
llama.cpp/ggml/src/ggml-opt.cpp
llama.cpp/ggml/src/ggml-quants.c
llama.cpp/ggml/src/ggml-quants.h
llama.cpp/ggml/src/ggml-threading.cpp
llama.cpp/ggml/src/ggml-threading.h
llama.cpp/ggml/src/ggml.c
llama.cpp/ggml/src/ggml.cpp
llama.cpp/ggml/src/gguf.cpp
llama.cpp/ggml/src/ggml-blas/CMakeLists.txt
llama.cpp/ggml/src/ggml-blas/ggml-blas.cpp
llama.cpp/ggml/src/ggml-cann/CMakeLists.txt
llama.cpp/ggml/src/ggml-cann/acl_tensor.cpp
llama.cpp/ggml/src/ggml-cann/acl_tensor.h
llama.cpp/ggml/src/ggml-cann/aclnn_ops.cpp
llama.cpp/ggml/src/ggml-cann/aclnn_ops.h
llama.cpp/ggml/src/ggml-cann/common.h
llama.cpp/ggml/src/ggml-cann/ggml-cann.cpp
llama.cpp/ggml/src/ggml-cpu/CMakeLists.txt
llama.cpp/ggml/src/ggml-cpu/arch-fallback.h
llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp
llama.cpp/ggml/src/ggml-cpu/binary-ops.h
llama.cpp/ggml/src/ggml-cpu/common.h
llama.cpp/ggml/src/ggml-cpu/ggml-cpu-impl.h
llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c
llama.cpp/ggml/src/ggml-cpu/ggml-cpu.cpp
llama.cpp/ggml/src/ggml-cpu/hbm.cpp
llama.cpp/ggml/src/ggml-cpu/hbm.h
llama.cpp/ggml/src/ggml-cpu/ops.cpp
llama.cpp/ggml/src/ggml-cpu/ops.h
llama.cpp/ggml/src/ggml-cpu/quants.c
llama.cpp/ggml/src/ggml-cpu/quants.h
llama.cpp/ggml/src/ggml-cpu/repack.cpp
llama.cpp/ggml/src/ggml-cpu/repack.h
llama.cpp/ggml/src/ggml-cpu/simd-gemm.h
llama.cpp/ggml/src/ggml-cpu/simd-mappings.h
llama.cpp/ggml/src/ggml-cpu/traits.cpp
llama.cpp/ggml/src/ggml-cpu/traits.h
llama.cpp/ggml/src/ggml-cpu/unary-ops.cpp
llama.cpp/ggml/src/ggml-cpu/unary-ops.h
llama.cpp/ggml/src/ggml-cpu/vec.cpp
llama.cpp/ggml/src/ggml-cpu/vec.h
llama.cpp/ggml/src/ggml-cpu/amx/amx.cpp
llama.cpp/ggml/src/ggml-cpu/amx/amx.h
llama.cpp/ggml/src/ggml-cpu/amx/common.h
llama.cpp/ggml/src/ggml-cpu/amx/mmq.cpp
llama.cpp/ggml/src/ggml-cpu/amx/mmq.h
llama.cpp/ggml/src/ggml-cpu/arch/arm/cpu-feats.cpp
llama.cpp/ggml/src/ggml-cpu/arch/arm/quants.c
llama.cpp/ggml/src/ggml-cpu/arch/arm/repack.cpp
llama.cpp/ggml/src/ggml-cpu/arch/loongarch/quants.c
llama.cpp/ggml/src/ggml-cpu/arch/powerpc/cpu-feats.cpp
llama.cpp/ggml/src/ggml-cpu/arch/powerpc/quants.c
llama.cpp/ggml/src/ggml-cpu/arch/riscv/cpu-feats.cpp
llama.cpp/ggml/src/ggml-cpu/arch/riscv/quants.c
llama.cpp/ggml/src/ggml-cpu/arch/riscv/repack.cpp
llama.cpp/ggml/src/ggml-cpu/arch/s390/cpu-feats.cpp
llama.cpp/ggml/src/ggml-cpu/arch/s390/quants.c
llama.cpp/ggml/src/ggml-cpu/arch/wasm/quants.c
llama.cpp/ggml/src/ggml-cpu/arch/x86/cpu-feats.cpp
llama.cpp/ggml/src/ggml-cpu/arch/x86/quants.c
llama.cpp/ggml/src/ggml-cpu/arch/x86/repack.cpp
llama.cpp/ggml/src/ggml-cpu/cmake/FindSIMD.cmake
llama.cpp/ggml/src/ggml-cpu/kleidiai/kernels.cpp
llama.cpp/ggml/src/ggml-cpu/kleidiai/kernels.h
llama.cpp/ggml/src/ggml-cpu/kleidiai/kleidiai.cpp
llama.cpp/ggml/src/ggml-cpu/kleidiai/kleidiai.h
llama.cpp/ggml/src/ggml-cpu/llamafile/sgemm.cpp
llama.cpp/ggml/src/ggml-cpu/llamafile/sgemm.h
llama.cpp/ggml/src/ggml-cpu/spacemit/ime.cpp
llama.cpp/ggml/src/ggml-cpu/spacemit/ime.h
llama.cpp/ggml/src/ggml-cpu/spacemit/ime1_kernels.cpp
llama.cpp/ggml/src/ggml-cpu/spacemit/ime_kernels.h
llama.cpp/ggml/src/ggml-cuda/CMakeLists.txt
llama.cpp/ggml/src/ggml-cuda/vendors/cuda.h
llama.cpp/ggml/src/ggml-cuda/vendors/hip.h
llama.cpp/ggml/src/ggml-cuda/vendors/musa.h
llama.cpp/ggml/src/ggml-hexagon/CMakeLists.txt
llama.cpp/ggml/src/ggml-hexagon/ggml-hexagon.cpp
llama.cpp/ggml/src/ggml-hexagon/htp-drv.cpp
llama.cpp/ggml/src/ggml-hexagon/htp-drv.h
llama.cpp/ggml/src/ggml-hexagon/libdl.h
llama.cpp/ggml/src/ggml-hexagon/op-desc.h
llama.cpp/ggml/src/ggml-hexagon/htp/CMakeLists.txt
llama.cpp/ggml/src/ggml-hexagon/htp/act-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/argsort-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/binary-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/cmake-toolchain.cmake
llama.cpp/ggml/src/ggml-hexagon/htp/cpy-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/cumsum-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/diag-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/fill-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/flash-attn-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/gated-delta-net-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/get-rows-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/hex-dma.c
llama.cpp/ggml/src/ggml-hexagon/htp/hex-dma.h
llama.cpp/ggml/src/ggml-hexagon/htp/hex-dump.h
llama.cpp/ggml/src/ggml-hexagon/htp/hex-fastdiv.h
llama.cpp/ggml/src/ggml-hexagon/htp/hex-utils.h
llama.cpp/ggml/src/ggml-hexagon/htp/hmx-flash-attn-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/hmx-matmul-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/hmx-ops.h
llama.cpp/ggml/src/ggml-hexagon/htp/hmx-profile.h
llama.cpp/ggml/src/ggml-hexagon/htp/hmx-queue.c
llama.cpp/ggml/src/ggml-hexagon/htp/hmx-queue.h
llama.cpp/ggml/src/ggml-hexagon/htp/hmx-utils.h
llama.cpp/ggml/src/ggml-hexagon/htp/htp-ctx.h
llama.cpp/ggml/src/ggml-hexagon/htp/htp-ops.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-arith.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-base.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-copy.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-div.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-dump.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-exp.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-floor.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-inverse.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-reduce.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-scale.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sigmoid.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-sqrt.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-types.h
llama.cpp/ggml/src/ggml-hexagon/htp/hvx-utils.h
llama.cpp/ggml/src/ggml-hexagon/htp/main.c
llama.cpp/ggml/src/ggml-hexagon/htp/matmul-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/repeat-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/rope-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/set-rows-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/softmax-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/solve-tri-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/ssm-conv.c
llama.cpp/ggml/src/ggml-hexagon/htp/sum-rows-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/unary-ops.c
llama.cpp/ggml/src/ggml-hexagon/htp/vtcm-utils.h
llama.cpp/ggml/src/ggml-hexagon/htp/worker-pool.c
llama.cpp/ggml/src/ggml-hexagon/htp/worker-pool.h
llama.cpp/ggml/src/ggml-hip/CMakeLists.txt
llama.cpp/ggml/src/ggml-metal/CMakeLists.txt
llama.cpp/ggml/src/ggml-metal/ggml-metal-common.cpp
llama.cpp/ggml/src/ggml-metal/ggml-metal-common.h
llama.cpp/ggml/src/ggml-metal/ggml-metal-context.h
llama.cpp/ggml/src/ggml-metal/ggml-metal-device.cpp
llama.cpp/ggml/src/ggml-metal/ggml-metal-device.h
llama.cpp/ggml/src/ggml-metal/ggml-metal-impl.h
llama.cpp/ggml/src/ggml-metal/ggml-metal-ops.cpp
llama.cpp/ggml/src/ggml-metal/ggml-metal-ops.h
llama.cpp/ggml/src/ggml-metal/ggml-metal.cpp
llama.cpp/ggml/src/ggml-metal/ggml-metal.metal
llama.cpp/ggml/src/ggml-musa/CMakeLists.txt
llama.cpp/ggml/src/ggml-opencl/CMakeLists.txt
llama.cpp/ggml/src/ggml-opencl/ggml-opencl.cpp
llama.cpp/ggml/src/ggml-openvino/CMakeLists.txt
llama.cpp/ggml/src/ggml-openvino/ggml-decoder.cpp
llama.cpp/ggml/src/ggml-openvino/ggml-decoder.h
llama.cpp/ggml/src/ggml-openvino/ggml-openvino-extra.cpp
llama.cpp/ggml/src/ggml-openvino/ggml-openvino-extra.h
llama.cpp/ggml/src/ggml-openvino/ggml-openvino.cpp
llama.cpp/ggml/src/ggml-openvino/ggml-quants.cpp
llama.cpp/ggml/src/ggml-openvino/ggml-quants.h
llama.cpp/ggml/src/ggml-openvino/utils.cpp
llama.cpp/ggml/src/ggml-openvino/utils.h
llama.cpp/ggml/src/ggml-openvino/openvino/decoder.h
llama.cpp/ggml/src/ggml-openvino/openvino/frontend.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/frontend.h
llama.cpp/ggml/src/ggml-openvino/openvino/input_model.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/input_model.h
llama.cpp/ggml/src/ggml-openvino/openvino/node_context.h
llama.cpp/ggml/src/ggml-openvino/openvino/op_table.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op_table.h
llama.cpp/ggml/src/ggml-openvino/openvino/translate_session.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/translate_session.h
llama.cpp/ggml/src/ggml-openvino/openvino/utils.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/utils.h
llama.cpp/ggml/src/ggml-openvino/openvino/op/cont.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/cpy.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/flash_attn_ext.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/get_rows.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/glu_geglu.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/glu_swiglu.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/mulmat.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/permute.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/reshape.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/rms_norm.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/rope.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/scale.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/set_rows.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/softmax.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/transpose.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_gelu.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/unary_silu.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/op/view.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/pass/fuse_to_sdpa.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/pass/fuse_to_sdpa.h
llama.cpp/ggml/src/ggml-openvino/openvino/pass/mark_decompression_convert_constant_folding.h
llama.cpp/ggml/src/ggml-openvino/openvino/pass/squeeze_matmul.cpp
llama.cpp/ggml/src/ggml-openvino/openvino/pass/squeeze_matmul.h
llama.cpp/ggml/src/ggml-openvino/openvino/rt_info/weightless_caching_attributes.hpp
llama.cpp/ggml/src/ggml-rpc/CMakeLists.txt
llama.cpp/ggml/src/ggml-rpc/ggml-rpc.cpp
llama.cpp/ggml/src/ggml-rpc/transport.cpp
llama.cpp/ggml/src/ggml-rpc/transport.h
llama.cpp/ggml/src/ggml-sycl/CMakeLists.txt
llama.cpp/ggml/src/ggml-sycl/add-id.cpp
llama.cpp/ggml/src/ggml-sycl/add-id.hpp
llama.cpp/ggml/src/ggml-sycl/backend.hpp
llama.cpp/ggml/src/ggml-sycl/binbcast.cpp
llama.cpp/ggml/src/ggml-sycl/binbcast.hpp
llama.cpp/ggml/src/ggml-sycl/common.cpp
llama.cpp/ggml/src/ggml-sycl/common.hpp
llama.cpp/ggml/src/ggml-sycl/concat.cpp
llama.cpp/ggml/src/ggml-sycl/concat.hpp
llama.cpp/ggml/src/ggml-sycl/conv.cpp
llama.cpp/ggml/src/ggml-sycl/conv.hpp
llama.cpp/ggml/src/ggml-sycl/convert.cpp
llama.cpp/ggml/src/ggml-sycl/convert.hpp
llama.cpp/ggml/src/ggml-sycl/count-equal.cpp
llama.cpp/ggml/src/ggml-sycl/count-equal.hpp
llama.cpp/ggml/src/ggml-sycl/cpy.cpp
llama.cpp/ggml/src/ggml-sycl/cpy.hpp
llama.cpp/ggml/src/ggml-sycl/cumsum.cpp
llama.cpp/ggml/src/ggml-sycl/cumsum.hpp
llama.cpp/ggml/src/ggml-sycl/dequantize.hpp
llama.cpp/ggml/src/ggml-sycl/diag.cpp
llama.cpp/ggml/src/ggml-sycl/diag.hpp
llama.cpp/ggml/src/ggml-sycl/dmmv.cpp
llama.cpp/ggml/src/ggml-sycl/dmmv.hpp
llama.cpp/ggml/src/ggml-sycl/element_wise.cpp
llama.cpp/ggml/src/ggml-sycl/element_wise.hpp
llama.cpp/ggml/src/ggml-sycl/fattn-buffers.cpp
llama.cpp/ggml/src/ggml-sycl/fattn-buffers.hpp
llama.cpp/ggml/src/ggml-sycl/fattn-common.hpp
llama.cpp/ggml/src/ggml-sycl/fattn-tile.cpp
llama.cpp/ggml/src/ggml-sycl/fattn-tile.hpp
llama.cpp/ggml/src/ggml-sycl/fattn-vec.hpp
llama.cpp/ggml/src/ggml-sycl/fattn.cpp
llama.cpp/ggml/src/ggml-sycl/fattn.hpp
llama.cpp/ggml/src/ggml-sycl/fill.cpp
llama.cpp/ggml/src/ggml-sycl/fill.hpp
llama.cpp/ggml/src/ggml-sycl/gated_delta_net.cpp
llama.cpp/ggml/src/ggml-sycl/gated_delta_net.hpp
llama.cpp/ggml/src/ggml-sycl/gemm.hpp
llama.cpp/ggml/src/ggml-sycl/getrows.cpp
llama.cpp/ggml/src/ggml-sycl/getrows.hpp
llama.cpp/ggml/src/ggml-sycl/ggml-sycl.cpp
llama.cpp/ggml/src/ggml-sycl/gla.cpp
llama.cpp/ggml/src/ggml-sycl/gla.hpp
llama.cpp/ggml/src/ggml-sycl/im2col.cpp
llama.cpp/ggml/src/ggml-sycl/im2col.hpp
llama.cpp/ggml/src/ggml-sycl/mmq.cpp
llama.cpp/ggml/src/ggml-sycl/mmq.hpp
llama.cpp/ggml/src/ggml-sycl/mmvq.cpp
llama.cpp/ggml/src/ggml-sycl/mmvq.hpp
llama.cpp/ggml/src/ggml-sycl/norm.cpp
llama.cpp/ggml/src/ggml-sycl/norm.hpp
llama.cpp/ggml/src/ggml-sycl/outprod.cpp
llama.cpp/ggml/src/ggml-sycl/outprod.hpp
llama.cpp/ggml/src/ggml-sycl/pad.cpp
llama.cpp/ggml/src/ggml-sycl/pad.hpp
llama.cpp/ggml/src/ggml-sycl/pad_reflect_1d.cpp
llama.cpp/ggml/src/ggml-sycl/pad_reflect_1d.hpp
llama.cpp/ggml/src/ggml-sycl/presets.hpp
llama.cpp/ggml/src/ggml-sycl/quantize.hpp
llama.cpp/ggml/src/ggml-sycl/quants.hpp
llama.cpp/ggml/src/ggml-sycl/repeat_back.cpp
llama.cpp/ggml/src/ggml-sycl/repeat_back.hpp
llama.cpp/ggml/src/ggml-sycl/roll.cpp
llama.cpp/ggml/src/ggml-sycl/roll.hpp
llama.cpp/ggml/src/ggml-sycl/rope.cpp
llama.cpp/ggml/src/ggml-sycl/rope.hpp
llama.cpp/ggml/src/ggml-sycl/set.cpp
llama.cpp/ggml/src/ggml-sycl/set.hpp
llama.cpp/ggml/src/ggml-sycl/set_rows.cpp
llama.cpp/ggml/src/ggml-sycl/set_rows.hpp
llama.cpp/ggml/src/ggml-sycl/softmax.cpp
llama.cpp/ggml/src/ggml-sycl/softmax.hpp
llama.cpp/ggml/src/ggml-sycl/solve_tri.cpp
llama.cpp/ggml/src/ggml-sycl/solve_tri.hpp
llama.cpp/ggml/src/ggml-sycl/ssm_conv.cpp
llama.cpp/ggml/src/ggml-sycl/ssm_conv.hpp
llama.cpp/ggml/src/ggml-sycl/ssm_scan.cpp
llama.cpp/ggml/src/ggml-sycl/ssm_scan.hpp
llama.cpp/ggml/src/ggml-sycl/sycl_hw.cpp
llama.cpp/ggml/src/ggml-sycl/sycl_hw.hpp
llama.cpp/ggml/src/ggml-sycl/tsembd.cpp
llama.cpp/ggml/src/ggml-sycl/tsembd.hpp
llama.cpp/ggml/src/ggml-sycl/type.hpp
llama.cpp/ggml/src/ggml-sycl/upscale.cpp
llama.cpp/ggml/src/ggml-sycl/upscale.hpp
llama.cpp/ggml/src/ggml-sycl/vecdotq.hpp
llama.cpp/ggml/src/ggml-sycl/wkv.cpp
llama.cpp/ggml/src/ggml-sycl/wkv.hpp
llama.cpp/ggml/src/ggml-sycl/dpct/helper.hpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq112-dv112.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq128-dv128.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq256-dv256.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq40-dv40.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq512-dv512.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq576-dv512.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq64-dv64.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq72-dv72.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq80-dv80.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-tile-instance-dkq96-dv96.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-f16.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q4_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q4_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q5_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q5_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-f16-q8_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-f16.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q4_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q4_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q5_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q5_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_0-q8_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-f16.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q4_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q4_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q5_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q5_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q4_1-q8_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-f16.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q4_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q4_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q5_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q5_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_0-q8_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-f16.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q4_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q4_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q5_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q5_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q5_1-q8_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-f16.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q4_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q4_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q5_0.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q5_1.cpp
llama.cpp/ggml/src/ggml-sycl/template-instances/fattn-vec-instance-q8_0-q8_0.cpp
llama.cpp/ggml/src/ggml-virtgpu/CMakeLists.txt
llama.cpp/ggml/src/ggml-virtgpu/apir_cs_ggml-rpc-front.cpp
llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-buffer-type.cpp
llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-buffer.cpp
llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-device.cpp
llama.cpp/ggml/src/ggml-virtgpu/ggml-backend-reg.cpp
llama.cpp/ggml/src/ggml-virtgpu/ggml-backend.cpp
llama.cpp/ggml/src/ggml-virtgpu/ggml-remoting.h
llama.cpp/ggml/src/ggml-virtgpu/virtgpu-apir.h
llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-backend.cpp
llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-buffer-type.cpp
llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-buffer.cpp
llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-device.cpp
llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward-impl.h
llama.cpp/ggml/src/ggml-virtgpu/virtgpu-forward.gen.h
llama.cpp/ggml/src/ggml-virtgpu/virtgpu-shm.cpp
llama.cpp/ggml/src/ggml-virtgpu/virtgpu-shm.h
llama.cpp/ggml/src/ggml-virtgpu/virtgpu-utils.cpp
llama.cpp/ggml/src/ggml-virtgpu/virtgpu-utils.h
llama.cpp/ggml/src/ggml-virtgpu/virtgpu.cpp
llama.cpp/ggml/src/ggml-virtgpu/virtgpu.h
llama.cpp/ggml/src/ggml-virtgpu/backend/CMakeLists.txt
llama.cpp/ggml/src/ggml-virtgpu/backend/apir_cs_ggml-rpc-back.cpp
llama.cpp/ggml/src/ggml-virtgpu/backend/backend-convert.h
llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-backend.cpp
llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer-type.cpp
llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-buffer.cpp
llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched-device.cpp
llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.cpp
llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.gen.h
llama.cpp/ggml/src/ggml-virtgpu/backend/backend-dispatched.h
llama.cpp/ggml/src/ggml-virtgpu/backend/backend-virgl-apir.h
llama.cpp/ggml/src/ggml-virtgpu/backend/backend.cpp
llama.cpp/ggml/src/ggml-virtgpu/backend/shared/api_remoting.h
llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_backend.gen.h
llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_backend.h
llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs.h
llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs_ggml.h
llama.cpp/ggml/src/ggml-virtgpu/backend/shared/apir_cs_rpc.h
llama.cpp/ggml/src/ggml-virtgpu/include/apir_hw.h
llama.cpp/ggml/src/ggml-vulkan/CMakeLists.txt
llama.cpp/ggml/src/ggml-vulkan/ggml-vulkan.cpp
llama.cpp/ggml/src/ggml-vulkan/cmake/host-toolchain.cmake.in
llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/CMakeLists.txt
llama.cpp/ggml/src/ggml-vulkan/vulkan-shaders/vulkan-shaders-gen.cpp
llama.cpp/ggml/src/ggml-webgpu/CMakeLists.txt
llama.cpp/ggml/src/ggml-webgpu/ggml-webgpu-shader-lib.hpp
llama.cpp/ggml/src/ggml-webgpu/ggml-webgpu.cpp
llama.cpp/ggml/src/ggml-webgpu/pre_wgsl.hpp
llama.cpp/ggml/src/ggml-zdnn/CMakeLists.txt
llama.cpp/ggml/src/ggml-zdnn/common.hpp
llama.cpp/ggml/src/ggml-zdnn/ggml-zdnn.cpp
llama.cpp/ggml/src/ggml-zdnn/mmf.cpp
llama.cpp/ggml/src/ggml-zdnn/mmf.hpp
llama.cpp/ggml/src/ggml-zdnn/utils.cpp
llama.cpp/ggml/src/ggml-zdnn/utils.hpp
llama.cpp/ggml/src/ggml-zendnn/CMakeLists.txt
llama.cpp/ggml/src/ggml-zendnn/ggml-zendnn.cpp
llama.cpp/include/llama-cpp.h
llama.cpp/include/llama.h
llama.cpp/pocs/CMakeLists.txt
llama.cpp/pocs/vdot/CMakeLists.txt
llama.cpp/pocs/vdot/q8dot.cpp
llama.cpp/pocs/vdot/vdot.cpp
llama.cpp/requirements/requirements-all.txt
llama.cpp/requirements/requirements-compare-llama-bench.txt
llama.cpp/requirements/requirements-convert_hf_to_gguf.txt
llama.cpp/requirements/requirements-convert_hf_to_gguf_update.txt
llama.cpp/requirements/requirements-convert_legacy_llama.txt
llama.cpp/requirements/requirements-convert_llama_ggml_to_gguf.txt
llama.cpp/requirements/requirements-convert_lora_to_gguf.txt
llama.cpp/requirements/requirements-gguf_editor_gui.txt
llama.cpp/requirements/requirements-pydantic.txt
llama.cpp/requirements/requirements-server-bench.txt
llama.cpp/requirements/requirements-test-tokenizer-random.txt
llama.cpp/requirements/requirements-tool_bench.txt
llama.cpp/scripts/xxd.cmake
llama.cpp/scripts/jinja/requirements.txt
llama.cpp/scripts/snapdragon/qdc/requirements.txt
llama.cpp/src/CMakeLists.txt
llama.cpp/src/llama-adapter.cpp
llama.cpp/src/llama-adapter.h
llama.cpp/src/llama-arch.cpp
llama.cpp/src/llama-arch.h
llama.cpp/src/llama-batch.cpp
llama.cpp/src/llama-batch.h
llama.cpp/src/llama-chat.cpp
llama.cpp/src/llama-chat.h
llama.cpp/src/llama-context.cpp
llama.cpp/src/llama-context.h
llama.cpp/src/llama-cparams.cpp
llama.cpp/src/llama-cparams.h
llama.cpp/src/llama-ext.h
llama.cpp/src/llama-grammar.cpp
llama.cpp/src/llama-grammar.h
llama.cpp/src/llama-graph.cpp
llama.cpp/src/llama-graph.h
llama.cpp/src/llama-hparams.cpp
llama.cpp/src/llama-hparams.h
llama.cpp/src/llama-impl.cpp
llama.cpp/src/llama-impl.h
llama.cpp/src/llama-io.cpp
llama.cpp/src/llama-io.h
llama.cpp/src/llama-kv-cache-iswa.cpp
llama.cpp/src/llama-kv-cache-iswa.h
llama.cpp/src/llama-kv-cache.cpp
llama.cpp/src/llama-kv-cache.h
llama.cpp/src/llama-kv-cells.h
llama.cpp/src/llama-memory-hybrid-iswa.cpp
llama.cpp/src/llama-memory-hybrid-iswa.h
llama.cpp/src/llama-memory-hybrid.cpp
llama.cpp/src/llama-memory-hybrid.h
llama.cpp/src/llama-memory-recurrent.cpp
llama.cpp/src/llama-memory-recurrent.h
llama.cpp/src/llama-memory.cpp
llama.cpp/src/llama-memory.h
llama.cpp/src/llama-mmap.cpp
llama.cpp/src/llama-mmap.h
llama.cpp/src/llama-model-loader.cpp
llama.cpp/src/llama-model-loader.h
llama.cpp/src/llama-model-saver.cpp
llama.cpp/src/llama-model-saver.h
llama.cpp/src/llama-model.cpp
llama.cpp/src/llama-model.h
llama.cpp/src/llama-quant.cpp
llama.cpp/src/llama-quant.h
llama.cpp/src/llama-sampler.cpp
llama.cpp/src/llama-sampler.h
llama.cpp/src/llama-vocab.cpp
llama.cpp/src/llama-vocab.h
llama.cpp/src/llama.cpp
llama.cpp/src/unicode-data.cpp
llama.cpp/src/unicode-data.h
llama.cpp/src/unicode.cpp
llama.cpp/src/unicode.h
llama.cpp/src/models/afmoe.cpp
llama.cpp/src/models/apertus.cpp
llama.cpp/src/models/arcee.cpp
llama.cpp/src/models/arctic.cpp
llama.cpp/src/models/arwkv7.cpp
llama.cpp/src/models/baichuan.cpp
llama.cpp/src/models/bailingmoe.cpp
llama.cpp/src/models/bailingmoe2.cpp
llama.cpp/src/models/bert.cpp
llama.cpp/src/models/bitnet.cpp
llama.cpp/src/models/bloom.cpp
llama.cpp/src/models/chameleon.cpp
llama.cpp/src/models/chatglm.cpp
llama.cpp/src/models/codeshell.cpp
llama.cpp/src/models/cogvlm.cpp
llama.cpp/src/models/cohere2.cpp
llama.cpp/src/models/command-r.cpp
llama.cpp/src/models/dbrx.cpp
llama.cpp/src/models/deci.cpp
llama.cpp/src/models/deepseek.cpp
llama.cpp/src/models/deepseek2.cpp
llama.cpp/src/models/deepseek2ocr.cpp
llama.cpp/src/models/delta-net-base.cpp
llama.cpp/src/models/dots1.cpp
llama.cpp/src/models/dream.cpp
llama.cpp/src/models/ernie4-5-moe.cpp
llama.cpp/src/models/ernie4-5.cpp
llama.cpp/src/models/eurobert.cpp
llama.cpp/src/models/exaone-moe.cpp
llama.cpp/src/models/exaone.cpp
llama.cpp/src/models/exaone4.cpp
llama.cpp/src/models/falcon-h1.cpp
llama.cpp/src/models/falcon.cpp
llama.cpp/src/models/gemma-embedding.cpp
llama.cpp/src/models/gemma.cpp
llama.cpp/src/models/gemma2.cpp
llama.cpp/src/models/gemma3.cpp
llama.cpp/src/models/gemma3n.cpp
llama.cpp/src/models/gemma4.cpp
llama.cpp/src/models/glm-dsa.cpp
llama.cpp/src/models/glm4-moe.cpp
llama.cpp/src/models/glm4.cpp
llama.cpp/src/models/gpt2.cpp
llama.cpp/src/models/gptneox.cpp
llama.cpp/src/models/granite-hybrid.cpp
llama.cpp/src/models/granite-moe.cpp
llama.cpp/src/models/granite.cpp
llama.cpp/src/models/grok.cpp
llama.cpp/src/models/grovemoe.cpp
llama.cpp/src/models/hunyuan-dense.cpp
llama.cpp/src/models/hunyuan-moe.cpp
llama.cpp/src/models/hunyuan-vl.cpp
llama.cpp/src/models/internlm2.cpp
llama.cpp/src/models/jais.cpp
llama.cpp/src/models/jais2.cpp
llama.cpp/src/models/jamba.cpp
llama.cpp/src/models/jina-bert-v2.cpp
llama.cpp/src/models/jina-bert-v3.cpp
llama.cpp/src/models/kimi-linear.cpp
llama.cpp/src/models/lfm2.cpp
llama.cpp/src/models/lfm2moe.cpp
llama.cpp/src/models/llada-moe.cpp
llama.cpp/src/models/llada.cpp
llama.cpp/src/models/llama-embed.cpp
llama.cpp/src/models/llama.cpp
llama.cpp/src/models/llama4.cpp
llama.cpp/src/models/maincoder.cpp
llama.cpp/src/models/mamba-base.cpp
llama.cpp/src/models/mamba.cpp
llama.cpp/src/models/mamba2.cpp
llama.cpp/src/models/mimo2.cpp
llama.cpp/src/models/minicpm.cpp
llama.cpp/src/models/minicpm3.cpp
llama.cpp/src/models/minimax-m2.cpp
llama.cpp/src/models/mistral3.cpp
llama.cpp/src/models/mistral4.cpp
llama.cpp/src/models/models.h
llama.cpp/src/models/modern-bert.cpp
llama.cpp/src/models/mpt.cpp
llama.cpp/src/models/nemotron-h-moe.cpp
llama.cpp/src/models/nemotron-h.cpp
llama.cpp/src/models/nemotron.cpp
llama.cpp/src/models/neo-bert.cpp
llama.cpp/src/models/nomic-bert-moe.cpp
llama.cpp/src/models/nomic-bert.cpp
llama.cpp/src/models/olmo.cpp
llama.cpp/src/models/olmo2.cpp
llama.cpp/src/models/olmoe.cpp
llama.cpp/src/models/openai-moe.cpp
llama.cpp/src/models/openelm.cpp
llama.cpp/src/models/orion.cpp
llama.cpp/src/models/paddleocr.cpp
llama.cpp/src/models/pangu-embed.cpp
llama.cpp/src/models/phi2.cpp
llama.cpp/src/models/phi3.cpp
llama.cpp/src/models/phimoe.cpp
llama.cpp/src/models/plamo.cpp
llama.cpp/src/models/plamo2.cpp
llama.cpp/src/models/plamo3.cpp
llama.cpp/src/models/plm.cpp
llama.cpp/src/models/qwen.cpp
llama.cpp/src/models/qwen2.cpp
llama.cpp/src/models/qwen2moe.cpp
llama.cpp/src/models/qwen2vl.cpp
llama.cpp/src/models/qwen3.cpp
llama.cpp/src/models/qwen35.cpp
llama.cpp/src/models/qwen35moe.cpp
llama.cpp/src/models/qwen3moe.cpp
llama.cpp/src/models/qwen3next.cpp
llama.cpp/src/models/qwen3vl.cpp
llama.cpp/src/models/qwen3vlmoe.cpp
llama.cpp/src/models/refact.cpp
llama.cpp/src/models/rnd1.cpp
llama.cpp/src/models/rwkv6-base.cpp
llama.cpp/src/models/rwkv6.cpp
llama.cpp/src/models/rwkv6qwen2.cpp
llama.cpp/src/models/rwkv7-base.cpp
llama.cpp/src/models/rwkv7.cpp
llama.cpp/src/models/seed-oss.cpp
llama.cpp/src/models/smallthinker.cpp
llama.cpp/src/models/smollm3.cpp
llama.cpp/src/models/stablelm.cpp
llama.cpp/src/models/starcoder.cpp
llama.cpp/src/models/starcoder2.cpp
llama.cpp/src/models/step35.cpp
llama.cpp/src/models/t5.cpp
llama.cpp/src/models/t5encoder.cpp
llama.cpp/src/models/wavtokenizer-dec.cpp
llama.cpp/src/models/xverse.cpp
llama.cpp/tests/CMakeLists.txt
llama.cpp/tests/export-graph-ops.cpp
llama.cpp/tests/get-model.cpp
llama.cpp/tests/get-model.h
llama.cpp/tests/gguf-model-data.cpp
llama.cpp/tests/gguf-model-data.h
llama.cpp/tests/test-alloc.cpp
llama.cpp/tests/test-arg-parser.cpp
llama.cpp/tests/test-autorelease.cpp
llama.cpp/tests/test-backend-ops.cpp
llama.cpp/tests/test-backend-sampler.cpp
llama.cpp/tests/test-barrier.cpp
llama.cpp/tests/test-c.c
llama.cpp/tests/test-chat-auto-parser.cpp
llama.cpp/tests/test-chat-peg-parser.cpp
llama.cpp/tests/test-chat-template.cpp
llama.cpp/tests/test-chat.cpp
llama.cpp/tests/test-double-float.cpp
llama.cpp/tests/test-gbnf-validator.cpp
llama.cpp/tests/test-gguf-model-data.cpp
llama.cpp/tests/test-gguf.cpp
llama.cpp/tests/test-grammar-integration.cpp
llama.cpp/tests/test-grammar-llguidance.cpp
llama.cpp/tests/test-grammar-parser.cpp
llama.cpp/tests/test-jinja.cpp
llama.cpp/tests/test-json-partial.cpp
llama.cpp/tests/test-json-schema-to-grammar.cpp
llama.cpp/tests/test-llama-archs.cpp
llama.cpp/tests/test-llama-grammar.cpp
llama.cpp/tests/test-log.cpp
llama.cpp/tests/test-model-load-cancel.cpp
llama.cpp/tests/test-mtmd-c-api.c
llama.cpp/tests/test-opt.cpp
llama.cpp/tests/test-peg-parser.cpp
llama.cpp/tests/test-quant-type-selection.cpp
llama.cpp/tests/test-quantize-fns.cpp
llama.cpp/tests/test-quantize-perf.cpp
llama.cpp/tests/test-quantize-stats.cpp
llama.cpp/tests/test-reasoning-budget.cpp
llama.cpp/tests/test-regex-partial.cpp
llama.cpp/tests/test-rope.cpp
llama.cpp/tests/test-sampling.cpp
llama.cpp/tests/test-state-restore-fragmented.cpp
llama.cpp/tests/test-thread-safety.cpp
llama.cpp/tests/test-tokenizer-0.cpp
llama.cpp/tests/test-tokenizer-1-bpe.cpp
llama.cpp/tests/test-tokenizer-1-spm.cpp
llama.cpp/tests/testing.h
llama.cpp/tests/peg-parser/simple-tokenize.cpp
llama.cpp/tests/peg-parser/simple-tokenize.h
llama.cpp/tests/peg-parser/test-basic.cpp
llama.cpp/tests/peg-parser/test-gbnf-generation.cpp
llama.cpp/tests/peg-parser/test-json-parser.cpp
llama.cpp/tests/peg-parser/test-json-serialization.cpp
llama.cpp/tests/peg-parser/test-python-dict-parser.cpp
llama.cpp/tests/peg-parser/test-unicode.cpp
llama.cpp/tests/peg-parser/tests.h
llama.cpp/tools/CMakeLists.txt
llama.cpp/tools/batched-bench/CMakeLists.txt
llama.cpp/tools/batched-bench/batched-bench.cpp
llama.cpp/tools/cli/CMakeLists.txt
llama.cpp/tools/cli/cli.cpp
llama.cpp/tools/completion/CMakeLists.txt
llama.cpp/tools/completion/completion.cpp
llama.cpp/tools/cvector-generator/CMakeLists.txt
llama.cpp/tools/cvector-generator/completions.txt
llama.cpp/tools/cvector-generator/cvector-generator.cpp
llama.cpp/tools/cvector-generator/mean.hpp
llama.cpp/tools/cvector-generator/negative.txt
llama.cpp/tools/cvector-generator/pca.hpp
llama.cpp/tools/cvector-generator/positive.txt
llama.cpp/tools/export-lora/CMakeLists.txt
llama.cpp/tools/export-lora/export-lora.cpp
llama.cpp/tools/fit-params/CMakeLists.txt
llama.cpp/tools/fit-params/fit-params.cpp
llama.cpp/tools/gguf-split/CMakeLists.txt
llama.cpp/tools/gguf-split/gguf-split.cpp
llama.cpp/tools/imatrix/CMakeLists.txt
llama.cpp/tools/imatrix/imatrix.cpp
llama.cpp/tools/llama-bench/CMakeLists.txt
llama.cpp/tools/llama-bench/llama-bench.cpp
llama.cpp/tools/mtmd/CMakeLists.txt
llama.cpp/tools/mtmd/clip-graph.h
llama.cpp/tools/mtmd/clip-impl.h
llama.cpp/tools/mtmd/clip-model.h
llama.cpp/tools/mtmd/clip.cpp
llama.cpp/tools/mtmd/clip.h
llama.cpp/tools/mtmd/deprecation-warning.cpp
llama.cpp/tools/mtmd/mtmd-audio.cpp
llama.cpp/tools/mtmd/mtmd-audio.h
llama.cpp/tools/mtmd/mtmd-cli.cpp
llama.cpp/tools/mtmd/mtmd-helper.cpp
llama.cpp/tools/mtmd/mtmd-helper.h
llama.cpp/tools/mtmd/mtmd-image.cpp
llama.cpp/tools/mtmd/mtmd-image.h
llama.cpp/tools/mtmd/mtmd.cpp
llama.cpp/tools/mtmd/mtmd.h
llama.cpp/tools/mtmd/requirements.txt
llama.cpp/tools/mtmd/debug/mtmd-debug.cpp
llama.cpp/tools/mtmd/debug/mtmd-debug.h
llama.cpp/tools/mtmd/models/cogvlm.cpp
llama.cpp/tools/mtmd/models/conformer.cpp
llama.cpp/tools/mtmd/models/deepseekocr.cpp
llama.cpp/tools/mtmd/models/dotsocr.cpp
llama.cpp/tools/mtmd/models/gemma4a.cpp
llama.cpp/tools/mtmd/models/gemma4v.cpp
llama.cpp/tools/mtmd/models/glm4v.cpp
llama.cpp/tools/mtmd/models/granite-speech.cpp
llama.cpp/tools/mtmd/models/hunyuanocr.cpp
llama.cpp/tools/mtmd/models/internvl.cpp
llama.cpp/tools/mtmd/models/kimik25.cpp
llama.cpp/tools/mtmd/models/kimivl.cpp
llama.cpp/tools/mtmd/models/llama4.cpp
llama.cpp/tools/mtmd/models/llava.cpp
llama.cpp/tools/mtmd/models/minicpmv.cpp
llama.cpp/tools/mtmd/models/mobilenetv5.cpp
llama.cpp/tools/mtmd/models/models.h
llama.cpp/tools/mtmd/models/nemotron-v2-vl.cpp
llama.cpp/tools/mtmd/models/paddleocr.cpp
llama.cpp/tools/mtmd/models/pixtral.cpp
llama.cpp/tools/mtmd/models/qwen2vl.cpp
llama.cpp/tools/mtmd/models/qwen3a.cpp
llama.cpp/tools/mtmd/models/qwen3vl.cpp
llama.cpp/tools/mtmd/models/siglip.cpp
llama.cpp/tools/mtmd/models/step3vl.cpp
llama.cpp/tools/mtmd/models/whisper-enc.cpp
llama.cpp/tools/mtmd/models/yasa2.cpp
llama.cpp/tools/mtmd/models/youtuvl.cpp
llama.cpp/tools/mtmd/tests/test-1-extracted.txt
llama.cpp/tools/mtmd/tests/tests-requirements.txt
llama.cpp/tools/parser/CMakeLists.txt
llama.cpp/tools/parser/debug-template-parser.cpp
llama.cpp/tools/parser/template-analysis.cpp
llama.cpp/tools/perplexity/CMakeLists.txt
llama.cpp/tools/perplexity/perplexity.cpp
llama.cpp/tools/quantize/CMakeLists.txt
llama.cpp/tools/quantize/quantize.cpp
llama.cpp/tools/results/CMakeLists.txt
llama.cpp/tools/results/results.cpp
llama.cpp/tools/rpc/CMakeLists.txt
llama.cpp/tools/rpc/rpc-server.cpp
llama.cpp/tools/server/CMakeLists.txt
llama.cpp/tools/server/server-chat.cpp
llama.cpp/tools/server/server-chat.h
llama.cpp/tools/server/server-common.cpp
llama.cpp/tools/server/server-common.h
llama.cpp/tools/server/server-context.cpp
llama.cpp/tools/server/server-context.h
llama.cpp/tools/server/server-cors-proxy.h
llama.cpp/tools/server/server-http.cpp
llama.cpp/tools/server/server-http.h
llama.cpp/tools/server/server-models.cpp
llama.cpp/tools/server/server-models.h
llama.cpp/tools/server/server-queue.cpp
llama.cpp/tools/server/server-queue.h
llama.cpp/tools/server/server-task.cpp
llama.cpp/tools/server/server-task.h
llama.cpp/tools/server/server-tools.cpp
llama.cpp/tools/server/server-tools.h
llama.cpp/tools/server/server.cpp
llama.cpp/tools/server/bench/requirements.txt
llama.cpp/tools/server/tests/requirements.txt
llama.cpp/tools/tokenize/CMakeLists.txt
llama.cpp/tools/tokenize/tokenize.cpp
llama.cpp/tools/tts/CMakeLists.txt
llama.cpp/tools/tts/tts.cpp
llama.cpp/vendor/cpp-httplib/CMakeLists.txt
llama.cpp/vendor/cpp-httplib/httplib.cpp
llama.cpp/vendor/cpp-httplib/httplib.h
llama.cpp/vendor/miniaudio/miniaudio.h
llama.cpp/vendor/nlohmann/json.hpp
llama.cpp/vendor/nlohmann/json_fwd.hpp
llama.cpp/vendor/sheredom/subprocess.h
llama.cpp/vendor/stb/stb_image.h
src/llama_cpp_bin/__init__.py
src/llama_cpp_bin/_version.py
src/llama_cpp_bin/cli.py
src/llama_cpp_bin/core.py
src/llama_cpp_bin.egg-info/PKG-INFO
src/llama_cpp_bin.egg-info/SOURCES.txt
src/llama_cpp_bin.egg-info/dependency_links.txt
src/llama_cpp_bin.egg-info/entry_points.txt
src/llama_cpp_bin.egg-info/requires.txt
src/llama_cpp_bin.egg-info/top_level.txt
src/llama_cpp_bin/bin/.gitkeep