# ==============================================================================
# DENES-EMBEDDER - Variables de Entorno
# ==============================================================================
# Copiar este archivo a .env y configurar los valores

# ==============================================================================
# SERVIDOR
# ==============================================================================
API_HOST=0.0.0.0
API_PORT=8001
LOG_LEVEL=INFO

# ==============================================================================
# GPU CONFIGURATION
# ==============================================================================
# El servidor tiene 2 GPUs - seleccionar cual usar (0 o 1)
# Esto configura CUDA_VISIBLE_DEVICES internamente
CUDA_DEVICE=0

# ==============================================================================
# SEGURIDAD
# ==============================================================================
# API key requerida para autenticacion (header X-API-Key)
API_KEY=embedder_9f3c7a1d8e4b2c6f0a5d9e7b1c4f8a2d6e3b7a5c0f9d8e1b4a6c2


# ==============================================================================
# HUGGINGFACE
# ==============================================================================
# Opcional: Para modelos privados o descargas con rate limit
# Obtener en: https://huggingface.co/settings/tokens
HUGGINGFACE_TOKEN=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

# ==============================================================================
# MODELO BGE-M3
# ==============================================================================
# ID del modelo en HuggingFace (se descarga automaticamente)
BGE_M3_MODEL_ID=BAAI/bge-m3

# Directorio local para cache del modelo descargado
MODEL_CACHE_DIR=./models

# ==============================================================================
# CONFIGURACION DE EMBEDDINGS
# ==============================================================================
# Tamano de batch para procesamiento (32 recomendado para RTX-A4000)
EMBED_BATCH_SIZE=32

# Longitud maxima de tokens (BGE-M3 soporta hasta 8192)
EMBED_MAX_LENGTH=8192

# Usar float16 para optimizacion en GPU (true/false)
EMBED_USE_FP16=true

# Normalizar embeddings L2 para similitud coseno (true/false)
EMBED_NORMALIZE=true

# Estrategia de pooling: "mean" (mas estable para RAG) o "cls"
EMBED_POOLING=mean
