Chatbot 100% Local avec Outils ComfyUI
Cette interface vous permet de discuter avec un modèle IA entièrement local (Ollama) qui peut utiliser les outils de votre serveur MCP ComfyUI. Tout fonctionne sur votre machine, aucune connexion Internet requise après l'installation.
Avantages : Gratuit, privé, rapide, fonctionne hors ligne
Inconvénients : Nécessite un GPU/CPU puissant pour les gros modèles
| Composant | Version Minimale | Recommandation |
|---|---|---|
| Python | 3.8+ | 3.10 Ă 3.12 |
| RAM | 8 GB | 16 GB ou plus |
| GPU | Optionnel | NVIDIA avec 6GB+ VRAM |
| Espace Disque | 10 GB | 20 GB (pour plusieurs modèles) |
# Télécharger et installer depuis le site officiel https://ollama.com/download/windows # Ou via winget winget install Ollama.Ollama
# Télécharger et installer depuis le site officiel https://ollama.com/download/mac # Ou via Homebrew brew install ollama
# Installation automatique curl -fsSL https://ollama.com/install.sh | sh # Démarrer le service sudo systemctl start ollama sudo systemctl enable ollama
ollama --versionVous devriez voir la version d'Ollama s'afficher.
Choisissez un modèle selon votre matériel (exemples) :
| Modèle | Taille | RAM Requise | Function Calling |
|---|---|---|---|
qwen2.5:3b |
2 GB | 4 GB | âś… Oui |
qwen2.5:7b |
4.7 GB | 8 GB | ✅ Oui (Recommandé) |
qwen2.5:14b |
9 GB | 16 GB | âś… Excellent |
llama3.2:3b |
2 GB | 4 GB | âś… Oui |
mistral:7b |
4.1 GB | 8 GB | âś… Oui |
granite3.1-dense:8b |
4.9 GB | 8 GB | âś… Excellent |
# Dans un terminal ollama pull qwen2.5:7b # Attendre le téléchargement (peut prendre plusieurs minutes) # Tester le modèle ollama run qwen2.5:7b "Bonjour, peux-tu te présenter ?"
# Cloner le projet git clone https://github.com/orion4d/ComfyUI_mcp.git cd ComfyUI_mcp # Créer l'environnement virtuel python -m venv venv # Activer l'environnement # Windows : venv\Scripts\activate # macOS/Linux : source venv/bin/activate # Installer les dépendances pip install -r requirements.txt # Générer les clés de sécurité python generate_key.py
# Aller dans le dossier de l'interface cd clients/gradio_ollama # Installer les dépendances spécifiques pip install -r requirements.txt
# Dans un terminal (Ă la racine du projet) cd ComfyUI_mcp python server.py # Vous devriez voir : # INFO: Uvicorn running on http://127.0.0.1:8000
# Dans un autre terminal ollama serve # Si Ollama est déjà actif, vous verrez : # Error: listen tcp 127.0.0.1:11434: bind: address already in use # (C'est normal et bon signe !)
# Dans un troisième terminal cd ComfyUI_mcp/clients/gradio_ollama python app.py # L'interface démarre sur : # Running on local URL: http://127.0.0.1:7860
Ouvrez votre navigateur et allez sur : http://127.0.0.1:7860
Vous devriez voir l'interface de chat avec la liste des outils MCP disponibles sur le côté.
Dans le panneau de droite, vous pouvez :
Pour utiliser un autre modèle Ollama, éditez le fichier app.py :
# Ligne 11 dans app.py OLLAMA_MODEL = "qwen2.5:7b" # Remplacez par votre modèle # Exemples : OLLAMA_MODEL = "qwen2.5:14b" OLLAMA_MODEL = "llama3.2:3b" OLLAMA_MODEL = "mistral:7b"
# Dans app.py, Ă la fin du fichier :
demo.launch(
server_name="127.0.0.1",
server_port=7860, # Changez le port ici
share=False
)
# Ligne 10 dans app.py MCP_SERVER_URL = "http://127.0.0.1:8000" # Si votre serveur MCP est sur un autre port : MCP_SERVER_URL = "http://127.0.0.1:8080"
# Dans app.py
demo.launch(
server_name="127.0.0.1",
server_port=7860,
share=True # ⚠️ Génère une URL publique temporaire
)
Ne faites ceci que si vous comprenez les implications de sécurité !
# Ollama détecte automatiquement votre GPU NVIDIA # Vérifier que CUDA est utilisé : ollama run qwen2.5:7b # Dans les logs, vous devriez voir : # [CUDA] GPU detected
Problème : Ollama n'est pas démarré
Solution :
# Démarrer Ollama ollama serve # Ou sur Linux : sudo systemctl start ollama
Problème : Le serveur MCP n'est pas accessible
Solution :
python server.py)curl http://127.0.0.1:8000/debug/healthProblème : Modèle trop lourd pour votre machine
Solution : Essayez un modèle plus léger
# Supprimer le modèle lourd ollama rm qwen2.5:14b # Télécharger un modèle plus léger ollama pull qwen2.5:3b # Modifier app.py OLLAMA_MODEL = "qwen2.5:3b"
Problème : Le modèle ne supporte pas bien le function calling
Solution :
qwen2.5:7b, qwen2.5:14b, ou granite3.1-dense:8b