đŸ€– Interface Gradio + Google Gemini

Chatbot Cloud avec Outils ComfyUI MCP

🆓 API Gratuite ☁ Cloud ⚡ TrĂšs Rapide 🎯 DĂ©butant

â„čQu'est-ce que cette mĂ©thode ?

Cette interface utilise Google Gemini (IA cloud de Google) avec support MCP natif pour contrĂŽler votre serveur ComfyUI local. Gemini appelle automatiquement les outils MCP sans code complexe.

Avantages : API gratuite (1500 req/jour), multimodal, automatic function calling, trĂšs performant

Inconvénients : Nécessite connexion Internet, API key Google requise

📋 PrĂ©requis

🔑 Obtenir une ClĂ© API Google Gemini (GRATUIT)

Étape 1 : CrĂ©er une ClĂ© API
  1. Allez sur Google AI Studio
  2. Connectez-vous avec votre compte Google
  3. Cliquez sur "Get API Key" dans le menu de gauche
  4. Cliquez sur "Create API Key"
  5. Sélectionnez votre projet Google Cloud (ou créez-en un)
  6. Copiez la clé générée (format : AIzaSy...)

🎉API Gratuite !

Le tier gratuit de Google Gemini offre :

  • ✅ 1500 requĂȘtes par jour
  • ✅ 15 requĂȘtes par minute
  • ✅ AccĂšs aux modĂšles Gemini 2.5 Flash et Pro
  • ✅ Support multimodal (texte, images, audio)
  • ✅ Function calling illimitĂ©
Étape 2 : Configurer la ClĂ© API

Sur Linux / macOS

# Ajouter Ă  ~/.bashrc ou ~/.zshrc
export GEMINI_API_KEY="AIzaSy...votre-clé"

# Recharger la configuration
source ~/.bashrc  # ou ~/.zshrc

Sur Windows (PowerShell)

# Temporaire (session actuelle uniquement)
$env:GEMINI_API_KEY="AIzaSy...votre-clé"

# Permanent (systĂšme)
[System.Environment]::SetEnvironmentVariable('GEMINI_API_KEY', 'AIzaSy...votre-clé', 'User')

Via fichier .env (Recommandé)

# Dans le dossier clients/gradio_google/
# Créer un fichier .env

GEMINI_API_KEY=AIzaSy...votre-clé
⚠ SĂ©curitĂ© : Ne jamais commiter votre clĂ© API dans Git !
# Ajouter dans .gitignore
.env
*.key

🚀 Installation

Étape 1 : Installer le Serveur MCP
# Cloner le projet
git clone https://github.com/orion4d/ComfyUI_mcp.git
cd ComfyUI_mcp

# Créer l'environnement virtuel
python -m venv venv

# Activer l'environnement
# Windows :
venv\Scripts\activate
# macOS/Linux :
source venv/bin/activate

# Installer les dépendances
pip install -r requirements.txt

# Générer les clés de sécurité
python generate_key.py
Étape 2 : Installer l'Interface Gradio Google
# Aller dans le dossier de l'interface
cd clients/gradio_google

# Installer les dépendances spécifiques
pip install -r requirements.txt
✅ Packages installĂ©s :
  • gradio
  • google-genai (SDK officiel Gemini)
  • fastmcp (client MCP)
  • python-dotenv (pour .env)
Étape 3 : Configurer la ClĂ© API
# Créer le fichier .env dans clients/gradio_google/
GEMINI_API_KEY=votre-clé-ici

▶ DĂ©marrage

Étape 1 : DĂ©marrer le Serveur MCP
# Dans un terminal (Ă  la racine du projet)
cd ComfyUI_mcp
python server.py

# Vous devriez voir :
# INFO:     Uvicorn running on http://127.0.0.1:8000
Étape 2 : Lancer l'Interface Gradio Google
# Dans un autre terminal
cd ComfyUI_mcp/clients/gradio_google
python app.py

# L'interface démarre sur :
# Running on local URL:  http://127.0.0.1:7860

✅Interface PrĂȘte !

Ouvrez votre navigateur : http://127.0.0.1:7860

L'interface se connecte automatiquement Ă  Gemini et Ă  votre serveur MCP.

💬 Utilisation

Fonctionnalités Uniques de Gemini

đŸ€– Automatic Function Calling

Gemini décide automatiquement quand utiliser les outils MCP. Pas besoin de dire "utilise l'outil X".

Vous : "Montre-moi mes workflows"
Gemini : [Appelle automatiquement list_workflows] "Voici vos workflows..."

🧠 Thinking Mode

Gemini 2.5 "réfléchit" avant d'agir, améliorant la précision des appels d'outils.

🔄 Compositional Calling

Gemini peut enchaĂźner plusieurs outils automatiquement.

Vous : "Crée un node qui traite les images puis queue un prompt avec"
Gemini : 
  1. [Appelle create_custom_node_template]
  2. [Appelle write_custom_node]
  3. [Appelle queue_prompt]

Exemples de Questions

Mode Multimodal

Gemini peut analyser des images ! (fonctionnalité à implémenter dans l'interface)

Vous : [Upload une image] "Crée un workflow ComfyUI pour reproduire ce style"
Gemini : [Analyse l'image] [Utilise les outils MCP] "J'ai créé le workflow..."

⚙ Configuration AvancĂ©e

Changer de ModĂšle Gemini

# Dans app.py (ligne ~14)
GEMINI_MODEL = "gemini-2.5-flash"  # Défaut (rapide, gratuit)

# Alternatives :
GEMINI_MODEL = "gemini-2.5-pro"    # Plus puissant, moins rapide
GEMINI_MODEL = "gemini-2.0-flash"  # Ancienne version
ModÚle Vitesse Qualité Quota Gratuit
gemini-2.5-flash ⚡⚡⚡⚡⚡ ⭐⭐⭐⭐ 1500/jour (RecommandĂ©)
gemini-2.5-pro ⚡⚡⚡ ⭐⭐⭐⭐⭐ 50/jour
gemini-2.0-flash ⚡⚡⚡⚡ ⭐⭐⭐ 1500/jour

ContrĂŽler l'Utilisation des Outils

# Dans app.py, ajouter dans la config :
config = types.GenerateContentConfig(
    temperature=0.7,
    tools=[mcp_client.session],
    tool_config=types.ToolConfig(
        function_calling_config=types.FunctionCallingConfig(
            mode="AUTO"  # "AUTO", "ANY", ou "NONE"
        )
    )
)

Limiter les Outils Disponibles

# Autoriser uniquement certains outils
tool_config=types.ToolConfig(
    function_calling_config=types.FunctionCallingConfig(
        mode="AUTO",
        allowed_function_names=[
            "list_workflows",
            "queue_prompt",
            "get_history"
        ]
    )
)

❓ DĂ©pannage

❌ Erreur : "Invalid API Key"

ProblÚme : Clé API incorrecte ou non configurée

Solutions :

  1. Vérifier que la clé dans .env est correcte (format : AIzaSy...)
  2. Tester la clé manuellement :
    curl "https://generativelanguage.googleapis.com/v1beta/models?key=VOTRE_CLE"
  3. Régénérer une nouvelle clé sur AI Studio

❌ Erreur : "Quota exceeded"

ProblĂšme : Limite de 1500 requĂȘtes/jour atteinte

Solutions :

  • Attendre 24h pour reset
  • Utiliser une autre clĂ© API (compte Google diffĂ©rent)
  • Passer Ă  l'offre payante (trĂšs peu cher)

❌ Les outils MCP ne sont pas dĂ©tectĂ©s

ProblĂšme : Serveur MCP non accessible

Solutions :

  1. Vérifier que le serveur MCP tourne : python server.py
  2. Tester l'endpoint : curl http://127.0.0.1:8000/debug/health
  3. Vérifier l'URL dans app.py (ligne 15)

❌ Erreur : "Connection timeout"

ProblĂšme : Connexion Internet instable

Solutions :

  • VĂ©rifier votre connexion Internet
  • Essayer un autre rĂ©seau
  • Augmenter le timeout dans le code

💰 Tarification Google Gemini

Tier Gratuit (données indicatives susceptibles de changements)

Limite Gemini 2.5 Flash Gemini 2.5 Pro
RequĂȘtes par jour 1500 50
RequĂȘtes par minute 15 2
Tokens par minute 1 million 32 000

Tier Payant (données indicatives susceptibles de changements)

Si vous dépassez les quotas gratuits :

  • Gemini 2.5 Flash : $0.075 / million de tokens input, $0.30 / million output
  • Gemini 2.5 Pro : $1.25 / million tokens input, $5.00 / million output

💡 En pratique : ~0.01€ pour 100 conversations avec outils MCP

🆚 Gemini vs Ollama

CritĂšre Gemini (Google) Ollama (Local)
CoĂ»t 🟱 Gratuit (1500/jour) 🟱 100% Gratuit
Vitesse 🟱 TrĂšs rapide (cloud) 🟡 DĂ©pend du GPU/CPU
QualitĂ© 🟱 Excellente 🟡 Bonne (varie selon modĂšle)
Function Calling 🟱 Automatique et prĂ©cis 🟡 NĂ©cessite bon modĂšle
ConfidentialitĂ© 🔮 DonnĂ©es envoyĂ©es Ă  Google 🟱 100% privĂ©
Internet 🔮 Requis 🟱 Fonctionne hors ligne
Multimodal 🟱 Images, audio, vidĂ©o 🟡 Selon modĂšle (llama3.2-vision)