OpenWebUI
Frontend chat. Multi-utilisateurs, workspaces, RAG, SSO, traduit en français.
Tous nos concurrents revendent OpenWebUI tel quel. Nous avons construit au-dessus une console d'administration propriétaire et un LLM de configuration qui adapte chaque agent à votre contexte. Vous récupérez votre IA, pas un template générique.
Pas de verrou propriétaire en bas de la pile. Au-dessus de l'écosystème open-source, notre back-office orchestre tout — et un LLM de configuration adapte chaque agent à votre contexte. Cliquez sur une couche pour voir le détail.
Notre vraie valeur ajoutée. Tout ce que les autres ne font pas.
OpenWebUI — chat, espaces de travail, SSO, historique, traduit en français.
Catalogue d'agents métier — chaque agent = prompt système + outils + modèle cible.
Model Context Protocol — la norme pour brancher les outils sans recoder.
Llama, Mistral, Qwen, DeepSeek… exécutés via Ollama ou vLLM. Le bon modèle pour la bonne tâche.
Pas d'enrobage marketing. Voici les briques open-source que notre back-office orchestre. Toutes auditables, toutes remplaçables, toutes maintenues par leurs communautés respectives.
Frontend chat. Multi-utilisateurs, workspaces, RAG, SSO, traduit en français.
Proxy LLM unifié — un seul endpoint pour Llama, Mistral, OpenAI, Claude, Anthropic.
Containers reproductibles — déploiement Cloud ou Local en quelques minutes.
Base vectorielle pour le RAG — recherche sémantique sur vos documents.
Base relationnelle pour utilisateurs, conversations, configurations, audit.
Cache et files de tâches — réponses instantanées, jobs asynchrones fiables.
Orchestration de workflows — automatisations entre vos outils, déclenchées par l'IA.
Méta-moteur de recherche privé — vos requêtes web sans tracking Google.
Transcription audio en local — réunions, dictées, sans envoyer aux GAFAM.
Modèle MoE 35B/3B actifs — natif MCP, excellent en français, tool-calls fiables.
Runtimes d'inférence — Ollama pour le simple, vLLM pour le débit production.
Orchestration containers en haute disponibilité — pour les déploiements Local exigeants.
Le Model Context Protocol (introduit par Anthropic, repris par OpenAI et Google) standardise la façon dont un assistant IA dialogue avec vos outils. Résultat : on ne recode plus un connecteur à chaque intégration.
Chaque outil = un développement spécifique, une clé d'API à gérer, une intégration à maintenir. Les coûts explosent dès qu'on multiplie les sources.
Un serveur MCP pour chaque outil — déjà écrit par la communauté ou par l'éditeur. On branche, on donne les accès, l'assistant peut lire et agir.
Nous n'imposons pas un modèle unique. Chaque agent est configuré avec le modèle adapté à sa tâche : rapide pour le support, puissant pour l'analyse juridique, multimodal pour la lecture de factures.
RGPD-by-design, chiffrement bout-en-bout, isolation tenant, audit complet — voici ce qu'il y a vraiment derrière les promesses commerciales.
Cloud mutualisé pour démarrer en 2 minutes, ou installation Local sur vos serveurs pour les contraintes les plus fortes. Mêmes briques open-source, même back-office, même expérience.
Survolez (ou tappez sur mobile) les termes pour avoir une définition claire. On parle technique sans détour, mais on n'aime pas les boîtes noires.
Le moteur qui comprend et génère le texte. Chez nous : open-weight, exécuté sur votre infra ou la nôtre, jamais chez un GAFAM.
Le protocole qui standardise les connecteurs. 200+ serveurs MCP existent, branchés en quelques minutes par notre back-office.
L'IA va lire vos vrais documents avant de répondre. Plus de hallucinations, des sources citables.
Le modèle est livré avec ses poids — vous pouvez l'exécuter chez vous, l'auditer, le modifier. Opposé : modèle propriétaire en API uniquement.
Là où sont stockés vos documents indexés pour le RAG. Permet de retrouver par sens (pas seulement par mot-clé).
Un assistant IA spécialisé sur un cas métier — Sales Coach, Compta Assistant, Veille Juridique. Prompt + outils + modèle.
Mixture-of-Experts. Le modèle Qwen 3.6 fait 35B paramètres mais n'en active que 3B par requête. Rapide ET intelligent.
Un espace de travail dédié à une équipe ou un service. Bons agents, bons connecteurs, bonne base documentaire — déjà configurés.
Chiffrement, isolation, audit, intégration au SI existant, déploiement Kubernetes — appelez, on parlera technique sans détour. Documentation détaillée disponible sous NDA.