Notre valeur ajoutée

Le back-office qui transforme
l'open-source en produit fini.

Tous nos concurrents revendent OpenWebUI tel quel. Nous avons construit au-dessus une console d'administration propriétaire et un LLM de configuration qui adapte chaque agent à votre contexte. Vous récupérez votre IA, pas un template générique.

  • Console de pilotage Utilisateurs, droits, agents, MCP, facturation — tout en interface, zéro YAML.
  • Adaptation auto des agents Un LLM dédié réécrit chaque prompt système avec vos cas, vos termes métier, vos documents.
  • Orchestration MCP Activation 1-clic des connecteurs (Google, HubSpot, Slack…), gestion des tokens, audit des appels.
  • Monitoring temps réel Coûts, latence, requêtes par équipe, quotas, alertes — vous voyez ce qui tourne, vraiment.
OpenWebUI MCP LiteLLM Llama · Mistral · Qwen Ollama / vLLM Postgres · Qdrant Docker · Kubernetes
Architecture

Cinq couches. Chacune remplaçable.

Pas de verrou propriétaire en bas de la pile. Au-dessus de l'écosystème open-source, notre back-office orchestre tout — et un LLM de configuration adapte chaque agent à votre contexte. Cliquez sur une couche pour voir le détail.

0
Couche AC-Création — propriétaire

Back-office & LLM de configuration

Notre vraie valeur ajoutée. Tout ce que les autres ne font pas.

Console de pilotage AC-Création
Interface d'administration dédiée : utilisateurs, équipes, droits, activation des agents, branchement des MCP, import documentaire, monitoring, facturation. Zéro YAML, zéro CLI.
LLM de configuration
Un modèle dédié lit vos documents, vos MCP connectés, vos réponses au questionnaire d'onboarding — puis adapte automatiquement chaque agent open-source à votre contexte. Résultat : des workspaces optimisés pour vous, pas des templates génériques.
OpenWebUI
Chat, espaces de travail, gestion des utilisateurs, historique, recherche. Compatible OIDC / SAML 2.0. Logs d'audit complets.
Le frontend chat le plus mature de l'écosystème open-source. Auditable ligne par ligne. Que nous orchestrons via notre back-office au lieu de laisser le client se débrouiller avec.
Catalogue agency-agents
60+ profils métier open-source : Sales Coach, Compta Assistant, Veille Juridique, Frontend Dev, etc. Chacun = un prompt système + des outils MCP autorisés + un modèle cible.
Adaptation par notre LLM
Chaque agent est repris et personnalisé à votre contexte par le LLM de configuration (couche 0). Vous ne récupérez pas un template — vous récupérez votre version.
MCP — Model Context Protocol
Standard ouvert (Anthropic + OpenAI + Google) qui définit comment un assistant IA dialogue avec vos outils externes. Résultat : on ne recode plus un connecteur à chaque intégration.
200+ serveurs MCP disponibles
Google Drive, HubSpot, Slack, Pennylane, Notion, GitHub, Postgres, Salesforce, Microsoft 365… branchés en 10 minutes par notre back-office, pas en 2 jours par un dev.
Runtime
Ollama · vLLM · llama.cpp
Modèles open-weight
Llama 3.3 · Mistral Large · Qwen 3.6 · Mixtral · Gemma · DeepSeek V3
Routage intelligent
Notre back-office choisit le modèle adapté à chaque agent — rapide pour le support, puissant pour l'analyse juridique, multimodal pour les factures.
Couches 1 → 4 = open-source. Vous pourriez les assembler vous-mêmes. C'est exactement ce que la couche 0 vous évite.
Stack open-source

Honnêtes sur ce qu'on utilise.

Pas d'enrobage marketing. Voici les briques open-source que notre back-office orchestre. Toutes auditables, toutes remplaçables, toutes maintenues par leurs communautés respectives.

OpenWebUI

Frontend chat. Multi-utilisateurs, workspaces, RAG, SSO, traduit en français.

BSD-3 · 100k+ ⭐

LiteLLM

Proxy LLM unifié — un seul endpoint pour Llama, Mistral, OpenAI, Claude, Anthropic.

MIT · Routing & quotas

Docker

Containers reproductibles — déploiement Cloud ou Local en quelques minutes.

Apache 2.0 · Standard

Qdrant

Base vectorielle pour le RAG — recherche sémantique sur vos documents.

Apache 2.0 · Rust

PostgreSQL

Base relationnelle pour utilisateurs, conversations, configurations, audit.

PostgreSQL · 35 ans

Redis

Cache et files de tâches — réponses instantanées, jobs asynchrones fiables.

BSD · In-memory

n8n

Orchestration de workflows — automatisations entre vos outils, déclenchées par l'IA.

Sustainable Use · Visual

SearXNG

Méta-moteur de recherche privé — vos requêtes web sans tracking Google.

AGPL · Méta-moteur

Whisper

Transcription audio en local — réunions, dictées, sans envoyer aux GAFAM.

MIT · OpenAI open

Qwen 3.6

Modèle MoE 35B/3B actifs — natif MCP, excellent en français, tool-calls fiables.

Apache 2.0 · Alibaba

Ollama / vLLM

Runtimes d'inférence — Ollama pour le simple, vLLM pour le débit production.

MIT · Apache 2.0

Kubernetes

Orchestration containers en haute disponibilité — pour les déploiements Local exigeants.

Apache 2.0 · CNCF
Protocole MCP

Brancher un outil, c'est 10 minutes.

Le Model Context Protocol (introduit par Anthropic, repris par OpenAI et Google) standardise la façon dont un assistant IA dialogue avec vos outils. Résultat : on ne recode plus un connecteur à chaque intégration.

Avant MCP

Chaque outil = un développement spécifique, une clé d'API à gérer, une intégration à maintenir. Les coûts explosent dès qu'on multiplie les sources.

Avec MCP

Un serveur MCP pour chaque outil — déjà écrit par la communauté ou par l'éditeur. On branche, on donne les accès, l'assistant peut lire et agir.

Catalogue

200+ serveurs MCP disponibles — sélection des plus courants chez nos clients français.
Bureautique & docs
Google Drive Google Sheets Google Calendar Microsoft 365 SharePoint OneDrive Notion Confluence Filesystem local
CRM & ventes
HubSpot Salesforce Pipedrive Attio Zoho Copper
Support & messagerie
Slack Microsoft Teams Gmail Outlook Zendesk Intercom Front Discord
Compta & finance
Pennylane Sage Cegid Qonto Stripe PayPlug GoCardless
Dev & data
PostgreSQL MySQL MongoDB BigQuery Metabase Airtable GitHub GitLab
Marketing & analytics
Google Analytics Meta Ads Google Ads Mailchimp Brevo Matomo WordPress
RH & recrutement
Lucca PayFit BambooHR Workday Greenhouse LinkedIn
ERP & logistique
SAP Odoo NetSuite Microsoft Dynamics Sage X3
Vous ne trouvez pas votre outil ? Un serveur MCP se développe en 2–3 jours en moyenne. On s'en occupe.
Modèles de langage

Le bon modèle, pour le bon usage.

Nous n'imposons pas un modèle unique. Chaque agent est configuré avec le modèle adapté à sa tâche : rapide pour le support, puissant pour l'analyse juridique, multimodal pour la lecture de factures.

Modèle
Éditeur
Licence
Contexte
Matériel requis
Usage recommandé
Llama 3.3 70B Généraliste haut-de-gamme
Meta
Llama Community
128k tokens
48 Go (quant. 4-bit)
Raisonnement, rédaction long format, analyse de documents.
Mistral Large 2 Multilingue FR-excellent
Mistral AI (FR)
MRL / API
128k tokens
API ou 90 Go
Conformité européenne, rédaction juridique et comptable en français.
Qwen 3.6 35B-A3B MoE natif MCP · code & raisonnement
Alibaba
Apache 2.0
128k tokens
24 Go (FP8, 3B actifs)
Tool-calls fiables, génération SQL, analyse de données structurées, agents MCP.
Mixtral 8x7B Équilibré rapide
Mistral AI
Apache 2.0
32k tokens
24 Go
Chatbots support, réponses courtes à haute volumétrie.
Gemma 3 27B Léger & multimodal
Google
Gemma Terms
128k tokens
16 Go
Analyse d'images, lecture de factures, reconnaissance visuelle.
DeepSeek V3 Raisonnement expert
DeepSeek
MIT
64k tokens
API ou 500 Go
Problèmes complexes — juridique, fiscal, médical spécialisé.
Tous ces modèles tournent 100% en local sur l'offre Local. En Cloud, nous exécutons le runtime sur nos serveurs français (Scaleway, OVH) ; l'option Mistral / Claude / OpenAI API est disponible via votre propre clé client si vous le souhaitez.
Sécurité · détail technique

Ce qu'on protège, et comment.

RGPD-by-design, chiffrement bout-en-bout, isolation tenant, audit complet — voici ce qu'il y a vraiment derrière les promesses commerciales.

Chiffrement

  • TLS 1.3 pour tous les échanges
  • AES-256 au repos (Postgres + volumes)
  • Clés gérées par KMS (Cloud) ou HSM local (Local)
  • Certificats Let's Encrypt ou CA d'entreprise

Authentification

  • SSO via OIDC / SAML 2.0
  • Compatible Azure AD, Google Workspace, Keycloak, Okta
  • MFA via TOTP ou WebAuthn
  • RBAC par équipe, projet, modèle, outil MCP

Isolation des données

  • Schéma Postgres dédié par client (Cloud)
  • Pas de partage de cache entre tenants
  • Embeddings stockés dans le tenant d'origine
  • Aucune donnée client utilisée pour ré-entraîner

Audit & conformité

  • Logs d'accès + logs de prompt consultables
  • Export des logs au format JSON / Syslog
  • Rétention paramétrable (30j → 10 ans)
  • RGPD · ISO 27001 (hébergeur) · HDS (option santé)

Infrastructure (Cloud)

  • Scaleway / OVHcloud — datacenters France
  • Sauvegardes chiffrées J+1, J+7, J+30
  • Plan de reprise RPO 4h / RTO 8h
  • Monitoring Grafana + alertes PagerDuty

Local

  • Déploiement Docker Compose ou Kubernetes
  • Fonctionne sans aucune connexion Internet
  • Mises à jour livrées sur clé USB si besoin
  • Support via site dédié ou tunnel sur demande
Déploiement

Deux formats, mêmes briques.

Cloud mutualisé pour démarrer en 2 minutes, ou installation Local sur vos serveurs pour les contraintes les plus fortes. Mêmes briques open-source, même back-office, même expérience.

Cloud

Hébergement
Scaleway (Paris) ou OVH (Gravelines)
Installation
2 minutes — URL + SSO
Modèles
Llama, Mistral, Qwen, Mixtral en service mutualisé
GPU
A100 / H100 partagés · 10–20 req/s garanti
Sauvegarde
Incluse — 30 jours rétention
Mises à jour
Automatiques · notification 48h avant

Local

Hébergement
Vos serveurs — bare metal ou VM
OS supportés
Debian, Ubuntu, RHEL, Rocky Linux
Orchestration
Docker Compose (simple) ou K8s (HA)
GPU recommandé
NVIDIA A10 / L40 / A100 selon modèle et charge
Connexion Internet
Optionnelle — 100% air-gap possible
Support
Runbook + mises à jour livrées sur clé USB ou tunnel
Glossaire

Pas de jargon qui exclut.

Survolez (ou tappez sur mobile) les termes pour avoir une définition claire. On parle technique sans détour, mais on n'aime pas les boîtes noires.

LLM

Le moteur qui comprend et génère le texte. Chez nous : open-weight, exécuté sur votre infra ou la nôtre, jamais chez un GAFAM.

MCP

Le protocole qui standardise les connecteurs. 200+ serveurs MCP existent, branchés en quelques minutes par notre back-office.

RAG

L'IA va lire vos vrais documents avant de répondre. Plus de hallucinations, des sources citables.

Open-weight

Le modèle est livré avec ses poids — vous pouvez l'exécuter chez vous, l'auditer, le modifier. Opposé : modèle propriétaire en API uniquement.

Base vectorielle

Là où sont stockés vos documents indexés pour le RAG. Permet de retrouver par sens (pas seulement par mot-clé).

Agent

Un assistant IA spécialisé sur un cas métier — Sales Coach, Compta Assistant, Veille Juridique. Prompt + outils + modèle.

MoE

Mixture-of-Experts. Le modèle Qwen 3.6 fait 35B paramètres mais n'en active que 3B par requête. Rapide ET intelligent.

Workspace

Un espace de travail dédié à une équipe ou un service. Bons agents, bons connecteurs, bonne base documentaire — déjà configurés.

Questions plus pointues ?

On parle avec votre DSI.

Chiffrement, isolation, audit, intégration au SI existant, déploiement Kubernetes — appelez, on parlera technique sans détour. Documentation détaillée disponible sous NDA.