

Nœud N8N pour modèles GPT open-source self-hosted — orchestration locale d'agents LLM.
Package NPM qui apporte à N8N un nœud dédié aux modèles GPT open-source self-hosted (LM Studio, Ollama, vLLM, Text Generation Inference). Objectif : orchestrer des agents LLM dans des workflows N8N sans dépendre d'une API cloud, en gardant la donnée 100% on-prem. Le nœud expose les opérations chat, complétion et embeddings, avec une couche d'abstraction qui supporte plusieurs serveurs d'inférence via une seule configuration.
L'orchestration d'agents LLM dans N8N était jusqu'ici monopolisée par OpenAI. Les organisations avec contraintes RGPD ou souveraineté des données n'avaient pas d'option pour utiliser des modèles open-source self-hosted dans leurs workflows existants.
Nœud N8N abstrait par-dessus 4 serveurs d'inférence (LM Studio, Ollama, vLLM, TGI) — configuration par URL + modèle, opérations chat/completion/embeddings. Streaming supporté pour les réponses longues. Conçu pour glisser dans des workflows existants sans changer la structure du graphe : entrée prompt, sortie texte ou embedding, gestion d'erreurs N8N standard.
Les métriques donnent une lecture rapide des effets de l'étude de cas.
Une lecture simple des blocs fonctionnels et de leurs interactions.
Diagnostic produit, architecture SaaS, backend, interface et automatisations qui rendent une plateforme exploitable.