OpenCoworker Guide Complet : L'Assistant IA de Bureau Open Source de l'Équipe d'Andrew Ng
title: OpenCoworker Guide Complet : L'Assistant IA de Bureau Open Source de l'Équipe d'Andrew Ng date: 2026-06-13 authors: [kevinpeng] slug: opencoworker-desktop-agent-guide-2026 categories: [Assistants IA] tags: [OpenCoworker, Agent de Bureau, IA Locale, aisuite, Andrew Ng, Ollama, Automatisation] description: OpenCoworker est un agent IA de bureau open source lancé par l'équipe d'Andrew Ng. Il prend en charge les modèles locaux, ne conserve aucune donnée, et peut directement manipuler des fichiers, envoyer des messages et automatiser des flux de travail. Cet article détaille l'installation, la configuration, la comparaison avec les agents CLI, les cas d'usage pratiques et les meilleures pratiques. cover: https://res.makeronsite.com/generated/6ced578d-a419-40c0-b440-7f57c58cee90_0.png lang: fr
Qu'est-ce qu'OpenCoworker ?
OpenCoworker est un assistant IA de bureau open source développé par l'équipe d'Andrew Ng (吴恩达). Son objectif est d'intégrer véritablement les agents d'intelligence artificielle (IA Agent) dans le flux de travail quotidien des utilisateurs sur leur bureau. Contrairement aux robots de discussion web traditionnels ou aux outils en ligne de commande, OpenCoworker s'exécute sous forme d'interface graphique sur l'ordinateur local de l'utilisateur. Il peut accéder directement au système de fichiers, intégrer des applications de messagerie, effectuer des recherches web et orchestrer de manière autonome des tâches complexes de flux de travail.
Ce projet est construit sur le framework aisuite. Il a été mis en avant dans The Batch #357 (5 juin 2026) comme une « alternative gratuite et open source aux agents de bureau commerciaux ». Alors que des produits commerciaux comme Claude Fable 5 et Cursor Composer 2.5 suscitent beaucoup d'attention, OpenCoworker offre une autre option aux utilisateurs soucieux de leur vie privée et de la sécurité de leurs données, grâce à son code source ouvert et sa conception axée sur le local.
Pourquoi avoir besoin d'un agent IA de bureau ?
Au cours des deux dernières années, les assistants de programmation IA ont évolué. Ils sont passés des discussions web aux interfaces CLI en ligne de commande (comme Claude Code, Codex CLI, Aider), puis à l'intégration dans les IDE (comme Cursor, Windsurf). Cependant, la plupart de ces outils se concentrent sur les scénarios de développement de code. Pour les utilisateurs de bureau ordinaires ou les professionnels non techniques, ils présentent encore un seuil d'utilisation élevé.
La valeur centrale d'un agent IA de bureau réside dans :
- Réduction du seuil d'interaction : L'interface graphique permet aux non-techniciens de collaborer facilement avec l'IA, sans avoir à mémoriser des commandes ou à basculer entre les fenêtres de terminal
- Automatisation inter-applications : Capable d'opérer simultanément sur le gestionnaire de fichiers, le client de messagerie, les logiciels de messagerie instantanée et plusieurs autres applications, réalisant une véritable automatisation de bout en bout des flux de travail
- Conscience contextuelle : Lit directement les fichiers locaux, l'historique de navigation et le contenu du presse-papiers, fournissant des suggestions d'assistance plus précises
- Exécution continue en arrière-plan : Contrairement aux discussions web qui nécessitent de rouvrir un onglet de navigateur à chaque fois, l'agent de bureau peut rester dans la barre d'état système et répondre à tout moment
OpenCoworker vs Agent CLI vs Discussion Web
| Caractéristique | OpenCoworker (GUI de bureau) | Claude Code / Codex CLI (Ligne de commande) | Discussion Web (ChatGPT/Claude) |
|---|---|---|---|
| Seuil d'utilisation | Faible, interface graphique intuitive | Moyen, nécessite de maîtriser les opérations de terminal | Le plus faible, utilisable depuis un navigateur |
| Opérations sur les fichiers | Lecture et écriture directes des fichiers locaux | Opérations indirectes via des commandes | Nécessite un téléchargement/téléchargement manuel |
| Intégration multi-applications | Prend en charge les applications de messagerie et autres | Limité, principalement orienté vers les dépôts de code | Aucune |
| Protection de la vie privée | Prend en charge les modèles locaux, les données ne quittent pas l'appareil | Dépend du fournisseur de modèle | Les données sont envoyées dans le cloud |
| Disponible hors ligne | Peut fonctionner entièrement hors ligne avec Ollama | Partiellement pris en charge | Non |
| Capacité d'automatisation | Orchestration autonome des flux de travail | Nécessite un déclenchement manuel des commandes | Conversation unique, sans persistance |
| Public cible | Utilisateurs de bureau généraux, personnes soucieuses de leur vie privée | Développeurs, passionnés de technologie | Tous les utilisateurs |
Si vous souhaitez comprendre en détail l'utilisation des assistants IA en ligne de commande, vous pouvez consulter les articles précédents de FreeAITool : Guide du flux de travail Claude Code MCP et Guide complet OpenAI Codex CLI. Pour les agents IA spécialisés dans le développement, le Guide Goose AI Agent fournit une évaluation plus approfondie.
Installation et Configuration
Prérequis
Avant de commencer l'installation d'OpenCoworker, assurez-vous que votre système répond aux conditions suivantes :
- Système d'exploitation : macOS 12+, Windows 10/11 ou Linux (Ubuntu 20.04+ recommandé)
- Python : version 3.10 ou supérieure
- Node.js : 18+ (dépendance pour certains composants frontend)
- Clé API ou modèle local :
- Modèles cloud : Clé API pour OpenAI, Anthropic, Google Gemini, etc.
- Modèle local : Installez Ollama et récupérez les modèles nécessaires (comme llama3.1, qwen2.5, etc.)
Démarrage rapide
OpenCoworker est actuellement en phase de développement précoce. La méthode d'installation passe principalement par la construction à partir du code source. Voici le processus d'installation standard :
# 1. Cloner le dépôt
git clone https://github.com/andrewyng/aisuite.git
cd aisuite
# 2. Installer les dépendances
pip install -e .
# 3. Lancer l'application de bureau
python -m opencoworker.app
Lors du premier lancement, OpenCoworker vous guidera à travers l'assistant de configuration initiale. Cela inclut la sélection du fournisseur LLM, la configuration de la clé API ou la connexion au service Ollama local.
Configuration du fournisseur LLM
OpenCoworker prend en charge plusieurs backends LLM. Vous pouvez spécifier le modèle par défaut dans le fichier de configuration :
# ~/.opencoworker/config.yaml
llm:
provider: openai # Options : openai, anthropic, google, ollama
model: gpt-4o # Choisissez le modèle approprié selon le provider
api_key: ${OPENAI_API_KEY} # Il est recommandé d'utiliser des variables d'environnement
# Exemple de configuration pour utiliser Ollama en local
# llm:
# provider: ollama
# model: llama3.1:8b
# base_url: http://localhost:11434
Pour les utilisateurs soucieux de leur vie privée, il est recommandé d'utiliser Ollama pour exécuter des modèles locaux. Ollama prend en charge les principaux modèles open source comme Llama 3.1, Qwen 2.5 et Mistral. Tout le processus d'inférence se fait localement. Les données ne sont envoyées à aucun serveur externe. Pour plus d'informations sur l'installation et l'utilisation d'Ollama, visitez le site officiel d'Ollama.
Détails des Fonctionnalités Principales
Opérations sur les fichiers
OpenCoworker peut lire, écrire et gérer directement le système de fichiers local. Vous pouvez lui donner des instructions en langage naturel pour effectuer les opérations suivantes :
- Lire un fichier : « Résume-moi le contenu principal de ~/Documents/project-report.pdf »
- Créer un fichier : « Crée un fichier nommé meeting-notes.md dans le répertoire ~/Notes pour enregistrer les points clés de la réunion d'aujourd'hui »
- Renommer en lot : « Ajoute un préfixe de date à tous les fichiers .jpg dans le répertoire ~/Photos/vacation/ »
- Recherche de fichiers : « Trouve tous les fichiers Excel modifiés la semaine dernière »
Contrairement aux outils en ligne de commande, les opérations sur les fichiers d'OpenCoworker passent par une interface de confirmation graphique. Les utilisateurs peuvent examiner les opérations sensibles (comme la suppression ou l'écrasement) avant de les exécuter, ce qui réduit le risque d'erreurs.
Recherche web et extraction de contenu
OpenCoworker intègre des fonctionnalités de recherche web et d'extraction de contenu, lui permettant d'obtenir des informations en temps réel :
- Recherche en temps réel : « Vérifie le cours de l'action Tesla aujourd'hui et les dernières actualités »
- Résumé de contenu : « Ouvre https://www.deeplearning.ai/the-batch/issue-357/ et résume les points centraux de cet article »
- Analyse concurrentielle : « Recherche des articles en chinois sur les 'agents IA de bureau' et liste les titres et liens des cinq premiers »
Cette fonctionnalité fait d'OpenCoworker non seulement un assistant local, mais aussi un outil d'agrégation d'informations, aidant les utilisateurs à obtenir rapidement des connaissances externes. Pour le rapport détaillé sur OpenCoworker dans The Batch #357, vous pouvez lire l'article original de DeepLearning.AI.
Intégration des applications de messagerie
OpenCoworker prend en charge l'intégration avec les principales applications de messagerie, y compris Slack, Discord et WeChat (via des plugins). Les scénarios d'application typiques incluent :
- Réponses automatiques : Répondre automatiquement aux questions courantes selon des règles prédéfinies ou des jugements de l'IA
- Synchronisation des messages : Extraire les messages importants et les enregistrer dans des notes locales
- Surveillance de groupe : Surveiller des mots-clés spécifiques pour déclencher des flux de travail automatisés
La configuration de l'intégration de messagerie nécessite d'autoriser les applications correspondantes dans le panneau de paramètres d'OpenCoworker et de définir la portée des autorisations. Il est recommandé de n'accorder que les autorisations de lecture/envoi nécessaires afin de garantir la sécurité du compte.
Orchestration autonome des flux de travail
La fonctionnalité la plus puissante d'OpenCoworker réside dans sa capacité de décision autonome. Contrairement aux outils d'automatisation traditionnels (comme Zapier, IFTTT) qui nécessitent de définir à l'avance des flux de travail fixes, OpenCoworker est piloté par un LLM. Il peut décider dynamiquement de l'action suivante en fonction du contexte actuel.
Par exemple, lorsque vous dites « Aide-moi à organiser les e-mails d'hier et à générer une liste de tâches », OpenCoworker exécutera de manière autonome les étapes suivantes :
- Se connecter au client de messagerie et filtrer les e-mails non lus reçus la veille
- Lire chaque e-mail un par un et identifier les éléments de tâche
- Classer les tâches (urgentes / normales / référence)
- Créer une liste de tâches structurée dans l'application de notes locale
- Vous confirmer le contenu de la liste et l'ajuster en fonction de vos retours
Ce cycle « réflexion-action-vérification » permet à OpenCoworker de traiter des tâches complexes floues et multi-étapes, et pas seulement d'exécuter des scripts prédéfinis.
Scénarios Pratiques
Scénario 1 : Organisation automatique des e-mails
Pour les utilisateurs qui reçoivent un grand nombre d'e-mails chaque jour, OpenCoworker peut considérablement réduire la charge de gestion de la boîte de réception :
Description de la tâche : Chaque jour à 9h, organiser automatiquement les e-mails professionnels de la veille et générer un rapport résumé.
Étapes de configuration :
- Créer une tâche planifiée dans OpenCoworker, configurée pour se déclencher à 9h les jours ouvrables
- Autoriser l'accès à la boîte mail professionnelle (prend en charge IMAP/Exchange)
- Définir des règles de filtrage : ne traiter que les e-mails provenant des domaines internes de l'entreprise
- Configurer le format de sortie : rapport Markdown, incluant l'expéditeur, le sujet, un résumé du contenu clé et les actions suggérées
Résultat attendu : Chaque matin en allumant l'ordinateur, un résumé structuré des e-mails est déjà prêt. Vous pouvez parcourir rapidement et décider quels e-mails nécessitent une réponse immédiate et lesquels peuvent être traités plus tard.
Scénario 2 : Génération et édition de documents
OpenCoworker peut servir d'assistant d'écriture intelligent, vous aidant à générer et réviser rapidement des documents :
Description de la tâche : Générer un compte rendu de réunion formel à partir de la transcription audio de la réunion.
Processus opérationnel :
- Glisser-déposer le fichier texte de la transcription audio de la réunion dans OpenCoworker
- Saisir l'instruction : « Selon cette transcription, génère un compte rendu de réunion formel, incluant les participants, les sujets discutés, les décisions prises et les actions suivantes »
- OpenCoworker lit le fichier, extrait les informations clés et génère un brouillon au format standard de compte rendu de réunion
- Vous examinez et modifiez dans l'interface de prévisualisation, puis après confirmation, enregistrez en PDF et envoyez aux personnes concernées
Par rapport à l'organisation manuelle, cette méthode peut réduire un travail qui prenait initialement 30 à 60 minutes à seulement 5 à 10 minutes.
Scénario 3 : Résumé quotidien des actualités
Pour les professionnels qui doivent suivre l'évolution de leur secteur, OpenCoworker peut personnaliser des推送 d'actualités :
Description de la tâche : Chaque matin, compiler les derniers progrès dans le domaine de l'IA et générer un briefing.
Méthode de configuration :
- Définir les mots-clés des sujets suivis : ["AI Agent", "LLM", "OpenCoworker", "Automatisation de bureau"]
- Configurer les sources d'actualités : Hacker News, Reddit r/MachineLearning, flux RSS de blogs spécifiques
- Configurer le canal de sortie : enregistrer dans les notes locales + envoyer sur le canal personnel Slack
- Définir des règles de déduplication : ne conserver que l'article le plus approfondi pour les actualités sur le même sujet
Exemple de sortie :
📰 Briefing quotidien du domaine IA - 2026-06-13
1. [En profondeur] OpenCoworker publie la v0.2, ajout de l'intégration des applications de messagerie
Source : GitHub Blog | Temps de lecture : 5 minutes
2. [Actualité] Anthropic annonce que Claude Fable 5 prend en charge la collaboration multi-agents
Source : TechCrunch | Temps de lecture : 3 minutes
3. [Tutoriel] Comment exécuter Llama 3.1 en local avec Ollama
Source : Medium | Temps de lecture : 8 minutes
Vie privée et Sécurité
Prise en charge des modèles locaux
Un argument de vente majeur d'OpenCoworker est sa conception « local-first ». En intégrant Ollama, les utilisateurs peuvent exécuter entièrement des grands modèles de langage open source en local, sans envoyer aucune donnée dans le cloud. Cela est particulièrement important pour les scénarios de traitement d'informations sensibles (comme les données financières, les informations clients, les documents internes).
Avantages des modèles locaux :
- Zéro fuite de données : Tout le processus d'inférence se fait localement, les requêtes API ne quittent pas votre ordinateur
- Disponible hors ligne : Peut être utilisé normalement même sans connexion réseau
- Coût contrôlé : Pas besoin de payer des frais API facturés par token
- Latence plus faible : Élimine le temps de transmission réseau, la vitesse de réponse est plus rapide
Bien sûr, les modèles locaux ont aussi des limitations : le matériel grand public ne peut généralement exécuter que des modèles de 7B à 13B paramètres. Leur capacité de raisonnement complexe et de dialogue multi-tours peut être inférieure à celle des modèles cloud comme GPT-4 ou Claude 3.5. Mais pour les tâches quotidiennes d'automatisation de bureau, Llama 3.1 8B ou Qwen 2.5 7B peuvent déjà offrir une bonne expérience.
Comparaison des politiques de conservation des données
| Solution | Emplacement de stockage des données | Politique de conservation des données | Scénarios adaptés |
|---|---|---|---|
| OpenCoworker + Ollama | Entièrement local | Contrôle utilisateur, suppression possible à tout moment | Données hautement sensibles, industries avec exigences de conformité strictes |
| OpenCoworker + API cloud | Local + serveurs du fournisseur de modèle | Suit la politique de chaque fournisseur (généralement 30 jours de logs) | Tâches de bureau générales, recherche de capacités de modèle plus puissantes |
| Robot de discussion web | Entièrement cloud | Politique du fournisseur, généralement utilisé pour l'entraînement des modèles | Recherche d'informations non sensibles, écriture créative |
| Agent CLI (Claude Code, etc.) | Local + cloud | Mode hybride, dépend de l'outil spécifique | Développement de code, sensibilité moyenne |
Si vous évaluez les performances de confidentialité de différents outils IA, il est recommandé de lire attentivement les politiques de données de chaque fournisseur de services et de choisir le schéma de déploiement approprié en fonction des besoins réels de votre entreprise.
Comparaison avec les autres outils Agent de FreeAITool
vs Goose (Développement dédié vs Assistant général)
Goose est un agent IA spécialisé dans les scénarios de développement logiciel. Il peut comprendre la structure du codebase, exécuter des tests, corriger des bugs et s'intégrer profondément au flux de travail Git. En comparaison, OpenCoworker a un positionnement plus général, orienté vers les tâches quotidiennes d'automatisation de bureau, comme la gestion des e-mails, le traitement de documents et l'agrégation d'informations.
| Dimension | Goose | OpenCoworker |
|---|---|---|
| Utilisateur cible | Développeurs, ingénieurs | Utilisateurs de bureau généraux |
| Capacités centrales | Compréhension du code, exécution de tests, correction de bugs | Opérations sur les fichiers, intégration de messagerie, orchestration de flux de travail |
| Forme d'interface | CLI + GUI optionnelle | GUI de bureau |
| Exigences de modèle | Nécessite une forte capacité de compréhension du code | Capacité de conversation générale suffit |
| Écosystème d'intégration | GitHub, IDE, CI/CD | Messagerie, applications de chat, système de fichiers |
Si votre besoin principal est d'améliorer l'efficacité du codage, Goose ou Claude Code pourraient être de meilleurs choix. Si vous souhaitez automatiser les tâches quotidiennes de bureau, OpenCoworker est plus approprié.
vs Claude Code (CLI vs GUI)
Claude Code représente la forme typique d'un agent IA en ligne de commande : puissant et flexible, mais nécessitant que l'utilisateur ait une certaine expérience des opérations de terminal. OpenCoworker réduit le seuil d'utilisation grâce à une interface graphique, ce qui le rend plus adapté aux utilisateurs non techniques.
Conseils de choix :
- Si vous êtes développeur, habitué à utiliser le terminal, et avez besoin d'interagir profondément avec les dépôts de code → Choisissez Claude Code ou Codex CLI
- Si vous êtes un utilisateur de bureau ordinaire, souhaitant accomplir des tâches de gestion de fichiers et d'organisation d'e-mails en langage naturel → Choisissez OpenCoworker
- Si vous avez besoin des deux → Vous pouvez installer les deux et basculer entre eux selon les scénarios
Conclusion et Perspectives
OpenCoworker représente une direction importante dans le développement des agents IA : passer des interfaces de discussion à l'intégration de bureau, et des tâches uniques aux flux de travail autonomes. Soutenu par l'équipe d'Andrew Ng et construit sur le framework open source aisuite, il présente des avantages uniques en matière de protection de la vie privée, de déploiement local et d'automatisation inter-applications.
Cependant, en tant que projet précoce, OpenCoworker fait encore face à certains défis :
- Maturité de l'écosystème : Par rapport aux produits commerciaux, l'écosystème de plugins et les ressources communautaires sont encore en construction
- Stabilité : L'API et l'expérience utilisateur sont encore en itération, il peut y avoir des problèmes de compatibilité
- Coût d'apprentissage : Bien que la GUI réduise le seuil, pour exploiter pleinement son potentiel d'automatisation, une certaine configuration et un certain débogage sont encore nécessaires
Pour les lecteurs de FreeAITool, c'est le bon moment de s'intéresser et d'essayer OpenCoworker. Vous pouvez :
- Rejoindre la communauté : Obtenez les dernières actualités et signalez des problèmes via le serveur Discord
- Contribuer au code : OpenCoworker accueille les contributions de la communauté, que ce soit pour le développement de fonctionnalités ou l'amélioration de la documentation
- Partager l'expérience : Les meilleures pratiques découvertes lors de l'utilisation ou les expériences de difficultés rencontrées peuvent devenir des références précieuses pour les autres
Avec l'évolution continue de la technologie des agents IA, nous avons raison de croire que des assistants de bureau open source comme OpenCoworker deviendront des partenaires de travail quotidiens pour de plus en plus d'utilisateurs dans les années à venir.
Lectures connexes :