OpenCoworker Guide Complet : L'Assistant IA de Bureau Open Source de l'Équipe d'Andrew Ng

title: OpenCoworker Guide Complet : L'Assistant IA de Bureau Open Source de l'Équipe d'Andrew Ng date: 2026-06-13 authors: [kevinpeng] slug: opencoworker-desktop-agent-guide-2026 categories: [Assistants IA] tags: [OpenCoworker, Agent de Bureau, IA Locale, aisuite, Andrew Ng, Ollama, Automatisation] description: OpenCoworker est un agent IA de bureau open source lancé par l'équipe d'Andrew Ng. Il prend en charge les modèles locaux, ne conserve aucune donnée, et peut directement manipuler des fichiers, envoyer des messages et automatiser des flux de travail. Cet article détaille l'installation, la configuration, la comparaison avec les agents CLI, les cas d'usage pratiques et les meilleures pratiques. cover: https://res.makeronsite.com/generated/6ced578d-a419-40c0-b440-7f57c58cee90_0.png lang: fr

Qu'est-ce qu'OpenCoworker ?

OpenCoworker est un assistant IA de bureau open source développé par l'équipe d'Andrew Ng (吴恩达). Son objectif est d'intégrer véritablement les agents d'intelligence artificielle (IA Agent) dans le flux de travail quotidien des utilisateurs sur leur bureau. Contrairement aux robots de discussion web traditionnels ou aux outils en ligne de commande, OpenCoworker s'exécute sous forme d'interface graphique sur l'ordinateur local de l'utilisateur. Il peut accéder directement au système de fichiers, intégrer des applications de messagerie, effectuer des recherches web et orchestrer de manière autonome des tâches complexes de flux de travail.

Ce projet est construit sur le framework aisuite. Il a été mis en avant dans The Batch #357 (5 juin 2026) comme une « alternative gratuite et open source aux agents de bureau commerciaux ». Alors que des produits commerciaux comme Claude Fable 5 et Cursor Composer 2.5 suscitent beaucoup d'attention, OpenCoworker offre une autre option aux utilisateurs soucieux de leur vie privée et de la sécurité de leurs données, grâce à son code source ouvert et sa conception axée sur le local.

Pourquoi avoir besoin d'un agent IA de bureau ?

Au cours des deux dernières années, les assistants de programmation IA ont évolué. Ils sont passés des discussions web aux interfaces CLI en ligne de commande (comme Claude Code, Codex CLI, Aider), puis à l'intégration dans les IDE (comme Cursor, Windsurf). Cependant, la plupart de ces outils se concentrent sur les scénarios de développement de code. Pour les utilisateurs de bureau ordinaires ou les professionnels non techniques, ils présentent encore un seuil d'utilisation élevé.

La valeur centrale d'un agent IA de bureau réside dans :

Réduction du seuil d'interaction : L'interface graphique permet aux non-techniciens de collaborer facilement avec l'IA, sans avoir à mémoriser des commandes ou à basculer entre les fenêtres de terminal
Automatisation inter-applications : Capable d'opérer simultanément sur le gestionnaire de fichiers, le client de messagerie, les logiciels de messagerie instantanée et plusieurs autres applications, réalisant une véritable automatisation de bout en bout des flux de travail
Conscience contextuelle : Lit directement les fichiers locaux, l'historique de navigation et le contenu du presse-papiers, fournissant des suggestions d'assistance plus précises
Exécution continue en arrière-plan : Contrairement aux discussions web qui nécessitent de rouvrir un onglet de navigateur à chaque fois, l'agent de bureau peut rester dans la barre d'état système et répondre à tout moment

OpenCoworker vs Agent CLI vs Discussion Web

Caractéristique	OpenCoworker (GUI de bureau)	Claude Code / Codex CLI (Ligne de commande)	Discussion Web (ChatGPT/Claude)
Seuil d'utilisation	Faible, interface graphique intuitive	Moyen, nécessite de maîtriser les opérations de terminal	Le plus faible, utilisable depuis un navigateur
Opérations sur les fichiers	Lecture et écriture directes des fichiers locaux	Opérations indirectes via des commandes	Nécessite un téléchargement/téléchargement manuel
Intégration multi-applications	Prend en charge les applications de messagerie et autres	Limité, principalement orienté vers les dépôts de code	Aucune
Protection de la vie privée	Prend en charge les modèles locaux, les données ne quittent pas l'appareil	Dépend du fournisseur de modèle	Les données sont envoyées dans le cloud
Disponible hors ligne	Peut fonctionner entièrement hors ligne avec Ollama	Partiellement pris en charge	Non
Capacité d'automatisation	Orchestration autonome des flux de travail	Nécessite un déclenchement manuel des commandes	Conversation unique, sans persistance
Public cible	Utilisateurs de bureau généraux, personnes soucieuses de leur vie privée	Développeurs, passionnés de technologie	Tous les utilisateurs

Si vous souhaitez comprendre en détail l'utilisation des assistants IA en ligne de commande, vous pouvez consulter les articles précédents de FreeAITool : Guide du flux de travail Claude Code MCP et Guide complet OpenAI Codex CLI. Pour les agents IA spécialisés dans le développement, le Guide Goose AI Agent fournit une évaluation plus approfondie.

Installation et Configuration

Prérequis

Avant de commencer l'installation d'OpenCoworker, assurez-vous que votre système répond aux conditions suivantes :

Système d'exploitation : macOS 12+, Windows 10/11 ou Linux (Ubuntu 20.04+ recommandé)
Python : version 3.10 ou supérieure
Node.js : 18+ (dépendance pour certains composants frontend)
Clé API ou modèle local :
Modèles cloud : Clé API pour OpenAI, Anthropic, Google Gemini, etc.
Modèle local : Installez Ollama et récupérez les modèles nécessaires (comme llama3.1, qwen2.5, etc.)

Démarrage rapide

OpenCoworker est actuellement en phase de développement précoce. La méthode d'installation passe principalement par la construction à partir du code source. Voici le processus d'installation standard :

# 1. Cloner le dépôt
git clone https://github.com/andrewyng/aisuite.git
cd aisuite

# 2. Installer les dépendances
pip install -e .

# 3. Lancer l'application de bureau
python -m opencoworker.app

Lors du premier lancement, OpenCoworker vous guidera à travers l'assistant de configuration initiale. Cela inclut la sélection du fournisseur LLM, la configuration de la clé API ou la connexion au service Ollama local.

Configuration du fournisseur LLM

OpenCoworker prend en charge plusieurs backends LLM. Vous pouvez spécifier le modèle par défaut dans le fichier de configuration :

# ~/.opencoworker/config.yaml
llm:
  provider: openai  # Options : openai, anthropic, google, ollama
  model: gpt-4o     # Choisissez le modèle approprié selon le provider
  api_key: ${OPENAI_API_KEY}  # Il est recommandé d'utiliser des variables d'environnement

# Exemple de configuration pour utiliser Ollama en local
# llm:
#   provider: ollama
#   model: llama3.1:8b
#   base_url: http://localhost:11434

Pour les utilisateurs soucieux de leur vie privée, il est recommandé d'utiliser Ollama pour exécuter des modèles locaux. Ollama prend en charge les principaux modèles open source comme Llama 3.1, Qwen 2.5 et Mistral. Tout le processus d'inférence se fait localement. Les données ne sont envoyées à aucun serveur externe. Pour plus d'informations sur l'installation et l'utilisation d'Ollama, visitez le site officiel d'Ollama.

Détails des Fonctionnalités Principales

Opérations sur les fichiers

OpenCoworker peut lire, écrire et gérer directement le système de fichiers local. Vous pouvez lui donner des instructions en langage naturel pour effectuer les opérations suivantes :

Lire un fichier : « Résume-moi le contenu principal de ~/Documents/project-report.pdf »
Créer un fichier : « Crée un fichier nommé meeting-notes.md dans le répertoire ~/Notes pour enregistrer les points clés de la réunion d'aujourd'hui »
Renommer en lot : « Ajoute un préfixe de date à tous les fichiers .jpg dans le répertoire ~/Photos/vacation/ »
Recherche de fichiers : « Trouve tous les fichiers Excel modifiés la semaine dernière »

Contrairement aux outils en ligne de commande, les opérations sur les fichiers d'OpenCoworker passent par une interface de confirmation graphique. Les utilisateurs peuvent examiner les opérations sensibles (comme la suppression ou l'écrasement) avant de les exécuter, ce qui réduit le risque d'erreurs.

Recherche web et extraction de contenu

OpenCoworker intègre des fonctionnalités de recherche web et d'extraction de contenu, lui permettant d'obtenir des informations en temps réel :

Recherche en temps réel : « Vérifie le cours de l'action Tesla aujourd'hui et les dernières actualités »
Résumé de contenu : « Ouvre https://www.deeplearning.ai/the-batch/issue-357/ et résume les points centraux de cet article »
Analyse concurrentielle : « Recherche des articles en chinois sur les 'agents IA de bureau' et liste les titres et liens des cinq premiers »

Cette fonctionnalité fait d'OpenCoworker non seulement un assistant local, mais aussi un outil d'agrégation d'informations, aidant les utilisateurs à obtenir rapidement des connaissances externes. Pour le rapport détaillé sur OpenCoworker dans The Batch #357, vous pouvez lire l'article original de DeepLearning.AI.

Intégration des applications de messagerie

OpenCoworker prend en charge l'intégration avec les principales applications de messagerie, y compris Slack, Discord et WeChat (via des plugins). Les scénarios d'application typiques incluent :

Réponses automatiques : Répondre automatiquement aux questions courantes selon des règles prédéfinies ou des jugements de l'IA
Synchronisation des messages : Extraire les messages importants et les enregistrer dans des notes locales
Surveillance de groupe : Surveiller des mots-clés spécifiques pour déclencher des flux de travail automatisés

La configuration de l'intégration de messagerie nécessite d'autoriser les applications correspondantes dans le panneau de paramètres d'OpenCoworker et de définir la portée des autorisations. Il est recommandé de n'accorder que les autorisations de lecture/envoi nécessaires afin de garantir la sécurité du compte.

Orchestration autonome des flux de travail

La fonctionnalité la plus puissante d'OpenCoworker réside dans sa capacité de décision autonome. Contrairement aux outils d'automatisation traditionnels (comme Zapier, IFTTT) qui nécessitent de définir à l'avance des flux de travail fixes, OpenCoworker est piloté par un LLM. Il peut décider dynamiquement de l'action suivante en fonction du contexte actuel.

Par exemple, lorsque vous dites « Aide-moi à organiser les e-mails d'hier et à générer une liste de tâches », OpenCoworker exécutera de manière autonome les étapes suivantes :

Se connecter au client de messagerie et filtrer les e-mails non lus reçus la veille
Lire chaque e-mail un par un et identifier les éléments de tâche
Classer les tâches (urgentes / normales / référence)
Créer une liste de tâches structurée dans l'application de notes locale
Vous confirmer le contenu de la liste et l'ajuster en fonction de vos retours

Ce cycle « réflexion-action-vérification » permet à OpenCoworker de traiter des tâches complexes floues et multi-étapes, et pas seulement d'exécuter des scripts prédéfinis.

Scénarios Pratiques

Scénario 1 : Organisation automatique des e-mails

Pour les utilisateurs qui reçoivent un grand nombre d'e-mails chaque jour, OpenCoworker peut considérablement réduire la charge de gestion de la boîte de réception :

Description de la tâche : Chaque jour à 9h, organiser automatiquement les e-mails professionnels de la veille et générer un rapport résumé.

Étapes de configuration :

Créer une tâche planifiée dans OpenCoworker, configurée pour se déclencher à 9h les jours ouvrables
Autoriser l'accès à la boîte mail professionnelle (prend en charge IMAP/Exchange)
Définir des règles de filtrage : ne traiter que les e-mails provenant des domaines internes de l'entreprise
Configurer le format de sortie : rapport Markdown, incluant l'expéditeur, le sujet, un résumé du contenu clé et les actions suggérées

Résultat attendu : Chaque matin en allumant l'ordinateur, un résumé structuré des e-mails est déjà prêt. Vous pouvez parcourir rapidement et décider quels e-mails nécessitent une réponse immédiate et lesquels peuvent être traités plus tard.

Scénario 2 : Génération et édition de documents

OpenCoworker peut servir d'assistant d'écriture intelligent, vous aidant à générer et réviser rapidement des documents :

Description de la tâche : Générer un compte rendu de réunion formel à partir de la transcription audio de la réunion.

Processus opérationnel :

Glisser-déposer le fichier texte de la transcription audio de la réunion dans OpenCoworker
Saisir l'instruction : « Selon cette transcription, génère un compte rendu de réunion formel, incluant les participants, les sujets discutés, les décisions prises et les actions suivantes »
OpenCoworker lit le fichier, extrait les informations clés et génère un brouillon au format standard de compte rendu de réunion
Vous examinez et modifiez dans l'interface de prévisualisation, puis après confirmation, enregistrez en PDF et envoyez aux personnes concernées

Par rapport à l'organisation manuelle, cette méthode peut réduire un travail qui prenait initialement 30 à 60 minutes à seulement 5 à 10 minutes.

Scénario 3 : Résumé quotidien des actualités

Pour les professionnels qui doivent suivre l'évolution de leur secteur, OpenCoworker peut personnaliser des推送 d'actualités :

Description de la tâche : Chaque matin, compiler les derniers progrès dans le domaine de l'IA et générer un briefing.

Méthode de configuration :

Définir les mots-clés des sujets suivis : ["AI Agent", "LLM", "OpenCoworker", "Automatisation de bureau"]
Configurer les sources d'actualités : Hacker News, Reddit r/MachineLearning, flux RSS de blogs spécifiques
Configurer le canal de sortie : enregistrer dans les notes locales + envoyer sur le canal personnel Slack
Définir des règles de déduplication : ne conserver que l'article le plus approfondi pour les actualités sur le même sujet

Exemple de sortie :

📰 Briefing quotidien du domaine IA - 2026-06-13

1. [En profondeur] OpenCoworker publie la v0.2, ajout de l'intégration des applications de messagerie
   Source : GitHub Blog | Temps de lecture : 5 minutes

2. [Actualité] Anthropic annonce que Claude Fable 5 prend en charge la collaboration multi-agents
   Source : TechCrunch | Temps de lecture : 3 minutes

3. [Tutoriel] Comment exécuter Llama 3.1 en local avec Ollama
   Source : Medium | Temps de lecture : 8 minutes

Vie privée et Sécurité

Prise en charge des modèles locaux

Un argument de vente majeur d'OpenCoworker est sa conception « local-first ». En intégrant Ollama, les utilisateurs peuvent exécuter entièrement des grands modèles de langage open source en local, sans envoyer aucune donnée dans le cloud. Cela est particulièrement important pour les scénarios de traitement d'informations sensibles (comme les données financières, les informations clients, les documents internes).

Avantages des modèles locaux :

Zéro fuite de données : Tout le processus d'inférence se fait localement, les requêtes API ne quittent pas votre ordinateur
Disponible hors ligne : Peut être utilisé normalement même sans connexion réseau
Coût contrôlé : Pas besoin de payer des frais API facturés par token
Latence plus faible : Élimine le temps de transmission réseau, la vitesse de réponse est plus rapide

Bien sûr, les modèles locaux ont aussi des limitations : le matériel grand public ne peut généralement exécuter que des modèles de 7B à 13B paramètres. Leur capacité de raisonnement complexe et de dialogue multi-tours peut être inférieure à celle des modèles cloud comme GPT-4 ou Claude 3.5. Mais pour les tâches quotidiennes d'automatisation de bureau, Llama 3.1 8B ou Qwen 2.5 7B peuvent déjà offrir une bonne expérience.

Comparaison des politiques de conservation des données

Solution	Emplacement de stockage des données	Politique de conservation des données	Scénarios adaptés
OpenCoworker + Ollama	Entièrement local	Contrôle utilisateur, suppression possible à tout moment	Données hautement sensibles, industries avec exigences de conformité strictes
OpenCoworker + API cloud	Local + serveurs du fournisseur de modèle	Suit la politique de chaque fournisseur (généralement 30 jours de logs)	Tâches de bureau générales, recherche de capacités de modèle plus puissantes
Robot de discussion web	Entièrement cloud	Politique du fournisseur, généralement utilisé pour l'entraînement des modèles	Recherche d'informations non sensibles, écriture créative
Agent CLI (Claude Code, etc.)	Local + cloud	Mode hybride, dépend de l'outil spécifique	Développement de code, sensibilité moyenne

Si vous évaluez les performances de confidentialité de différents outils IA, il est recommandé de lire attentivement les politiques de données de chaque fournisseur de services et de choisir le schéma de déploiement approprié en fonction des besoins réels de votre entreprise.

Comparaison avec les autres outils Agent de FreeAITool

vs Goose (Développement dédié vs Assistant général)

Goose est un agent IA spécialisé dans les scénarios de développement logiciel. Il peut comprendre la structure du codebase, exécuter des tests, corriger des bugs et s'intégrer profondément au flux de travail Git. En comparaison, OpenCoworker a un positionnement plus général, orienté vers les tâches quotidiennes d'automatisation de bureau, comme la gestion des e-mails, le traitement de documents et l'agrégation d'informations.

Dimension	Goose	OpenCoworker
Utilisateur cible	Développeurs, ingénieurs	Utilisateurs de bureau généraux
Capacités centrales	Compréhension du code, exécution de tests, correction de bugs	Opérations sur les fichiers, intégration de messagerie, orchestration de flux de travail
Forme d'interface	CLI + GUI optionnelle	GUI de bureau
Exigences de modèle	Nécessite une forte capacité de compréhension du code	Capacité de conversation générale suffit
Écosystème d'intégration	GitHub, IDE, CI/CD	Messagerie, applications de chat, système de fichiers

Si votre besoin principal est d'améliorer l'efficacité du codage, Goose ou Claude Code pourraient être de meilleurs choix. Si vous souhaitez automatiser les tâches quotidiennes de bureau, OpenCoworker est plus approprié.

vs Claude Code (CLI vs GUI)

Claude Code représente la forme typique d'un agent IA en ligne de commande : puissant et flexible, mais nécessitant que l'utilisateur ait une certaine expérience des opérations de terminal. OpenCoworker réduit le seuil d'utilisation grâce à une interface graphique, ce qui le rend plus adapté aux utilisateurs non techniques.

Conseils de choix :

Si vous êtes développeur, habitué à utiliser le terminal, et avez besoin d'interagir profondément avec les dépôts de code → Choisissez Claude Code ou Codex CLI
Si vous êtes un utilisateur de bureau ordinaire, souhaitant accomplir des tâches de gestion de fichiers et d'organisation d'e-mails en langage naturel → Choisissez OpenCoworker
Si vous avez besoin des deux → Vous pouvez installer les deux et basculer entre eux selon les scénarios

Conclusion et Perspectives

OpenCoworker représente une direction importante dans le développement des agents IA : passer des interfaces de discussion à l'intégration de bureau, et des tâches uniques aux flux de travail autonomes. Soutenu par l'équipe d'Andrew Ng et construit sur le framework open source aisuite, il présente des avantages uniques en matière de protection de la vie privée, de déploiement local et d'automatisation inter-applications.

Cependant, en tant que projet précoce, OpenCoworker fait encore face à certains défis :

Maturité de l'écosystème : Par rapport aux produits commerciaux, l'écosystème de plugins et les ressources communautaires sont encore en construction
Stabilité : L'API et l'expérience utilisateur sont encore en itération, il peut y avoir des problèmes de compatibilité
Coût d'apprentissage : Bien que la GUI réduise le seuil, pour exploiter pleinement son potentiel d'automatisation, une certaine configuration et un certain débogage sont encore nécessaires

Pour les lecteurs de FreeAITool, c'est le bon moment de s'intéresser et d'essayer OpenCoworker. Vous pouvez :

Rejoindre la communauté : Obtenez les dernières actualités et signalez des problèmes via le serveur Discord
Contribuer au code : OpenCoworker accueille les contributions de la communauté, que ce soit pour le développement de fonctionnalités ou l'amélioration de la documentation
Partager l'expérience : Les meilleures pratiques découvertes lors de l'utilisation ou les expériences de difficultés rencontrées peuvent devenir des références précieuses pour les autres

Avec l'évolution continue de la technologie des agents IA, nous avons raison de croire que des assistants de bureau open source comme OpenCoworker deviendront des partenaires de travail quotidiens pour de plus en plus d'utilisateurs dans les années à venir.

Lectures connexes :