Votre agent IA pour naviguer sur le web et réaliser des tâches pour vous
+ je crée l'Operator d'OpenAI pour 0€
Hello à tous,
Bienvenue dans cette 45ᵉ édition ! On a dépassé la barre des 7 000 abonnés, merci ! 🙏
Vous pouvez cliquer sur le ❤️ au-dessus ou en fin de newsletter si vous appréciez le contenu, ça m’aide beaucoup ! 🙏
Voici le sommaire de la semaine :
💼 Créer son agent IA et réaliser des actions sur internet
🗞️ 3 actus : Eleven Labs lève 250M $, Operator d’OpenAI et l’avenir des devs
📹 YouTube : Top 12 des outils IA
⏳ Temps de lecture : 7 min
💼 Créer son agent IA et réaliser des actions sur internet
Un petit exemple de ce que l’on va faire dans cette section : trouver un vol sur Kayak de Zurich à Pékin. À droite, on voit l’analyse du modèle d’IA et les décisions prises.
Avant de vous partager le tutoriel pour créer un agent IA qui navigue pour vous sur Internet, comme on va utiliser Deepseek comme modèle IA, je tenais à revenir sur l’impact de ce nouveau modèle pour l’écosystème :
Pourquoi l’arrivée de DeepSeek change autant de choses ?
C’est devenu un véritable phénomène (app mobile la plus téléchargée dans le monde (!!)), Deepseek rivalise avec les meilleurs LLM du marché, en étant gratuit et open-source.
Que ce soit son modèle V3 (comparable à gpt-4o) ou R1 (comparable à o1)
DeepSeek n’est pas seulement performant, c’est surtout une alternative pour les développeurs qui souhaitent exploiter l’IA à un coût accessible. Le modèle est 30 fois moins cher par API, avec aucun rate limit.
Son impact est tel que plusieurs plateformes de recherche comme Perplexity l’ont intégré directement dans leurs services.
Rapide comparaison avec OpenAI
La performance étant similaire, Deepseek se distingue sur plusieurs points :
coût : l’outil est gratuit - 0€ - nada
rapidité d’exécution
transparence totale de la chaine de pensée du modèle de raisonnement R1 (en anglais)
exécution possible de code dans l’interface (similaire à l’artefact de Claude)
l’outil est aussi plus biaisé qu’OpenAI, surtout sur des sujets politiques
La suite après Deepseek
Ce qui change, c’est donc que l’on se dirige toujours plus vers une commodisation des modèles IA (c’est la norme, à faible coût) et que l’applicatif derrière sera clé.
L’IA ne sera presque plus un coût. Elle sera partout, intégrée dans chaque app, chaque site, chaque entreprise…
Tout repose désormais sur qui construira la meilleure interface et le meilleur applicatif pour déléguer efficacement du travail à l’IA.
Operator avec Deepseek
On parlait d’applicatif, et ça tombe bien puisqu’on va utiliser ce modèle avec une solution opensource pour reproduire Operator d’OpenAI
Pour rappel, Operator c'est la 1ʳᵉ version d’un agent IA d’OpenAI, capable de se rendre sur internet pour réaliser des actions venant de vos instructions. Non disponible en France et sinon payant à 200€/mois.
L’idée est d’utiliser BrowserUse, un outil permettant à une IA d’interagir avec des interfaces web de manière autonome, et de le coupler avec DeepSeek comme moteur de raisonnement.
Ensemble, ces deux solutions permettent de créer un agent IA capable de naviguer sur le web, exécuter des actions complexes, et automatiser des tâches sans intervention humaine.
(BrowserUse est d’ailleurs aussi puissant qu’Operator.)
Ce système est idéal pour ceux qui souhaitent automatiser des process comme :
La recherche d'informations avancée sur le web
L'interaction avec des applications SaaS
L'exécution de tâches administratives répétitives
La collecte et l'analyse de données en temps réel
Bref, beaucoup de cas d’usages.
Voici les étapes que j’ai suivi, partagées dans le repo sur ce lien. C’est la version avec interface. Sinon il est possible de lancer l’agent sans interface, directement via une ligne de commande.
Installer et configurer BrowserUse
Faire un git clone de ce repo : https://github.com/browser-use/web-ui
Suivre les instructions : installer les dépendances et playwright (similaire à Selenium) permettant l’automatisation d’actions sur le web.
Intégrer DeepSeek comme moteur IA
Avec BrowerUse, vous pouvez choisir le modèle IA que vous souhaitez. Je vous conseille de passer par Deepseek pour plusieurs raisons :
le coût de l’API est beaucoup beaucoup moins cher
il n’y a pas de rate limit
son modèle V3 est l’un des meilleurs du marché
Il est nécessaire de mettre la clé API de Deepseek dans son fichier .env
Pour installer BrowserUse, vous pouvez utiliser Cursor afin qu’il vous aide à suivre les étapes d’installation et corriger les erreurs si besoin.
Démo pour lancer l’agent IA
Vous pouvez ensuite lancer l’agent en local depuis la ligne de commande suivante :
python webui.py --ip 127.0.0.1 --port 7788
Cela me permet d’avoir accès à une interface où je peux configurer quelques paramètres, dont la possibilité de lancer l’agent sur mon propre navigateur (avec les cookies et accès aux outils que j’utilise).
Je peux mettre mon prompt directement sur l’interface et lancer mon agent
Voici un rapide exemple avec l’achat d’un livre sur Amazon
Le livre a bien été acheté, j’ai dû annuler la commande 😅
Pour finir,
J’espère que vous avez apprécié cette approche pour ceux qui cherchent à développer des solutions IA autonomes, et automatiser des tâches sur des interfaces.
Je vous invite à tester cette solution et créer votre propre Operator IA, vous allez voir c’est bluffant !
🗞️ 3 actus importantes
ElevenLabs lève 250M$ pour l’IA vocale
La startup ElevenLabs, spécialisée dans la synthèse vocale par IA, a bouclé un tour de table de 250 millions de $, portant sa valorisation autour de 3,3 milliards.
Fondée en 2022, ElevenLabs a rapidement émergé comme un acteur clé du secteur, avec des solutions avancées de text-to-speech, clonage vocal et traduction audio utilisées par des géants comme The Washington Post, HarperCollins et Synthesia. Son ARR est passé de 25M$ en 2023 à environ 90M$ fin 2024, illustrant une forte adoption par les entreprises.
Malgré des controverses liées à l’usage frauduleux de ses voix IA, ElevenLabs a renforcé ses garde-fous pour assurer une utilisation éthique de sa technologie. Avec cette nouvelle levée, l’entreprise ambitionne d’accélérer son développement et de consolider sa position face aux grands acteurs comme Google et OpenAI.
👉 Source
OpenAI dévoile Operator : un agent IA capable d’utiliser un ordinateur comme un humain
OpenAI a présenté Operator (mention dans la section précédente) une nouvelle IA qui peut naviguer sur le web et interagir avec des interfaces graphiques comme un humain, sans passer par des API spécifiques.
Au cœur de cette techno, on a Computer-Using Agent (CUA), un modèle combinant la vision de GPT-4o et un apprentissage par renforcement avancé.
L’agent peut cliquer, taper et interagir avec des sites et logiciels en analysant l’écran via des captures d’image.
Il sait diviser une tâche en plusieurs étapes et s’auto-corriger face aux erreurs.
Sur des benchmarks d’utilisation d’ordinateur, CUA atteint 38,1 % de succès contre 72,4 % pour un humain.
Pour les tâches web, il affiche un taux de réussite de 87 % sur WebVoyager et 58,1 % sur WebArena → voir graphique plus haut
🚨 Il y a un gros sujet sur la sécurité avec des confirmations utilisateur pour les actions sensibles, des refus sur certaines tâches (comme les transactions bancaires) et un filtrage.
Operator reste disponible en test pour les utilisateurs Pro aux États-Unis. Cette situation devrait évoluer très prochainement.
Zuckerberg prévoit que l'IA remplacera les ingénieurs de niveau intermédiaire dès cette année
Lors d'une récente interview, Mark Zuckerberg, PDG de Meta, a déclaré que l'IA pourrait remplacer les ingénieurs de niveau intermédiaire dès 2025. Il estime que l'IA sera capable d'effectuer des tâches de programmation, nous permettant de se concentrer sur des problèmes plus complexes et créatifs.
D'autres géants tech, comme Google, ont également commencé à intégrer l'IA dans leur département tech.
Bien que cette transition puisse entraîner des coûts initiaux élevés, les entreprises espèrent que le recours au code généré par l'IA deviendra plus efficace avec le temps.
Ce qu'il faut retenir : Cette tendance souligne l'importance pour les entreprises de se préparer à l'intégration de l'IA dans leurs processus de développement, en envisageant une réallocation des rôles et des compétences au sein de leurs équipes techniques.
👉 Source : forbes.com
📹 Le top 12 des outils IA
Vous avez été nombreux à apprécier la newsletter sur les outils IA, je tenais donc à vous prévenir de la sortie de la vidéo sur ma chaine YouTube présentant les outils.
Merci 🫶🏼
D’avoir lu cette édition jusqu’au bout.
Si ça t’a plu, pense à cliquer sur le ❤️ juste en dessous et partage ton point de vue en commentaire👇🏼
Vous pouvez aussi partager la newsletter à votre entourage (ça me booste beaucoup 🙏) et gagner des cadeaux 🎁
1 parrainage = 1 hack personnalisé
3 parrainages = +400 outils IA triés par thématique et vertical métier
5 parrainages = 30 min de coaching sur votre problématique
À très vite !
Un des développeurs IA qui a teste me dit que l'API Deepseek n'est pas stable, tu n'as pas eu de soucis de ton cote sur un usage plus intensif ?
Merci Louis, tous tes contenus sont toujours d'excellentes qualités, tes sujets et contenus nous apportent beaucoup, tu donnes beaucoup de cas d'utilisation très concrets et pratiques, accessoirement, je suis ta formation "IA en entreprise", je recommande à tous ceux qui veulent comprendre et progresser en IA. Ah j'oubliais, tes podcasts sont tops pour ceux qui ne connaissent pas !