Hello à tous,
Bienvenue dans cette 23ᵉ édition de cette Newsletter !
Tu peux cliquer sur le ❤️ juste au-dessus ou en fin de newsletter si ce contenu t’est utile. Ça m’aide beaucoup ! 🙏
Voici le sommaire de la semaine :
💼 IA au travail : Agents vocaux IA, mon retour d’expérience
🗞️ Top 3 actus IA : OpenAI, Perplexity et Cartesia
⚡ Top 3 outils IA : Artisan, 11x et Spinach
🎙️ Lancement d’un podcast sur les solutions IA
⏳ Temps de lecture : 9 min
💼 IA au travail : Agents vocaux IA, retour d’expérience
J’explore régulièrement le sujet des agents vocaux IA, voici 2 précédentes newsletters sur ce sujet :
Il y a peu de temps, j’ai accompagné un client sur l’intégration d’un agent vocal dans son entreprise.
Problème
Son problème est simple : la manière la plus efficace pour lui d’avoir de nouveaux clients est dans la prise de rendez-vous sur des appels clients à froid.
Il est en équipe réduite (moins de 5 personnes), il a 2 options :
soit il passe une journée par semaine pour remplir son agenda, avec un taux de conversion de 2 à 3% → ça prend du temps
soit il recrute et forme quelqu’un qui sera plutôt autour de 1% de taux de conversion au début → ça a un coût ET ça prend du temps
Avec l’IA, une 3ᵉ option est arrivée : appeler sa base de prospects par un agent vocal qui connait tout de son entreprise.
Sur le papier, c’est séduisant ! Où en est-on dans la réalité ?
La techno
Je ne vais pas me repencher sur le fonctionnement d’un agent vocal (voir cette édition par exemple). Voici juste quelques slides qui expliquent les étapes :
J’ai utilisé VAPI pour créer mon agent vocal. Pour créer un agent vocal français, c’est l’outil le plus avancé sur le marché actuellement avec un niveau de personnalisation sur toutes les étapes. Voici le meilleur réglage possible pour un agent vocal FR :
Choix du modèle : GPT-4o mini
Transcript : Deepgram - Nova 2 General
Voix : Cartesia - Helpful French Lady
L’ensemble des technos évoluent et sont de plus en plus précises. Par exemple, GPT-4o mini est beaucoup moins cher, plus rapide et plus précis que ne l’était GPT-3.5 il y a quelques mois.
Les 2 KPI les plus importants (et encore à améliorer) sont le temps de latence (au-dessus de 1500 ms, un humain va intervenir avec un “Allo ?”) et la qualité de la voix.
Attention : l’affichage de la latence sur VAPI est à titre indicatif. Les logs vous donnent la vraie latence. Par exemple, voici ma latence pendant une interaction :
Utiliser un numéro mobile français sur VAPI
Si vous souhaitez faire votre propre agent vocal, il vous faudra un numéro français.
Il y a 2 options sur VAPI pour l’achat de numéro, Twilio ou Vonage. Vonage est le plus rapide (gain de 150ms) mais je n’ai pas eu l’occasion d’acheter des numéros français sur leur site, car ils ne proposent pas des numéros mobiles.
Je vous présente l’option d’achat de numéro français (fixe ou mobile) sur Twilio, il y a plusieurs étapes à suivre :
Créer son compte sur Twilio
Remplir un Regulatory Bundle avec un Kbis de moins 3 mois, une pièce d’identité, et un justificatif domicile. Plus d’explications ici.
Délai de quelques jours pour validation
Faire une demande pour des numéros français par formulaire en remplissant les infos (bien mettre le même type de numéro que sur le bundle)
Délai de quelques jours pour recevoir le numéro
Import ensuite sur VAPI
Vous pouvez aussi tester facilement les call API d’appels avec un numéro américain sur Twilio.
Itérer sur votre agent vocal
Rapidement, je vous conseille de commencer à faire vos premiers appels. Vous allez avoir de la matière sur ce qui fonctionne et ne fonctionne pas pour continuer d’améliorer votre agent, et surtout les instructions. Cela permettra de :
répondre aux cas particuliers
savoir à quel moment il doit raccrocher
s’il doit réaliser un transfert d’appel
paramétrer le message vocal
etc
Tout est enregistré, et vous pourrez aussi mener des analyses qualitatives en ré-écoutant les échanges avec votre agent.
Cas concrets réalistes
Pour l’instant, il n’est pas possible de tout faire.
Pour des appels sortants à chaud, c’est intéressant dans les cas suivants :
post-formulaire sur un funnel inbound paid ou organic → qualification du lead
post-actions sur un site web (type panier abandonné) → relance du client
cleaning d’une base mail (appel à 0,1€ la min) donc autour de 0,03€ par appel → enrichissement CRM
Pour des appels entrants, il y a beaucoup de possibilités :
récupération d’informations
identification du niveau d’urgence de l’appel
routing (similaire à un standard)
réponse à des questions basiques (particulièrement en dehors des horaires de travail, 24/7, week-ends inclus)
La prise de rendez-vous automatique
Au sein de VAPI, on peut facilement créer des actions :
on envoie des éléments de la conversion à un scénario Make avec un webhook
Le scénario Make renvoie une réponse à l’agent vocal
L’agent vocal utilise les informations pour répondre au client
L’étape ultime pour un agent vocal est la prise de rendez-vous dans l’agenda de la personne référente. Pour cela, un scénario Make peut faire l’appel, mais avoir un système complet et intelligent demande un niveau de complexité élevé :
Par exemple, souvent il sera nécessaire de :
vérifier la disponibilité sur la date proposé. Si ce n’est pas possible, il faudra chercher un créneau le plus tôt possible dans les prochains jours
prendre en compte que les créneaux à prendre respectent les horaires de travail de l’entreprise et exclure le week-end
avoir un délai minimum de 24h entre la demande et la prise de rendez-vous
ajouter un délai de 10 minutes entre les rendez-vous de 30 minutes
Voici par exemple un scénario Make avec l’ensemble de ces caractéristiques :
Avec un fonctionnement asynchrone, l’agent vocal pourra tenir au courant l’utilisateur de l’avancée des actions du type :
“Je vérifie si ce créneau est disponible”
“Le créneau n’est pas disponible, mais je cherche une prochaine disponibilité”
“Ce créneau est possible, est-ce que cela vous conviendrait ?”
Cette prise de rendez-vous avec un agent est beaucoup plus simples sur un appel entrant sur du support.
Par exemple, le numéro entrant permet d’identifier l’utilisateur grâce à son numéro de téléphone et de récupérer les informations nécessaires pour une prise de rendez-vous (adresse mail, responsable du compte, timezone, …)
Démo en live
Voici une petite vidéo qui vous montre le résultat en termes de latence et la qualité de la voix avec la présentation d’un petit process d’automatisation depuis Google Sheets.
Côté anglophone, la voix est d’un meilleur réalisme et permet d’avoir des résultats très satisfaisants, voici quelques exemples de situations réelles que j’ai récupérés :
Conclusion
Pour l’utilisation d’un agent vocal pour mon client, c’est encore trop tôt. Mais, les tests ont permis de définir les instructions pertinentes, la phrase d’accroche qui fonctionnait, le setup, le coût, … jusqu’à attendre l’amélioration de la techno sur la voix.
Pour lui faire gagner du temps sur sa base de prospects, j’ai transformé l’agent vocal en un assistant de priorisation des leads en fonction du résultat de l’appel.
Cela lui permet d’analyser une liste de 1 000 numéros fixes et d’avoir, en moins de 2h, une catégorisation pour chaque numéro pour un coût total d’environ 30€, pour une mise à jour de son CRM.
Ainsi, il peut savoir sur quel numéro il a bien le décisionnaire, les numéros répondus, les faux numéros, les standards, …
🗞️ 3 actus importantes
Levée de fonds en cours pour OpenAI ? Valorisation > 100 milliards
OpenAI est en discussions avancées pour lever plusieurs milliards de dollars dans une nouvelle levée de fonds, qui pourrait la valoriser à plus de 100 milliards de dollars. Thrive Capital, une société de capital-risque, est à la tête de cette levée de fonds, avec un investissement estimé à environ 1 milliard de dollars. Microsoft, est également attendu dans ce tour de table.
Cette nouvelle levée de fonds renforcerait la position d’OpenAI dans un secteur où la concurrence est féroce, notamment avec Google, Amazon et Meta.
Les fonds supplémentaires devraient soutenir les efforts d'OpenAI pour maintenir son avance technologique et poursuivre le développement de systèmes d’intelligence artificielle toujours plus performants.
👉 Source
Jared Friedman, Partner à Ycombinator, prévient que ce n’est que le début ! Même si le délai d’explosion des plus grosses entreprises du secteur devrait être plus courte, au vu de la rapidité d’adoption et d’exécution.
Perplexity se tourne vers la publicité pour monétiser son moteur de recherche
Je sais qu’il y a beaucoup d’utilisateurs de Perplexity (c’est l’une des vidéos qui a le mieux fonctionné sur YouTube), la startup prévoit de lancer des publicités sur son application dès le quatrième trimestre 2024. Cette initiative survient après des mois de controverse autour d'accusations de plagiat, incitant l'entreprise à améliorer la citation des sources dans ses réponses.
L’objectif est de trouver un modèle économique durable pour faire payer les utilisateurs et rémunérer les annonceurs.
Pour l’instant, la majorité de ses revenues devraient provenir des abonnements. L’API reste très cher pour une utilisaiton intensive.
Cartesia avance avec des améliorations de modèles
Il y a 3 jours, Cartesia (l’outil utilisé pour générer la voix d’un agent vocal) annonçait l’amélioration de ses modèles et partage :
Edge, une bibliothèque open-source conçue pour faciliter le développement de modèles ultra-efficaces sur les appareils locaux
Rene, un modèle de langage de 1,3 milliard de paramètres optimisé pour une utilisation sur appareil
Sonic On-Device, un modèle de voix générative en temps réel, promettant des applications plus réactives et sécurisées
En bref, je tenais à souligner la rapidité de développement des technos promettant un belle avenir pour les agents vocaux : ça bouge vite.
👉 Source : Cartesia AI
⚡ 3 outils IA (optimistes ?)
Je n’ai pas testé ces 3 outils IA mais je trouve leur proposition de valeur intéressante. Je ne pense pas qu’il soit au niveau, mais le ton est donné.
Artisan : automatisation BDR
Solution d'automatisation d’appels sortant, l’outil se distingue par son assistante virtuelle Ava, capable de gérer jusqu'à 80 % des tâches manuelles des équipes BDR. Artisan simplifie la prospection avec une base de données B2B de plus de 300 millions de contacts et propose des playbooks d'IA personnalisables.
Automatisation de la recherche, de l'enrichissement des données et la rédaction d'e-mails, l’outil permet aux équipes de se concentrer sur les interactions à forte valeur ajoutée.
11x.ai :
11x.ai propose la même chose qu’Artisan.co. Mais ils ont récemment sorti un agent vocal IA “Jordan”.
L’idée est de pouvoir déléguer la prospection téléphonique à leur agent vocal et de suivre la performance de l’agent via des analyses avancées.
Fonctionnement ininterrompu, 24h/24 et 7j/7
Spinach.io
Outil de gestion de projet alimenté par l'IA qui transforme vos réunions en une expérience plus productive et organisée. Assez classique sur la partie prise de notes pendant les réunions, génération des résumés détaillés, en capturant les points clés et les décisions.
L’outil souhaite aller plus loin dans l’organisation de la réunion : génération d’un agenda, répartition du temps de parole, optimiser la collaboration, …
🎙️ Lancement d’un podcast IA
Cela fait un petit moment que je travaille sur la création d’un podcast IA.
L’objectif : avoir le retour d’expérience d’entrepreneurs avancés sur l’IA
Format du podcast
Le podcast se déroule en 3 parties, pour une durée totale de 30 à 45 minutes :
Cas concrets d'utilisation (20 min) : exemples réels, retours d'expérience et gains concrets liés à l'utilisation de l'IA.
Point de vue sur l'IA dans le domaine d'expertise de l'invité (10 min) : exploration du marché de l'IA et la vision de notre invité dans son secteur.
Questions détente et actualités (5 min) : des questions plus décontractées pour terminer.
Objectifs et contenu
Ce podcast vise à offrir des insights précieux sur l'utilisation concrète de l'IA dans différents secteurs. L’idée est d’aller au-delà de la théorie pour vous présenter des cas d'usage réels et des retours d'expérience d'entrepreneurs qui ont su tirer parti de l'IA pour innover et se démarquer.
Diffusion
Le podcast sera disponible en :
Format vidéo sur YouTube
Format audio sur les principales plateformes de podcast
Je devrais sortir le 1ᵉʳ épisode autour de mi-septembre toutes les 2 semaines et faire un 1ᵉʳ jet d’une dizaine d’épisodes.
Invités confirmés
J’ai déjà eu la confirmation de plusieurs invités en restant dans les domaines marketing, sales et operations : Pimento (marketing), Meero (marketing), Cargo (sales), Partoo (sales), Brut (marketing), Ipsos (marketing).
Peu de temps avant l’enregistrement, j’ouvrirais un thread sur la communauté pour recueillir vos questions à poser à l’intervenant.
Je serai ravi d’avoir votre avis ! Est-ce qu’il y a des invités que vous aimeriez voir participer à ce podcast ? des thématiques à aborder ? ou des suggestions pour améliorer le format ?
Merci 🫶🏼
D’avoir lu cette édition jusqu’au bout.
Si ça t’a plu, pense à cliquer sur le ❤️ juste en dessous et partage ton point de vue en commentaire👇🏼
Voici 3 façons simples d'aller plus loin :
Rejoindre la communauté IA pour avancer en continu (toutes mes ressources sont en accès libre)
Prendre un rendez-vous ici (gratuit) pour qu'on puisse vous aider sur vos projets
Découvrez mes vidéos Youtube, et mes précédentes éditions.
Dernière chose, si vous avez une question, n'hésitez pas à me l'adresser par retour de mail.
À très vite !
Salut malheureusement la voix en français c'est pas encore cela , beaucoup plus quali en anglais, et temps de latence trop important je trouve pour du test reel
Pour le numéro mobile Francais chez Twilio, tu l'as réellement fait, ou tu t'es contenté de littérature sur internet ?
Je pose la question car ils ne font plus les numéros mobiles français depuis longtemps. J'ai contacté le service client à plusieurs reprises et à chaque fois la réponse est la même: "impossible".
Je suis surpris et curieux de ta réponse, merci :)