Créer du contenu vidéo 100% automatisé avec l'IA
+ 📝 Dossier : bulle de l'IA, mythe ou réalité ?
Hello à tous,
Bienvenue dans cette 19ᵉ édition de cette Newsletter !
Tu peux cliquer sur le ❤️ juste au-dessus ou en fin de newsletter si ce contenu t’est utile. ça m’aide beaucoup ! 🙏
Voici le sommaire de la semaine :
💼 IA au travail : créer du contenu vidéo avec l’IA
🗞️ 3 actus importantes : commoditisation des LLM, Perplexity et les annonceurs ..
⚡ 3 outils de productivité : SendSpark, Pygma et AI Studio, Midjourney
📝 Dossier de la semaine : Bulle de l’IA, mythe ou réalité ?
⏳ Temps de lecture : 12 min
💼 IA au travail : Créer du contenu vidéo avec l’IA depuis un texte brut
Générer des vidéos avec l’IA, ce n’est pas nouveau, il y a pleins d’outils qui se développent et on pourra bientôt faire de belles choses avec Luma, Runway, Kling, Sora, ..
Mais actuellement, le challenge est la création d’un contenu vidéo cohérent sur un thème précis, et lié à son marché. Il y a plusieurs étapes qui sont assez longues comme la création d’un script de l’histoire, un script pour chaque scène, générer les scènes en vidéo, l’audio pour présenter les scènes, etc.
L’objectif de cette section est de vous montrer un process qui fonctionne, les outils que j’utilise et le rendu final. Si le sujet vous intéresse, la vidéo qui présente ce process sortira dans 1 semaine.
Je crois beaucoup en un système complet de création de contenu avec l’IA 100% automatisé, en partant d’un format de texte brut pour générer tous les formats de contenu, optimisé en fonction des réseaux.
La grosse difficulté est de pouvoir réaliser l’ensemble de ce process en automatisé.
Structurer votre base de données (ici Airtable)
Dans cet exemple, j’ai pris un article du Monde sur le réseau social X.Je partage les paragraphes de l’article dans une cellule d’un tableau sur Airtable (similaire à Gsheets ou Notion).
L’idée est d’agréger dans des onglets l’ensemble des informations qui vont être générés par les outils.
Sur Airtable, ma base de données est structurée en 3 tableaux importants qui correspondent à 3 étapes :
la création de l’histoire
la création des scènes
la génération des scènes
Ces 3 tableaux vont agir comme des vases communiquants et suivre un process linéaire. On passe de la création de l’histoire, à la création des scènes puis à la génération des scènes. Les différentes étapes d’automatisation sont déclenchées en fonction de la valeur des celulles.
1/ La création de l’histoire
La colonne “Source” permet d’ajouter la base d’informations utile pour la génération du script (mes paragraphes de l’article du monde). La colonne “Histoire” sera alors complété par chatGPT grâce à un prompt optimisé dans la création d’une histoire avec le titre, l’introduction, etc
Pour l’automatisation, la création de l’histoire se fait en 2 étapes avec le module d’OpenAI :
La création du script de l’histoire
La création du script de chaque scène de l’histoire
Pour les scènes, on va générer plusieurs prompts qui viennent décrire les scènes qui seront générées ensuite avec un outil de génération d’images.
L’ensemble des prompts des scènes sont stockés sur airtable dans le tableau “scènes”.
2/ La création des scènes
Les scènes sont regroupées par l’ID de l’histoire. C’est à cette étape que l’on va générer chaque scène avec le module Leonardo. Pour chaque scène, on va créer 3 images ou 3 images animées qui seront affichées dans la colonne “Vidéos”.
Côté automatisation, d’abord on va générer une image pour chaque scène, puis va ensuite transformer cette image en une image animée de plusieurs secondes. On aurait aussi pu se contenter d’une image par scène.
3/ La génération des scènes
Au fur et à mesure, les scènes sont générés par Leonardo et sont affichées dans notre base de données.
Générer l’audio avec Eleven Labs et assembler les scènes
Avant d’assembler le résultat de chaque scène pour avoir une vidéo, on va générer un audio grâce à Eleven Labs qui va venir décrire chaque scène : en gros, une voix off qui commente chaque passage.
Pour cela, Eleven Labs est un outil parfait, on peut choisir le type de voix que l’on souhaite et même sa propre voix (en la clonant).
Côté automatisation, on va donc créer l’audio de chaque scène depuis un texte stocké dans la base de données qui correspond à la scène en question, puis on stocke cet audio sur Google Drive pour le mettre en accès libre (lien public) sur Airtable.
Cela correspond à la branche de dessus.
Pour la branche en dessous, cela correspond à l’assemblage de toutes les scènes pour créer une vidéo. On utilise l’outil Json2vidéo qui permet de transformer un Json en une vidéo.
La dernière étape d’assemblage final
Une fois que l’on a l’audio et la vidéo de chaque scène, on va réaliser l’assemblage final et stocker le résultat sur notre base de données.
Côté automatisation, cela correspond à 2 branches puisqu’on doit d’abord faire la fusion de l’audio et la vidéo de chaque scène, avant de faire l’assemblage de chaque vidéo des scènes contenant l’audio et la vidéo.
C’est donc la dernière branche qui fait l’assemblage de toutes les vidéos de chaque scène pour obtenir la vidéo complète.
Et voici le rendu final : (étant donné que j’utilise Json2vidéos en gratuit, il y a la présence de watermark qui gache un peu le rendu).
Que pensez-vous du résultat ? très curieux d’avoir votre avis.
Voici l’automatisation complète sur Make :
Pourquoi je vous partage ça ?
Je trouve que c’est une bonne occasion de vous montrer ce qu’il est possible de faire avec l’IA, en 100% automatisé, depuis un texte brut.
On pourrait imaginer une création respectant votre branding, vos illustrations depuis un article de blog par exemple.
Les possibilités sont énormes et on part d’une base qui offre une grosse personnalisation sur la création
changer le type d’histoire
changer le format
changer la voix / la langue / etc
ajouter de la musique via Suno par exemple
créer du contenu sur la base d’un simple url en intégrant perplexity (j’en parle de ma précédente newsletter)
publier sur les réseaux en 1 clic
Si vous avez des questions et souhaitez ce type de process, n’hésitez pas !
Et si vous appréciez ce contenu, n’hésitez pas à le partager ou à vous abonner 👇
🗞️ 3 actus importantes
Claude et Perplexity : Le scraping intensif soulève des inquiétudes chez certains sites et médias
Les pratiques de scraping agressif d'Anthropic (créateur de Claude) et de Perplexity suscitent des critiques croissantes dans l'industrie tech. Freelancer.com et iFixit ont notamment dénoncé le non-respect de leurs protocoles anti-crawling par Anthropic :
Anthropic aurait effectué 3,5 millions de visites en 4 heures sur Freelancer.com
Le bot d'Anthropic aurait ignoré les termes d'utilisation d'iFixit, scrapant le site un million de fois en 24h
Ces pratiques ralentissent les sites et impactent leurs revenus
Parallèlement, de nombreux médias ont bloqué les bots de Perplexity, c’est le cas en France du média Le Monde par exemple. L’entreprise a annoncé un nouveau modèle économique pour apaiser les tensions :
Monétisation via des questions sponsorisées sous les réponses de recherche
Partage des revenus publicitaires avec les éditeurs dont le contenu est utilisé
Accès gratuit à l'API de Perplexity pour les éditeurs partenaires
Ce qu'il faut retenir : Ces controverses illustrent les défis éthiques et légaux du scraping pour l'entraînement des IA. Perplexity n’est donc plus à jour sur de nombreux médias français.
👉 Source Techopedia / Source Fast Company / Source de Perplexity
Les géants de la tech poussent-ils à la commoditisation des LLM ?
Meta a récemment open-sourcé Llama 3.1, rivalisant avec ChatGPT d'OpenAI. Cette stratégie, adoptée par d'autres géants technologiques, pourrait avoir des implications majeures pour l'industrie de l'IA comme :
Démocratisation des LLM : presque toutes les entreprises peuvent désormais intégrer gratuitement des modèles puissants
Commoditisation potentielle des LLM, réduisant leur valeur marchande directe
Augmentation de la demande pour les infrastructures serveurs par exemple
Pression accrue sur les startups IA spécialisées dans les LLM pour trouver un business model (OpenAI, Anthropic, ...)
Ce qu'il faut retenir : Cette tendance à l'open-source des LLM par les géants technologiques pourrait redéfinir le paysage concurrentiel de l'IA.
OpenAI lance un chatbot vocal interactif propulsé par GPT-4o
OpenAI dévoile un nouveau chatbot IA doté de capacités vocales avancées, marquant une évolution majeure dans le domaine des assistants virtuels :
Propulsé par le modèle GPT-4o, combinant voix, texte et vision
Capacités de conversation naturelle et fluide, avec compréhension des nuances vocales
Disponible initialement pour un groupe restreint d'abonnés ChatGPT Plus, puis pour tous à l'automne
Mesures de sécurité renforcées : voix préenregistrées, filtres anti-contenu illégal ou nuisible
Fonctionnalités futures prévues : partage d'écran et résolution de problèmes visuels
Ce qu'il faut retenir : Cette avancée d'OpenAI vers des agents IA plus complets et naturels pourrait redéfinir nos interactions avec les assistants virtuels. Cette annonce pourrait débloquer des cas d’utilisations d’OpenAI.
👉 Source : MIT Technology Review
⚡ 3 outils de productivité
Sendspark : Dans un post LinkedIn, je parlais de cet outil qui permet de générer des vidéos personnalisées pour des prises de contact avec une personnalisation dans le script de l’avatar et sur le scroll du site internet. Très efficace dans des campagnes mailings pour booster son taux de réponse. Voici le résultat :
Pygma : La promesse de Pygma : devenir votre community manager IA en analysant votre profil (Instagram par exemple), suggérant des idées de contenu et allant jusqu’à la production de contenu pour vous. Très intéressant, mais en parallèle, Meta a lancé AI Studio pour créer votre propre chatbot IA pour ses réseaux sociaux (Instagram, Messenger, WhatsApp). L’idée est d’apporter aux créateurs des outils personnalisés pour répondre automatiquement, gérer les interactions, créer des jeux de rôle. C’est un peu une extension virtuelle d’un compte.
Ces 2 solutions permettent de créer des opportunités d’engagement pour les créateurs de contenu. À voir comment ça peut s’intégrer dans une stratégie de communication
Midjourney : La version 6.1 est maintenant disponible et est prometteuse. La version 6.2 est prévue pour fin août. Concrètement, il y a une plus grande cohérence (sur les corps, les animaux, les plantes), une précision améliorée (détails plus fins, textures réalistes, génération de texte optimisée), une réalisation plus rapide (+25%) et des nouvelles options comme la commande --q2 pour privilégier la qualité sur la cohérence du prompt. Voici un exemple :
📝 Dossier de la semaine : La bulle de l’IA Mythe ou Réalité ?
Avec des investissements qui explosent sur le secteur de l’IA et de nombreuses entreprises qui se lancent sur des verticales métiers intégrant l’IA dans leur solution, le débat commence à naître : sommes-nous au bord d'une bulle de l'IA, similaire à la célèbre bulle des dot-com des années 2000 ?
L’idée est d’éxaminer les similitudes et les différences entre ces deux phénomènes, tout en évaluant les risques et les opportunités actuels du marché de l'IA.
Le contexte historique
Pour comprendre la situation actuelle, il est essentiel de revenir sur la bule internet :
Fin des années 90 : Explosion des investissements dans les entreprises liées à Internet.
2000 : Plus de 300 entreprises Internet entrent en bourse.
2001-2002 : Éclatement de la bulle, entraînant une perte de plusieurs milliers de milliards de dollars de capitalisation boursière. (78% de perte pour le Nasdaq)
Plus de 50% des entreprises Internet créées entre 1996 et 2000 ont fait faillite avant la fin de 2004, incluant des entreprises emblématiques.
La croissance exponentielle de l’IA
L'IA connaît une croissance exponentielle depuis le lancement de ChatGPT en novembre 2022, marquant ce que certains appellent "le moment iPhone de l'IA" / “le nouveau internet”. Voici quelques points clés depuis novembre 2022 :
Des investissements massifs : L’ensemble des géants de la tech comme Microsoft, Google et Nvidia investissent des milliards dans le développement de l'IA. La majorité des entreprises explosent leur budget alloué à l’IA.
Des valorisations élevées : Les entreprises liées à l'IA, comme Nvidia, ont vu leur valeur boursière grimper en flèche.
À ce sujet, je vous invite à découvrir cete vidéo sur l’analyse financière d’une bulle de l’IA ou pas.
Une adoption rapide : ChatGPT a atteint 100 millions d'utilisateurs en seulement deux mois, surpassant le rythme d'adoption de technologies précédentes.
Bref, de nombreux signaux faibles qui montrent une ruée vers l’IA, des investissements et valorisations en lien avec parfois des attentes énormes sur le sujet de la part des dirigeants.
Les points de similitudes avec la Bulle Dot-Com
Alors forcément, il y a plusieurs aspects qui rappellent la bulle internet il y a une vingtaine d’années comme l’enthousiasme des investisseurs, l’intérêt accru des VC et des records de levées de fonds pour des entreprises qui sont encore en développement et en recherche de business model.
C’est le cas par exemple de Perplexity qui a levé 250 millions de $ pour 3 milliards de valorisation ou Mistral AI avec 640 millions de $, alors même que les entreprises n’ont pas encore un business model établi.
Les promesses de transformation de la techno, présenté comme révolutionnaire et capable de transformer tous les secteurs, peuvent être similaire à la bulle internet. Pour l’instant, dans de nombreux cas, la techno n’est pas à la hauteur des attentes trop élevés et les cas d’utilisations sont plus limitées, même si ça continue d’évoluer très vite.
Mais des différences existes
Alors que la plupart des enteprises dot-com n’avaient pas de modèles économiques, beaucoup d’entreprises IA génèrent d’importants revenus et décident de ne pas lever des fonds (ou dans des bonnes conditions). Cela montre la résolution de certaines problématiques fortes côté utilisateurs. Et des valorilisations qui n’ont pas le même ordre de grandeur que sur la bulle internet.
Côté infrastructure, beaucoup d’investissements sont réalisés et le niveau de maturité est beaucoup plus élevé que ce qu’il y avait dans les années 90. Dans ces années là, la connexion entre le réseau principal et les utilisateurs finaux, était un goulot d'étranglement majeur et cela a conduit à des business models irréalistes et pas viable, provoquant une correction brutale du marché.
Contrairement aux années 90, l’environnement économique est marquée par une inflation plus élevée et une croissance économique plus modérée.
Pour l’instant, il est tôt et difficile de comparer les 2 cycles économiques et il y a encore pas mal d’incertitudes comme :
La surestimation des capacités : le risque toujours présent de surévaluer les capacités actuelles de l’IA
Où est-ce que l’on se situe actuellement sur la courbe d’innovation technologique de Gartner ? Est-ce que l’on a déjà passé le pic des attentes ?
Les enjeux éthiques et réglementaires : des questions sur la confidentialité, les biais algorithmiques et la réglementation restent à résoudre. Même si l’AI act européen tente de définir un cadre, cela peut aussi avoir des conséquences négatives comme la non-commercialisation des lunettes Meta sur le marché européen, et donc de priver certains marchés d’avancés technologiques. Cela pourrait refroidir d’autres organisations d’imposer un cadre aux géants technologiques.
Le sujet de la consommation énergétique : les modèles d'IA actuels sont énergivores. C’est un sujet peu mentionné mais cela pourrait limiter leur scalabilité.
En bref, entre bulle et évolution durable
Même si certains signes rappellent la bulle dot-com, l'écosystème IA semble plus mature, mieux préparé, plus sain même si certaines dérives mineurs peuvent faire penser à une bulle.
Pour l’instant, c’est plutôt une transformation technologique fondamentale, comparable à l'avènement d'Internet, qu’un phénome qui risque de disparaitre.
L'IA a le potentiel de remodeler notre monde, mais comme toute technologie révolutionnaire, et elle nécessite une approche équilibrée entre optimisme et prudence.
Merci 🫶🏼
D’avoir lu cette édition jusqu’au bout.
Si ça t’a plu, pense à cliquer sur le ❤️ juste en-dessous et partager ton point de vue en commentaire👇🏼
Vous pouvez aussi partager la newsletter à votre entourage et gagner des cadeaux 🎁
1 parrainage = 1 hack personnalisé
3 parrainages = +400 outils IA triés par thématique et vertical métier
5 parrainages = 30min de coaching sur votre problématique
À très vite !
C’est fou de voir à quel point l’IA peut transformer le processus créatif ! Automatiser la création vidéo permet de se concentrer sur l’essentiel : l’inspiration et l’impact.
C’est ce genre de contenu qui me pousse à continuer, merci pour le partage.