AIGC如何商业化?To B仍是主要商业模式

Comment monétiser l’AIGC ? Le modèle B2B reste le principal modèle commercial

BroadChainBroadChain29/01/2023 10:44Originale
Ce contenu a été traduit par IA
Résumé

L’intégration de l’AIGC avec le Web3 et son incorporation au sein des communautés permettent de réduire le seuil de création pour les utilisateurs, renforcent l’interaction et le développement communautaires, et diminuent les coûts de contenu pour les plateformes.

Synthèse

Dans notre premier rapport détaillé sur l'AIGC l'an dernier, « AIGC : Un outil de productivité pour l'ère Web3 », nous avions analysé les bouleversements technologiques et les impacts sectoriels de cette innovation. Depuis l'explosion de ChatGPT, une question est sur toutes les lèvres : quel est le modèle économique de l'AIGC ? Comment se monétise-t-il ? Nous avons interrogé des dizaines d'équipes spécialisées, en Chine et à l'international. Début janvier, Microsoft a par ailleurs officialisé un partenariat stratégique avec OpenAI, intégrant l'IA à sa suite logicielle et proposant aux développeurs le service cloud Azure OpenAI pour créer leurs propres applications. L'aube de l'AIGC se lève ; cet article se penche précisément sur sa voie vers la commercialisation.

L'AIGC transforme les modèles économiques : l'IA se « matérialise ». Grâce aux progrès du traitement du langage naturel (NLP) qui rendent l'IA plus accessible, et à l'amélioration continue des algorithmes de génération, le déploiement commercial de l'AIGC s'accélère, dépassant souvent les attentes. Des startups comme Jasper génèrent déjà des revenus significatifs. Cela montre que l'IA produit désormais des modèles économiques clairs et tangibles. Elle n'est plus commercialisée de manière opaque, int��grée dans du matériel ou des systèmes complexes. Pour le grand public, elle cesse d'être une technologie de pointe hors de portée.

Le modèle B2B, cœur économique de l'AIGC. Même si l'AIGC se démocratise auprès du grand public, le modèle B2B reste aujourd'hui le plus porteur. La demande et la capacité de paiement des clients professionnels sont en effet plus stables, pour deux raisons principales. Premièrement, l'AIGC booste l'efficacité opérationnelle et réduit les coûts : elle peut, par exemple, extraire automatiquement des données puis générer des articles ou des évaluations selon des templates prédéfinis. Deuxièmement, elle comble des besoins jusque-là difficiles à satisfaire.

Pour les particuliers, l'AIGC repose sur l'abonnement SaaS. Les avancées en modèles d'IA et en puissance de calcul, ayant franchi un seuil de viabilité pratique, renforcent aussi considérablement les capacités individuelles, principalement via des abonnements SaaS. D'une part, comme outil d'efficacité : les produits AIGC aident les utilisateurs à chaque étape, de la recherche d'information à la structuration de contenus et la gestion des workflows. D'autre part, comme outil créatif : à l'image des logiciels de montage vidéo ou de retouche photo, l'AIGC abaisse radicalement le seuil de la création pour tous. Parmi les outils d'efficacité, NotionAI, lancé par Notion, illustre parfaitement comment les modèles d'IA s'intègrent en tant qu'infrastructure pour enrichir les workflows existants.

Le déploiement massif des applications AIGC va créer un marché colossal pour la puissance de calcul. Une étude d’OpenAI montre que les besoins en calcul pour l’entraînement de l’IA augmentent de façon exponentielle, dépassant même le rythme de la loi de Moore. Le coût est considérable : l’entraînement de GPT-3 a nécessité plus de 4 millions de dollars en ressources de calcul. Si les modèles d’IA sont souvent open source, les jeux de données et les modèles entraînés restent des actifs propriétaires, ce qui oblige chaque projet à assumer ses propres coûts d’entraînement. Avec la commercialisation croissante de l’AIGC, tant pour les entreprises (B2B) que pour les particuliers (B2C), les infrastructures de calcul et les services cloud en profiteront pleinement. Par ailleurs, les restrictions à l’exportation des puces NVIDIA A100 et H100 pourraient offrir des opportunités de croissance aux fabricants chinois de puces dédiées au calcul.

La valeur des communautés AIGC. Nos récentes discussions avec plusieurs startups révèlent un intérêt marqué pour la convergence entre AIGC et Web3, ainsi qu’entre AIGC et les communautés. L’AIGC abaisse le seuil de création pour les utilisateurs, ce qui renforce les interactions communautaires et réduit les coûts de production de contenu pour les plateformes. En retour, les échanges et préférences des membres fournissent des retours de haute qualité pour affiner les modèles AIGC, améliorant ainsi la compétitivité des produits. Les NFT, en attestant la propriété des œuvres, peuvent servir de lien communautaire. L’exploration conjointe de l’AIGC et des communautés NFT ouvre la voie à des innovations commerciales prometteuses.

Cadre d’investissement AIGC : logiciel, matériel et données. Les algorithmes de génération, le traitement du langage naturel (NLP) et la puissance de calcul déterminent la faisabilité technique de l’AIGC, tandis que la qualité des jeux de données conditionne directement sa performance et son modèle économique. Côté logiciel, on trouve les technologies NLP de Google, Microsoft, iFLYTEK et TOLSTO, ainsi que les modèles algorithmiques et jeux de données AIGC développés par NVIDIA, Meta, Baidu, BlueFocus, Visual China Group et Kunlun Tech. La couche matérielle (puissance de calcul) implique des acteurs comme ZTE, Montage Technology, New Bright, TFN, Baosight Software et Eoptolink.

Avertissement sur les risques : Les innovations technologiques peuvent ne pas répondre aux attentes ; risques liés à la réglementation et aux politiques.

Image

Microsoft et OpenAI resserrent leur partenariat, accélérant la commercialisation de l'AIGC. Le 23 janvier, Microsoft a officialisé un renforcement de sa collaboration avec OpenAI, annonçant un investissement supplémentaire de plusieurs milliards de dollars dans les années à venir. L'objectif est d'accélérer le déploiement des technologies d'intelligence artificielle auprès du grand public. Microsoft intègre rapidement des outils comme ChatGPT et DALL-E dans toute sa suite logicielle, notamment Bing et Office, pour offrir aux utilisateurs une expérience plus efficace. Point notable : Microsoft lancera un service cloud IA baptisé Azure OpenAI Service. Cette plateforme permettra aux développeurs de créer leurs propres applications en s'appuyant sur les modèles d'OpenAI, ce qui devrait considérablement accélérer la concrétisation commerciale des technologies d'IA.

Cette initiative démontre clairement qu'OpenAI, leader de la génération de contenu par IA (AIGC), s'engage sur la voie de la commercialisation. D'un côté, l'entreprise agit comme une infrastructure de modèles pour renforcer l'efficacité et la fidélité des utilisateurs des moteurs de recherche et des suites bureautiques. De l'autre, elle s'appuie sur les infrastructures informatiques de ses partenaires pour préparer le terrain à l'expansion future de ses propres couches matérielles fondamentales.

Dans notre précédent rapport « AIGC : Outils de productivité à l’ère du Web3 », nous avons analysé les transformations technologiques et les cas d'usage de l'AIGC. Aujourd'hui, alors que ces produits se concrétisent et que leurs applications se diversifient, le marché s'interroge de plus en plus sur les modèles économiques sous-jacents. La question centrale devient : comment l'AIGC peut-il générer des revenus ? Au fil de nos échanges avec les acteurs du secteur, nous estimons que 2023 marquera une accélération de la commercialisation de l'AIGC, qui devrait progressivement s'immiscer dans la vie quotidienne et professionnelle du grand public.

1. La transformation des modèles économiques par l'AIGC — L'« IA omniprésente »

L'idée d'une « IA omniprésente » est l'impression la plus forte qui ressort de nos récents échanges avec l'industrie. Bien que l'IA existe depuis des années, ses applications dans de nombreux domaines ressemblaient souvent à celles d'un « expert » très spécialisé. Aujourd'hui, l'AIGC basée sur les grands modèles linguistiques s'apparente davantage à un diplômé universitaire doté d'une culture générale solide : si ses compétences peuvent rester limitées dans certains domaines pointus en phase de développement, son potentiel d'extension est bien plus vaste. Nous prévoyons ainsi qu'après la sortie du modèle GPT-4 en 2023, la tendance mondiale « AIGC+ » s'imposera. Les grands modèles fondamentaux et leurs jeux de données deviendront une véritable « infrastructure informatique » pour la prochaine ère technologique, une valeur verticale à ne pas sous-estimer, comme l'illustre le partenariat entre OpenAI et Microsoft. La tendance vers une IA générale et omniprésente deviendra de plus en plus évidente.

L'IA possède un potentiel considérable pour transformer les modèles économiques, notamment grâce à sa capacité à automatiser des tâches, à améliorer l'efficacité et à ouvrir la voie à de nouvelles façons de faire des affaires. Voici quelques exemples illustrant comment l'intelligence artificielle modifie les modèles économiques :

  • Automatisation : L'IA permet d'automatiser de nombreuses tâches, comme la saisie de données, le service client ou la gestion de la chaîne logistique. Cela réduit la dépendance à la main-d'œuvre humaine, améliore l'efficacité et, in fine, diminue les coûts tout en augmentant la rentabilité.

  • Meilleure prise de décision : En analysant de vastes volumes de données, l'IA fournit des insights précieux pour éclairer les décisions stratégiques. Elle peut, par exemple, optimiser la tarification, identifier de nouvelles opportunités ou anticiper les comportements clients.

  • Personnalisation : L'IA permet d'offrir des produits et services sur mesure à chaque client. Les entreprises peuvent ainsi affiner leurs campagnes marketing et renforcer la satisfaction de leur clientèle.

  • Nouveaux modèles économiques : L'IA ouvre la voie à des modèles d'affaires innovants, auparavant inconcevables. Par exemple, des chatbots pilotés par l'IA assurent un support client 24h/24 et 7j/7, même en dehors des horaires d'ouverture.

Historiquement, l'IA s'est principalement déployée dans des domaines comme la sécurité et la surveillance des réseaux. En 2020, le marché de l'IA appliquée à la sécurité a atteint 45,3 milliards de yuans, devenant l'un des secteurs au déploiement commercial le plus rapide et au potentiel le plus vaste. Il devrait atteindre 90 milliards de yuans d'ici 2025. Toutefois, ce segment repose encore largement sur des solutions intégrées combinant matériel et logiciel.

Image

Parallèlement, les progrès du traitement du langage naturel (NLP) abaissent les barrières d'accès à l'IA, tandis que les algorithmes de génération de contenu assistée par IA (AIGC) s'améliorent. Résultat : le déploiement commercial de l'AIGC s'accélère et porte déjà ses fruits. Des startups comme Jasper ont commencé à générer des revenus, prouvant que l'IA peut créer des modèles économiques viables. Fondée en 2021, Jasper a réalisé un chiffre d'affaires de 45 millions de dollars dès sa première année, avec 70 000 utilisateurs. En 2022, son chiffre d'affaires était estimé à 75 millions de dollars. Sur son site, l'entreprise propose une tarification SaaS avec trois formules : « Starter », « Pro » et « Custom ». En Chine également, les leaders de l'AIGC ont connu une croissance rapide en 2022, tant en nombre d'utilisateurs qu'en volume de contenu généré. Il est donc probable qu'ils commencent à générer des revenus et des profits dès 2023. Reste à voir s'ils parviendront à pérenniser un modèle économique basé sur l'abonnement SaaS.

Image

Prenons l'exemple de Jasper. Cette plateforme intègre plusieurs modèles d'IA comme GPT-3, NeoX et T5, mais va plus loin en créant des interfaces et des flux de travail sur mesure. Elle utilise des modèles d'apprentissage adaptés aux besoins opérationnels concrets, rendant ainsi l'IA plus accessible au quotidien. En combinant intelligemment ces différents modèles, Jasper identifie la solution optimale pour chaque secteur ou cas d'usage spécifique. Cette approche évite la dépendance à une technologie unique et améliore la qualité des résultats. Son interface propose ainsi des centaines de modèles spécialisés, comme des modèles pour rédiger des e-mails promotionnels. Cette conception aide les utilisateurs à produire un contenu précis et efficace, ce qui renforce leur engagement. C'est pourquoi Jasper, bien que lancé il y a seulement deux ans, compte déjà des clients de renom comme IBM et Airbnb.

Image

Avec les progrès technologiques, l'IA n'est plus commercialisée comme avant, intégrée de manière rigide au matériel ou aux systèmes. Pour le grand public, elle n'est plus une technologie de pointe inaccessible. Elle s'est transformée en un outil simple d'utilisation, même pour les particuliers, permettant de booster significativement la productivité. Cette évolution annonce l'émergence de modèles économiques pour l'IA plus clairs et explicites.

2. Le modèle « B2B » reste le principal modèle économique de l'AIGC

Bien que l'AIGC permette aux particuliers de générer du contenu via l'IA avec une faible barrière d'entrée, le modèle économique « B2B » (entreprise à entreprise) reste aujourd'hui le plus central. En effet, la demande des utilisateurs grand public est souvent ponctuelle et instable : la plupart ne font qu'expérimenter par curiosité. À l'inverse, les clients professionnels présentent des besoins et une capacité à payer bien plus stables et durables, principalement pour deux raisons fondamentales :

  • Réduction des coûts

L'AIGC prend en charge des tâches autrefois réservées aux créateurs humains, comme la rédaction web ou la conception graphique. Prenons un exemple : si un travail humain coûte 1 million de yuans et que l'AIGC permet d'économiser plus de 50 %, les entreprises ont tout intérêt à automatiser. Cette transition est déjà bien engagée dans des secteurs spécialisés comme le sport, la finance ou l'automobile.

Dès 2018, Reuters a lancé « Lynx Insight Service », un outil d'écriture assistée par IA. Son principe ? Confier à la machine ce qu'elle fait le mieux – explorer des données et identifier des tendances – et réserver aux journalistes les tâches nécessitant un jugement humain : poser les bonnes questions, hiérarchiser les informations ou saisir les nuances contextuelles. C'est une approche similaire à celle que nous adoptons avec ChatGPT pour rédiger des rapports. À l'avenir, l'humain se concentrera sur la vision stratégique et le cadrage des problématiques, tandis que l'IA se chargera de collecter, traiter, synthétiser et organiser l'information.

Image

Une autre méthode, plus répandue aujourd'hui, consiste à utiliser l'IA pour extraire rapidement des données et à les injecter automatiquement dans des modèles prédéfinis pour générer du texte. On le voit souvent dans les brèves financières de Wind (« WIND ») ou dans les comparatifs techniques publiés par la presse automobile.

Au-delà des articles, l'AIGC est aussi utilisé pour générer des images servant d'illustrations ou de couvertures pour des communiqués ou des posts sur les réseaux sociaux. Comparée à la recherche manuelle dans des banques d'images, cette méthode produit des visuels plus en phase avec le contenu, tout en réduisant les coûts de design et en gagnant en efficacité. Cela dit, la demande pour du contenu textuel reste supérieure à celle pour du visuel, tant en raison du niveau de finition requis que du potentiel de marché de chaque format.

  • Combler l'écart entre l'offre et la demande en B2B

Certains projets B2B présentent des besoins très spécifiques, difficiles à satisfaire avec les solutions existantes : on parle alors d'un « écart » entre l'offre et la demande. Prenons l'exemple du développement d'un univers autour d'une propriété intellectuelle (IP) majeure. Pour créer des produits dérivés �� films, séries, jeux vidéo, mangas ou figurines –, il faut mobiliser de nombreux créateurs originaux afin d'enrichir cet univers. Un processus long, coûteux et exigeant. Les producteurs de contenu, submergés par la charge de travail, peinent à fournir un volume suffisant de créations originales. De leur côté, les clients, ne voyant pas de résultats concrets, refusent de payer. À l'avenir, grâce à l'IA générative de contenu (AIGC), les créateurs pourront produire massivement du contenu à partir de simples esquisses, en s'appuyant sur des modèles entraînés. Grâce aux modèles de diffusion, cette génération hybride – combinant approche « boîte blanche » (transparente) et « boîte noire » (opaque) – pourra même donner lieu à une véritable « création secondaire ». Si l'AIGC parvient effectivement à combler cet écart, la réalisation de grands projets B2B deviendra nettement plus accessible.

Le marché de l'anime et du manga illustre parfaitement cette dynamique. Le secteur connaît une phase d'expansion rapide, et sa chaîne de valeur commence à se stabiliser. En 2020, le marché chinois a dépassé les 100 milliards de yuans, et le nombre d'amateurs d'anime et de manga devrait atteindre 500 millions en 2023. Le potentiel commercial des produits dérivés – jouets tendance («潮玩»), idoles virtuelles, vêtements, expériences hors ligne – est immense et constitue aujourd'hui un axe de développement prioritaire.

Image

Dans la conception de jouets tendance, d'idoles virtuelles ou de vêtements, le choix des designers et la validation des concepts sont des étapes cruciales. L'AIGC peut considérablement accélérer ce processus. Traditionnellement, une équipe de designers produit d'abord des esquisses, puis les soumet pour approbation au détenteur de l'IP – une méthode générant des coûts de communication élevés et un budget important pour les premières ébauches. Avec l'AIGC, les designers peuvent entraîner un modèle génératif reflétant leur style, puis produire rapidement plusieurs propositions répondant précisément aux attentes du client. Cette approche accélère non seulement la sélection des designers, mais réduit aussi significativement les coûts liés aux allers-retours. Ensuite, lors des phases avancées de conception et de production, l'AIGC permet de générer efficacement des variations stylistiques ou thématiques, améliorant ainsi l'efficacité tout en maîtrisant les coûts.

Ainsi, même si les avancées technologiques rendent l'AIGC de plus en plus accessible, nous estimons qu'à ce stade, le modèle économique B2B reste la voie à privilégier. La raison est simple : l'AIGC apporte une amélioration tangible de l'efficacité opérationnelle aux entreprises, tout en comblant un déficit structurel dans l'adéquation entre l'offre et la demande – ce qui renforce considérablement la volonté des clients de payer pour ces services.

3. L'AIGC grand public (B2C), principalement via des abonnements SaaS

Avec les progrès des modèles d'IA et de la puissance de calcul, l'AIGC s'impose comme une voie prometteuse pour autonomiser les particuliers. À un coût marginal très faible, ces outils permettent d'améliorer radicalement l'efficacité de traitement de l'information et la qualité de la production de contenu pour chacun. À terme, elles pourraient même transformer nos modes de production.

La valeur commerciale des applications grand public d'IA générative (AIGC) peut s'envisager sous deux angles distincts. Premièrement, en tant qu'outil d'efficacité, à l'image des logiciels de prise de notes ou de gestion d'agenda. Ces applications AIGC augmentent la productivité des utilisateurs à chaque étape : recherche d'information, structuration des données et automatisation des processus. Les modèles d'IA sous-jacents, en tant qu'infrastructure, s'intègrent alors naturellement aux chaînes de travail existantes. Deuxièmement, en tant qu'outil de création, comparable aux logiciels de montage vidéo ou de retouche photo. Dans un écosystème où le contenu généré par les utilisateurs (UGC) est roi, les applications AIGC abaissent radicalement le seuil d'accès à la création pour le grand public. Elles renforcent ainsi la valeur de la propriété intellectuelle (IP) des médias personnels.

Sur le plan commercial, les abonnements SaaS s'appuyant sur l'AIGC comme infrastructure sous-jacente s'imposeront comme une tendance de fond. Des acteurs comme Midjourney ont déjà emprunté cette voie. Pour les utilisateurs, la décision de payer repose sur plusieurs facteurs :

  • Un accès à l'information plus efficace

L'AIGC s'impose comme la nouvelle méthode d'acquisition d'information, supplantant les moteurs de recherche traditionnels. Depuis le lancement de ChatGPT, une question revient sans cesse : « ChatGPT va-t-il remplacer Google ? ». Les moteurs de recherche classiques fonctionnent en proposant des liens vers des pages potentiellement pertinentes, suite à une requête par mots-clés et un classement des résultats. ChatGPT, lui, répond directement aux questions des utilisateurs en s'appuyant sur son immense base de données linguistiques. Par exemple, interrogez-le sur le secteur des câbles en fibre optique, et il vous fournira instantanément une synthèse cohérente, tirée de l'énorme volume de données sur lequel il a été entraîné. Il peut même répondre à des questions complémentaires. À l'inverse, un moteur de recherche traditionnel vous oblige à chercher manuellement les documents via des mots-clés, puis à les organiser vous-même. Dans les faits, la qualité des informations obtenues via ChatGPT surpasse souvent celle des moteurs de recherche classiques, et la rapidité de réponse est incomparable. Certes, ChatGPT présente des limites, notamment liées à son jeu de données (il ignore les événements postérieurs à 2020, par exemple). Néanmoins, dans la majorité des cas, il peut déjà se substituer à une recherche classique. Bien que ChatGPT soit encore en phase de démonstration (« demo »), certains utilisateurs sur les réseaux sociaux ont déjà exprimé leur volonté de payer pour l'utiliser, tant il booste leur productivité.

Image

  • De l'assistance à l'expression au remplacement pur et simple

En matière de création de contenu, l'IA générative (AIGC)évolue d'un simple outil d'assistance vers un véritable substitut. De nombreux outils, comme Grammarly, existent déjà pour affiner le ton et le vocabulaire, proposer des formulations types et garantir la qualité rédactionnelle. L'AIGC va plus loin : elle génère directement du contenu sur mesure, en respectant un format, un ton et un contexte précis, se passant ainsi de l'intervention humaine. Prenez Jasper, par exemple. Sa fonction principale est la génération de texte par IA, permettant aux utilisateurs de créer des légendes Instagram, des scripts pour TikTok, des accroches publicitaires ou encore des e-mails.

Image

  • Intégration aux processus existants

L'AIGC s'intégrera aux flux de travail existants. En tant qu'infrastructure, les grands modèles d'IA peuvent être adaptés à des applications spécifiques selon les besoins, ou directement intégrés dans les processus de travail actuels. Prenons l'exemple de Notion AI : Notion est un outil de documentation multiplateforme qui permet la collaboration, la prise de notes, la gestion de tableaux et de tableaux Kanban. En 2021, l'entreprise a levé 250 millions de dollars lors d'un tour de financement de série C mené par Coatue et Sequoia Capital, portant sa valorisation post-financement à 10,3 milliards de dollars. En 2022, Notion comptait déjà 30 millions d'utilisateurs, dont 4 millions d'utilisateurs payants. Récemment, la société a lancé la version bêta de Notion AI, entièrement intégrée à son environnement de travail existant. Ainsi, les utilisateurs bénéficient d'une assistance IA pour organiser du contenu, gérer leur emploi du temps ou rédiger des documents, ce qui améliore considérablement leur productivité. À l'inverse, des outils comme MidJourney, Wujie Map (« carte sans frontières ») ou ChatGPT ne peuvent pas encore être considérés comme des solutions complètes : isolés des flux de travail des utilisateurs, les systèmes AIGC ressemblent davantage à des « jouets ». Leur intégration dans des processus établis change radicalement la donne.

Image

  • Élargir la créativité des utilisateurs

Le développement et la démocratisation des outils de création ont permis à de nombreux utilisateurs de devenir créateurs de contenu, contribuant ainsi à l'essor du contenu généré par les utilisateurs (UGC). En tant qu'outil de création, l'AIGC abaisse encore davantage le seuil d'accès à la production d'images, de vidéos et d'autres formats. Alors qu'il était déjà possible de générer automatiquement une voix-off à partir d'un texte, l'AIGC permet désormais de créer un texte à partir d'une simple phrase, voire une image ou une vidéo. Sur MidJourney par exemple, il suffit de saisir une description textuelle pour que l'ordinateur génère une œuvre visuelle. De même, des personnages virtuels créés par AIGC peuvent produire automatiquement des émissions complètes à partir d'un script. Grâce à ces applications, les utilisateurs peuvent produire davantage de contenu en un temps record et avec un apprentissage minimal.

Image

4. L'enjeu de la puissance de calcul derrière l'AIGC

Mais concrètement, quelle est l'ampleur de cette « puissance de calcul massive » nécessaire à l'AIGC ?

L'IA : une demande en puissance de calcul qui explose. La puissance nécessaire pour entraîner les modèles d'IA croît à un rythme exponentiel, dépassant largement les prévisions de la loi de Moore sur l'évolution du matériel. En 2018, OpenAI a publié une étude pour quantifier les besoins en calcul des grands modèles linguistiques et leur tendance. Les résultats sont édifiants : entre 2012 et 2018, la puissance de calcul requise pour l'entraînement doublait tous les 3 à 4 mois, une croissance fulgurante comparée au doublement tous les 18 mois prévu par la loi de Moore. Sur cette période, la consommation réelle a été multipliée par 300 000, alors que les progrès matériels n'auraient permis qu'une multiplication par 7.

Graphique illustrant la croissance exponentielle de la puissance de calcul pour l'IA

Aujourd'hui, la puissance de calcul des grands modèles courants (comme GPT-3, NLG ou Gopher) se mesure généralement en petaFLOPS-jours. Cette unité correspond à la puissance d'un système capable d'effectuer un million de milliards d'opérations par seconde, déployée continuellement pendant 24 heures. Pour donner un ordre d'idée, le fleuron de NVIDIA, la carte graphique RTX 3090, affiche une puissance de crête d'environ 35 TFLOPs, soit 35 000 milliards d'opérations par seconde. Un petaFLOPS-jour équivaut donc à faire tourner ce GPU à plein régime pendant 29 jours d'affilée. Même avec le supercalculateur le plus rapide du monde, un tel entraînement prendrait, dans le meilleur des cas, plus d'une semaine.

Comparaison des besoins en calcul des modèles d'IA

AIGC : un marché colossal de la puissance de calcul en perspective L'entraînement des modèles d'IA nécessite une puissance de calcul phénoménale, ce qui se traduit par des coûts exorbitants. Prenons l'exemple de GPT-3 : avec ses 175 milliards de paramètres, son entraînement a requis une puissance totale de 3 650 PFLOPS-jour. Selon les estimations de Lambda, entraîner GPT-3 sur des infrastructures cloud avec des GPU NVIDIA V100 (d'une puissance théorique de 28 TFLOPS), au tarif minimum sur trois ans, représenterait un investissement de 4,6 millions de dollars. Et le prochain modèle, GPT-4, comptera encore plus de paramètres.

Si les modèles d'IA sont souvent open source, les jeux de données et les résultats d'entraînement restent des actifs propriétaires pour chaque équipe. Ainsi, chaque produit d'IA doit assumer ses propres coûts d'entraînement. Aujourd'hui, la majorité des startups optent pour le cloud, car constituer son propre cluster de calcul représente un investissement prohibitif : un GPU haut de gamme A100 coûte entre 60 000 et 90 000 yuans. Pour un cluster de 1 000 cartes A100, incluant les CPU, le stockage, les disques durs et les infrastructures annexes comme l'alimentation électrique du data center, l'investissement matériel avoisine les 100 millions de yuans. Le développement commercial de l'AIGC, tant en B2B qu'en B2C, devrait donc profiter aux services de cloud computing et aux constructeurs de clusters. Par ailleurs, les restrictions à l'exportation des GPU NVIDIA A100 et H100 pourraient offrir une opportunité aux puces de calcul chinoises de gagner des parts de marché.

5. Les communautés AIGC : le véritable eldorado de demain

À l'occasion de nos récents échanges avec plusieurs équipes de startups, un enjeu clé est ressorti : l'intégration de l'AIGC au Web3.0 et sa convergence avec les dynamiques communautaires. Cette tendance se manifeste principalement à trois niveaux : l'AIGC renforce l'interaction et le développement culturel au sein des communautés ; les communautés elles-mêmes alimentent en retour les modèles d'IA ; enfin, l'association de l'AIGC et des NFT ouvre la voie à de nouveaux modèles économiques.

Un seuil d’expression bas favorise la participation d’un plus grand nombre d’utilisateurs aux interactions communautaires. Par rapport aux plateformes UGC, l’AIGC abaisse encore davantage ce seuil et réduit les coûts de création de contenu pour les utilisateurs. Cette simplification supplémentaire stimule les interactions et la croissance des communautés, tout en allégeant les coûts de production de contenu pour la plateforme. Prenons l’exemple de « Baozou Manhua » : le site a initialement démocratisé la création grâce à des outils de bande dessinée, donnant naissance à de nombreux mèmes populaires qui ont enrichi l’écosystème de la marque « Baozou IP ». L’AIGC, quant à elle, offre aux utilisateurs une puissance créative bien supérieure à celle des communautés de contenu traditionnelles, ouvrant potentiellement la voie à de nouveaux modèles économiques pour les plateformes.

Image

Les retours de la communauté sur les créations générées par l'IA (AIGC) constituent une ressource précieuse pour l'entraînement des modèles. Prenons l'exemple de la génération d'images : avec les mêmes mots-clés, les résultats peuvent varier du tout au tout d'une plateforme à l'autre — excellents sur la plateforme A, médiocres sur la plateforme B. Cette disparité s'explique en grande partie par les méthodes d'entraînement : même avec un modèle identique, des approches différentes conduisent à des performances radicalement opposées. Dans le cadre de l'apprentissage supervisé, les annotateurs évaluent les contenus produits par les systèmes AIGC pour affiner progressivement les paramètres des algorithmes jusqu'à obtenir des résultats satisfaisants. D'ailleurs, l'une des raisons pour lesquelles ChatGPT a lancé une version démo gratuite était précisément de recueillir, via les interactions des utilisateurs, un volume important de données de retour. Les échanges communautaires et les préférences exprimées par les utilisateurs représentent ainsi des retours de haute qualité, permettant d'optimiser et d'améliorer continuellement les capacités des modèles AIGC.

Lorsque l'AIGC aborde les questions de propriété intellectuelle (IP), le système traditionnel de licences montre ses limites — un problème déjà rencontré à l'ère du contenu généré par les utilisateurs (UGC), comme avec les créations dérivées « fan-made ». La nature intrinsèquement traçable des NFT permet d'établir des liens plus riches entre les créateurs originaux, les auteurs d'œuvres dérivées et le public. On observe d'ailleurs que des collections NFT comme BAYC ou Cryptopunks ont constitué des communautés de fans exclusives, tandis que l'intégration des NFT dans l'économie des fans fait l'objet d'expérimentations actives. De par son caractère aléatoire, l'AIGC rend très improbable la reproduction à l'identique d'un contenu ; chaque génération produit par ailleurs un « seed » comparable à une empreinte numérique. Associer l'AIGC aux NFT permet non seulement de lier de manière indissociable l'auteur à son œuvre, mais aussi de rattacher cette dernière à l'IP originale dont elle est issue. Ce champ d'exploration est prometteur : plusieurs équipes, notamment dans la Silicon Valley et à Singapour, s'y sont déjà engagées. Nous suivrons ces développements de près dans nos prochaines analyses.

6. Stratégie d’investissement : Logiciels, matériels et jeux de données pour l’AIGC

Après le contenu généré par des professionnels (PGC) et celui créé par les utilisateurs (UGC), l’AIGC (Intelligence Artificielle Générative de Contenu) représente la prochaine étape. Cette technologie permet de repousser les limites de la productivité créative humaine, en générant du contenu de haute qualité avec une efficacité remarquable, et ouvre ainsi la voie à un métavers véritablement abouti. Pour que l’AIGC réponde aux exigences du métavers et soit capable de produire de manière autonome un contenu à la fois riche et précis, des avancées technologiques supplémentaires sont nécessaires. Ces progrès peuvent être envisagés sous deux angles : logiciel et matériel. Côté logiciel, on trouve notamment le traitement du langage naturel (NLP), les modèles algorithmiques de génération AIGC et les jeux de données. Côté matériel, les éléments clés sont la puissance de calcul et les réseaux de communication.

Facteurs catalyseurs :

1) Le lancement prévu au deuxième trimestre du nouveau modèle GPT-4.

2) Microsoft intègre des fonctionnalités d'AIGC dans ses moteurs de recherche et sa suite Office.

D'un point de vue thématique, nous estimons qu'après une phase de conceptualisation en 2022, l'AIGC entrera en 2023 dans une période d'explosion industrielle. Cette phase sera marquée par le lancement de nouveaux modèles et par le déploiement concret de l'« AIGC+ » dans divers secteurs. D'un côté, l'AIGC révolutionne les applications phares existantes, comme les vidéos courtes et les jeux vidéo, en augmentant le volume de contenu et leur potentiel addictif, tout en offrant de nouveaux outils aux secteurs des réseaux sociaux et de la publicité. De l'autre, dans le cadre des valeurs ouvertes et collaboratives du Web3, les contenus générés par les utilisateurs (UGC) et par l'IA (AIGC) gagneront en attractivité, annonçant une vague de création secondaire et d'imagination collective.

Avertissement sur les risques

Innovation technologique en deçà des attentes : Les progrès technologiques de l'AIGC pourraient ne pas être au rendez-vous, tout comme les infrastructures matérielles sous-jacentes — notamment les supercalculateurs et la puissance de calcul — dont la progression pourrait être plus lente que prévu.

Risques réglementaires et politiques : Le contenu généré par l’IA (AIGC) en est encore à ses débuts. Il reste à voir si un cadre législatif ou réglementaire spécifique, notamment en matière de propriété intellectuelle, sera établi pour encadrer ces œuvres.