L'IA imprègne la vie de millions de personnes dans le monde, mais malgré son adoption généralisée, la technologie s'avère difficile à rentabiliser en raison de l'escalade des coûts.
Les outils d'IA générative comme ChatGPT sont coûteux à utiliser, car ils nécessitent des serveurs haut de gamme, des GPU onéreux et un matériel auxiliaire important qui consomme énormément d'énergie.
Bien qu'en grande partie non vérifié, Dylan Patel de SemiAnalysis a dit l'information que l'OpenAI aurait fait des bifurcations sur certains $700 000 par jour pour faire fonctionner ses modèles, affichant des pertes de près de $500 millions en 2022.
John Hennessy, président d'Alphabet, la société mère de Google, a déclaré qu'une seule invite sur Bard coûtait jusqu'à 10 fois plus qu'une recherche sur GoogleLes analystes estiment que Google va engager des milliards de dollars de dépenses liées à l'IA au cours des prochaines années.
2023 a servi de terrain d'essai pour la monétisation de l'IA. Des géants de la technologie comme Microsoft, Google et Adobe, entre autres, tentent une grande variété d'approches différentes pour créer, promouvoir et fixer le prix de leurs offres en matière d'IA.
La plupart des modèles commerciaux tels que ChatGPT, Bard et Claude 2 d'Anthropic limitent déjà les utilisateurs à un certain nombre d'invites par heure ou par jour, y compris les versions payantes comme ChatGPT Plus. Adobe fixe des plafonds d'utilisation mensuels pour ses modèles Firefly.
Les coûts énormes de l'IA touchent également les entreprises. Adam Selipsky, PDG d'Amazon Web Services (AWS), a commenté les coûts prohibitifs pour les utilisateurs professionnels souhaitant créer des charges de travail d'IA : "De nombreux clients avec lesquels j'ai discuté ne sont pas satisfaits des coûts qu'ils constatent pour l'exécution de certains de ces modèles."
Chris Young, responsable de la stratégie d'entreprise chez Microsoft, a fait remarquer que les entreprises qui cherchent à tirer parti des modèles d'IA actuels n'en sont qu'à leurs débuts : "Il faudra du temps pour que les entreprises et les consommateurs comprennent comment ils veulent utiliser l'IA et ce qu'ils sont prêts à payer pour cela."
Il a ajouté : "Nous sommes clairement arrivés à un stade où nous devons maintenant traduire l'enthousiasme et le niveau d'intérêt en une véritable adoption".
Modèles d'IA et logiciels
L'IA n'offre pas la même économie que les logiciels conventionnels, car elle nécessite des calculs spécifiques pour chaque tâche.
Lorsque les utilisateurs sollicitent un modèle tel que ChatGPT, celui-ci recherche des modèles et des séquences à partir de ses données d'apprentissage dans l'architecture du réseau neuronal et calcule une réponse spécifique. Chaque interaction consomme de l'énergie, ce qui entraîne des coûts permanents.
Par conséquent, à mesure que l'adoption se développe, les dépenses augmentent également, ce qui pose un problème aux entreprises qui proposent des services d'IA à des tarifs forfaitaires.
Par exemple, Microsoft a récemment collaboré avec OpenAI pour lancer GitHub Copilot, destiné aux programmeurs et aux développeurs.
Jusqu'à présent, ses coûts opérationnels élevés ne lui ont pas permis d'être rentable. Au cours des premiers mois de l'année, Microsoft a facturé un abonnement de $10 par mois pour cet assistant d'intelligence artificielle et a subi une perte moyenne de plus de $20 par mois pour chaque utilisateur. Certains utilisateurs ont subi des pertes allant jusqu'à $80 par mois, comme l'a révélé une enquête de la Commission européenne. source au WSJ.
La suite Copilot de Microsoft pour Microsoft 365 (qui porte le même nom que l'outil GitHub, ce qui peut prêter à confusion) prévoit de facturer un supplément de $30 par mois. Cet outil offre des fonctionnalités telles que la rédaction autonome d'e-mails, la création de présentations PowerPoint et de feuilles de calcul Excel.
De même, Google s'apprête à lancer une fonction d'assistant IA pour ses outils de travail, imposant une charge mensuelle supplémentaire de $30 en plus des frais existants.
Microsoft et Google misent tous deux sur un tarif mensuel fixe, espérant que l'augmentation des frais compensera de manière adéquate les coûts moyens d'alimentation de ces outils d'intelligence artificielle.
Si $30/mois peut sembler abordable dans certains pays occidentaux plus développés, ces modèles de tarification ne couvrent pas la majeure partie de la population mondiale.
Lorsque ChatGPT Plus a été lancé sur le marché indien, par exemple, nombreux sont ceux qui se sont plaints qu'il n'était pas adapté aux besoins des utilisateurs. était beaucoup trop cherLe salaire mensuel moyen de $330 représente une part importante de ce coût. Le fait de priver des milliards d'utilisateurs de l'IA peut coûter cher aux développeurs lorsqu'ils commercialisent leurs outils auprès du public.
Le coût est loin d'être négligeable pour les habitants des pays les plus riches, les enquêtes montrant que les abonnements sont parmi les premières choses que l'on abandonne lorsqu'on cherche à réduire ses dépenses.
Pourquoi l'IA est-elle si difficile à monétiser ?
L'IA crée un vide entre les visions apparemment infinies des développeurs et les ressources limitées dont ils disposent pour les réaliser.
Sam Altman, PDG d'OpenAI affirme qu'un monde futuriste intégrant l'IA est tout simplement "inévitable", où des machines intelligentes vivent à nos côtés, exécutent nos ordres, où les gens vivent des centaines d'années ou sont immortels, et où des IA intégrées dans nos cerveaux nous aident à accomplir des tâches complexes par notre seule pensée.
Il n'est certainement pas le seul dans ce cas, puisque le PDG d'Inflection, Mustafaya Suleman, a récemment publié son livre "The Coming Wave", dans lequel il compare l'IA à l'explosion cambrienne survenue il y a 500 millions d'années, qui a conduit à l'évolution la plus rapide jamais observée sur notre planète.
L'IA générative est prête à exploser, avec des revenus qui devraient dépasser $1 trillion d'ici 2032. Le chemin parcouru depuis ses débuts jusqu'à aujourd'hui et à l'avenir est époustouflant... toutes les industries seront transformées pour le meilleur. pic.twitter.com/0licQGfphn
- Mustafa Suleyman (@mustafasuleyman) 20 octobre 2023
Les ambitions alimentent les idées, mais l'argent est le moteur de l'industrie technologique. La recherche et le développement en matière d'IA étant coûteux, les leaders du secteur, tels que OpenAI, Google et Facebook, investissent massivement pour rester dans la course.
En 2021, les entreprises d'IA ont attiré un investissement considérable de $94 milliards, avec plusieurs cycles de financement atteignant $500 millions ou plus. L'année 2023 a fait grimper la barre, avec des investissements dans des startups de $94 milliards d'euros. Anthropique et Inflexion passant le cap des $1 milliards d'euros.
Les spécialistes de l'IA exigent des salaires élevés, souvent de l'ordre de plusieurs millions, en raison d'une concurrence féroce, et les modèles nécessitent des ajustements réguliers et des tests de résistance, ce qui accroît les coûts permanents.
Il existe également des coûts annexes liés aux centres de données et à la maintenance, en particulier le refroidissementLe matériel informatique fonctionne à chaud et est susceptible de tomber en panne s'il n'est pas maintenu à une température optimale.
Dans certains cas, les GPU ont une durée de vie courte, inférieure à cinq ans, et nécessitent souvent une maintenance spécialisée.
Stratégies de monétisation de l'IA
À la lumière de ces défis, comment les entreprises technologiques abordent-elles la monétisation de l'IA ?
Améliorer la productivité
Les entreprises ont tout à gagner de l'IA en stimulant considérablement la productivité sociétale nette. En automatisant les tâches répétitives, les entreprises permettent aux professionnels de se concentrer sur des fonctions à plus forte valeur ajoutée.
Cela leur permettra d'accéder à des fonds privés et publics. Par exemple, DeepMind collabore avec le National Health Service (NHS) au Royaume-Uni, et les entreprises technologiques travaillent avec les gouvernements pour lutter contre le changement climatique.
Toutefois, la productivité induite par l'IA pourrait avoir un impact sur les autres sources de revenus des entreprises technologiques. Par exemple, l'activité de Google dans le domaine de l'intelligence artificielle pourrait avoir un impact sur les autres sources de revenus des entreprises technologiques. Les recettes publicitaires sont en baisse car l'IA détourne le trafic de son moteur de recherche. Cette année, les recettes de Google provenant des publicités sur YouTube se sont élevées à 1,5 milliard d'euros. baisse de 2,6%et les recettes des réseaux publicitaires ont connu une baisse sans précédent de 8,3%.
Ventes de matériel
La formation et l'hébergement de modèles d'IA nécessitent du matériel spécialisé haut de gamme. Les GPU sont indispensables à l'exécution d'algorithmes d'IA sophistiqués, ce qui en fait un élément lucratif de l'écosystème de l'IA.
Le leader du secteur, Nvidia, est le grand gagnant, avec une capitalisation boursière qui dépasse les $1 trillions, mais d'autres entreprises de l'industrie de l'automobile sont également en mesure d'apporter leur contribution. les fabricants de matériel d'IA de moindre importance en ont également bénéficié.
Abonnements
Proposer des améliorations de l'IA dans le cadre de formules d'abonnement est la solution idéale pour générer des revenus auprès des utilisateurs publics et des entreprises qui ne veulent pas ou n'ont pas besoin de passer par la voie de l'API.
ChatGPT Plus est le service d'IA le plus sollicité au monde, mais on manque d'informations sur les revenus qu'il génère.
OpenAI a lancé son Variante entreprise Cette année, l'entreprise a déclaré qu'elle avait l'intention de réaliser un chiffre d'affaires de $1 milliard d'euros au cours de l'année à venir.
API
Des sociétés comme OpenAI utilisent une approche de facturation basée sur des jetons pour les entreprises et les utilisateurs professionnels de leurs API.
Ce système garantit que les utilisateurs sont facturés sur la base de la charge de calcul réelle de leurs demandes, ce qui est un gage d'équité et de transparence.
Les modèles de tarification des API s'adressent à un large éventail d'utilisateurs, depuis ceux qui effectuent des appels légers sporadiques jusqu'aux utilisateurs intensifs effectuant des tâches intensives.
L'IA, une caractéristique inhérente
Certaines entreprises intègrent des capacités d'IA dans leurs produits sans les facturer immédiatement. Cette stratégie vise d'abord à augmenter la valeur intrinsèque d'un produit.
Au fil du temps, une fois que les utilisateurs ont intégré les capacités de l'IA dans leurs flux de travail et qu'ils en ont compris la valeur, ils sont plus susceptibles d'accepter une hausse de prix ultérieure. Toutefois, l'IA doit offrir des avantages progressifs si les coûts augmentent régulièrement.
Les coûts de formation à l'IA en open source sont de moins en moins élevés
Une discussion parallèle est en cours : pourquoi devrait-on payer pour l'IA alors qu'on n'en est jamais propriétaire ?
Certains, comme le "parrain" de l'IA Yann LeCun, soutiennent que l'IA devrait faire partie de notre infrastructure publique, soulignant la nécessité pour les développeurs de créer des modèles open source bon marché et faciles d'accès.
Un article du NYT sur le débat autour de la question de savoir si les modèles de base du LLM devraient être fermés ou ouverts.
Meta plaide pour l'ouverture, en commençant par la publication de LLaMA (pour un usage non commercial), tandis qu'OpenAI et Google veulent garder les choses fermées et propriétaires.
Ils affirment que l'ouverture peut être...
- Yann LeCun (@ylecun) 18 mai 2023
Alors que les solutions d'IA deviennent partie intégrante des entreprises, nombre d'entre elles ne disposent pas du budget nécessaire pour développer des modèles propriétaires à partir de zéro. Traditionnellement, elles se tournent vers les API des startups émergentes dans le domaine de l'IA ou vers des systèmes prêts à l'emploi.
Toutefois, à mesure que les coûts de formation diminuent et que le besoin de confidentialité des données augmente, la collaboration avec des fournisseurs spécialisés dans la personnalisation de modèles privés et libres est de plus en plus privilégiée.
Naveen Rao, PDG et cofondateur de MosaicML, a expliqué à The Register que les modèles open source sont séduisants car ils sont moins chers, plus flexibles et permettent aux entreprises de maintenir la confidentialité des charges de travail.
MosaicML a lancé une série de grands modèles de langage (LLM) open source basés sur son architecture MPT-7B. Contrairement à de nombreux autres LLM, ce modèle est commercialement viable pour le grand public.
M. Rao a expliqué la raison d'être de ce modèle en déclarant : "Il y a vraiment beaucoup d'intérêt pour ce genre de choses, et nous l'avons fait pour plusieurs raisons." Il a ajouté : "L'une d'entre elles est que nous voulions disposer d'un modèle dont l'utilisation commerciale est autorisée. Nous ne voulons pas étouffer ce type d'innovation".
Abordant la question de l'accessibilité, M. Rao a fait remarquer que "si un client venait nous voir pour nous demander de former ce modèle, nous pourrions le faire pour $200 000 et nous gagnerions encore de l'argent sur cette somme".
MosaicML fournit également aux entreprises les outils nécessaires pour héberger efficacement leurs modèles personnalisés sur des plateformes en nuage. "Leurs données ne sont pas partagées avec la startup, et elles sont propriétaires des poids du modèle et de sa propriété intellectuelle", confirme M. Rao.
M. Rao a également évoqué les limites des API commerciales : "Les API commerciales sont un excellent outil de prototypage. Je pense que les services de type ChatGPT seront utilisés à des fins de divertissement et peut-être à des fins personnelles, mais pas pour les entreprises. Les données sont un fossé très important pour les entreprises".
M. Rao a également souligné les coûts de l'architecture interne, en déclarant que "les GPU tombent assez souvent en panne", "si un nœud tombe en panne, qu'une intervention manuelle est nécessaire et qu'il vous a fallu cinq heures [pour le réparer], vous venez de brûler $10.000 sans travail, n'est-ce pas ?"
Il a également abordé la question imminente de la pénurie de puces dans l'industrieNous allons vivre dans ce monde de pénurie de GPU pendant au moins deux ans, voire cinq.
Si les entreprises peuvent puiser dans l'IA open source pour former leurs modèles à faible coût en bénéficiant d'une souveraineté et d'un contrôle total des données, cela pose un problème à l'IA publique telle que ChatGPT.
Les goulets d'étranglement imminents de l'IA ?
Outre la pénurie de GPU soulignée par M. Rao, les besoins énergétiques croissants de l'industrie constituent un autre obstacle à la monétisation de l'IA.
A étude récente prévoit que d'ici 2027, l'énergie consommée par l'industrie de l'IA pourrait être équivalente à celle d'un petit pays.
Le site de Microsoft La consommation d'eau des centres de données monte en flèche confirme l'immense soif de l'IA pour les ressources naturelles. Il est prouvé que les récents pics de consommation d'eau par les géants de la technologie comme Microsoft et Google sont attribués aux charges de travail intensives liées à l'IA.
À plus grande échelle, l'énergie cumulée utilisée par les centres de données dépasse déjà 1% de la consommation mondiale d'électricité, selon la Agence internationale de l'énergie (AIE).
Si la demande d'énergie continue d'augmenter, les entreprises spécialisées dans l'IA pourraient être contraintes de se tourner vers le développement d'approches plus efficaces pour la formation des modèles, ce qui pourrait nuire à la trajectoire à court terme de la technologie.
Des récits contradictoires
Le secteur naissant de l'IA est encore jeune et son orientation future est exceptionnellement difficile à prévoir.
Les principaux acteurs de l'IA reconnaissent que leurs idées préconçues ne correspondent pas toujours à la réalité.
Par exemple, lors d'une intervention sur le podcast de Joe Rogan, Sam Altman a admis qu'il s'était trompé sur l'évolution de l'IA, décrivant que le chemin vers la réalisation de formes d'IA hautement intelligentes sera granulaire plutôt qu'explosif.
D'une part, l'IA s'avère difficile à monétiser, ce qui fait douter que l'engouement initial s'estompe et que le processus de maturation de la technologie soit plus lent.
D'un autre côté, l'industrie a peut-être déjà fait suffisamment de progrès pour pousser l'IA vers une "singularité" où elle surpasserait la cognition humaine.
Au cours des prochaines années, si l'humanité progresse dans des domaines essentiels tels que la production d'énergie et la construction de matériel et d'architecture d'IA de faible puissance - et des progrès ont été réalisés cette année - la technologie peut alors éliminer les goulets d'étranglement à court terme et poursuivre son développement à un rythme effréné.