La technologie de ChatGPT consomme beaucoup d’eau dans l’Iowa

DES MOINES, Iowa — Le coût de construction d’un produit d’intelligence artificielle (IA) comme ChatGPT peut être difficile à mesurer.

Mais une chose dont l’entreprise OpenAI, soutenue par Microsoft, avait besoin pour sa technologie, c’était beaucoup d’eau, puisée dans le bassin versant des rivières Raccoon et Des Moines, dans le centre de l’Iowa, aux États-Unis, pour refroidir un puissant superordinateur qui aidait ses systèmes d’IA à apprendre à imiter l’écriture humaine.

Alors qu’ils s’efforcent de tirer parti de l’engouement pour l’IA, les principaux développeurs technologiques, notamment Microsoft, OpenAI et Google, ont reconnu que la demande croissante pour leurs outils d’intelligence artificielle entraîne des coûts élevés, allant des semi-conducteurs coûteux à l’augmentation de la consommation d’eau.

Or, ils restent souvent discrets sur les détails. Peu de gens dans l’Iowa savaient qu’il s’agissait du lieu de naissance du grand modèle de langage le plus avancé d’OpenAI, le GPT-4, avant qu’un haut responsable de Microsoft ne déclare dans un discours qu’il «a été littéralement fabriqué à côté des champs de maïs à l’ouest de Des Moines».

Construire un grand modèle de langage nécessite d’analyser des échantillons dans un immense bassin de textes écrits par des humains. Toute cette informatique consomme beaucoup d’électricité et génère beaucoup de chaleur. Pour rester frais pendant les journées chaudes, les centres de données doivent pomper de l’eau, souvent vers une tour de refroidissement située à l’extérieur de leurs bâtiments de la taille d’un entrepôt.

Forte augmentation de la consommation d’eau

Dans son dernier rapport environnemental, Microsoft a révélé que sa consommation mondiale d’eau a grimpé de 34 % entre 2021 et 2022 pour atteindre près de 1,7 milliard de gallons, soit plus de 2500 piscines olympiques. Cela représente une forte augmentation par rapport aux années précédentes à laquelle des chercheurs extérieurs attribuent ses recherches en IA.

«Il est juste de dire que la majorité de la croissance est due à l’IA, (y compris) son investissement massif dans l’IA générative et son partenariat avec OpenAI», a déclaré Shaolei Ren, chercheur à l’Université de Californie à Riverside, qui a tenté de calculer l’impact environnemental des produits d’IA générative tels que ChatGPT.

Dans un article qui devrait être publié plus tard cette année, l’équipe de M. Ren estime que ChatGPT avale 500 ml d’eau chaque fois que vous lui posez une série de 5 à 50 questions. Ce qu’il consomme varie en fonction de l’endroit où se trouvent ses serveurs et de la saison. L’estimation inclut la consommation indirecte d’eau que les entreprises ne mesurent pas, par exemple pour refroidir les centrales électriques qui alimentent les centres de données en électricité.

«La plupart des gens ne sont pas conscients de l’utilisation des ressources sous-jacentes à ChatGPT, a déclaré M. Ren. Si vous n’êtes pas conscient de l’utilisation des ressources, nous ne pouvons en aucun cas contribuer à préserver les ressources.»

Google a signalé une croissance de 20 % de sa consommation d’eau au cours de la même période, ce que M. Ren attribue également en grande partie à ses travaux en matière d’IA. 

La hausse de Google n’a pas été uniforme : elle est restée stable dans l’Oregon, où sa consommation d’eau a attiré l’attention du public, alors qu’elle a doublé en dehors de Las Vegas. Google a également consommé beaucoup d’eau dans l’Iowa, où ses centres de données de Council Bluffs consomment plus d’eau potable que partout ailleurs.

En réponse aux questions de l’Associated Press, Microsoft a indiqué cette semaine dans un communiqué qu’il investissait dans la recherche pour mesurer l’empreinte énergétique et carbone de l’IA «tout en travaillant sur les moyens de rendre les grands systèmes plus efficaces, à la fois dans la formation et dans les applications». 

«Nous continuerons à surveiller nos émissions, à accélérer les progrès tout en augmentant notre utilisation d’énergie propre pour alimenter les centres de données, en achetant de l’énergie renouvelable et en déployant d’autres efforts pour atteindre nos objectifs de développement durable consistant à réduire notre empreinte carbone, avoir une empreinte eau positive et être zéro déchet d’ici 2030», indique le communiqué de l’entreprise. 

OpenAI a fait écho à ces commentaires dans sa propre déclaration vendredi, affirmant qu’elle réfléchissait sérieusement à la meilleure utilisation de la puissance de traitement. 

«Nous reconnaissons que la formation de grands modèles peut être gourmande en énergie et en eau» et nous travaillons à améliorer l’efficacité, a déclaré OpenAI. 

Microsoft était discret sur ses projets 

Microsoft a réalisé son premier investissement d’un milliard de dollars dans OpenAI, basé à San Francisco, en 2019, plus de deux ans avant que la jeune entreprise Internet n’introduise ChatGPT et suscite une fascination mondiale pour les progrès de l’IA. Dans le cadre de cet accord, le géant du logiciel fournirait la puissance nécessaire à la formation des modèles d’IA.

Pour réaliser au moins une partie de ce travail, les deux sociétés se sont tournées vers West Des Moines, dans l’Iowa, une ville de 68 000 habitants où Microsoft rassemble des centres de données pour alimenter ses services infonuagiques depuis plus d’une décennie. Ses quatrième et cinquième centres de données devraient ouvrir leurs portes plus tard cette année.

«Ils les construisent aussi vite qu’ils le peuvent, a déclaré Steve Gaer, qui était maire de la ville lorsque Microsoft est arrivé en ville. M. Gaer a dit que l’entreprise était attirée par l’engagement de la ville à construire des infrastructures publiques et a contribué avec une somme d’argent importante sous forme de paiements d’impôts qui soutiennent cet investissement.

«Mais vous savez, ils étaient assez secrets sur ce qu’ils faisaient là-bas», a-t-il ajouté.

Microsoft a déclaré pour la première fois qu’il développait l’un des superordinateurs les plus puissants au monde pour OpenAI en 2020, refusant de révéler son emplacement à l’AP à l’époque, mais le décrivant comme un «système unique» avec plus de 285 000 noyaux de semi-conducteurs conventionnels et 10 000 processeurs graphiques – une sorte de puce devenue cruciale pour les charges de travail de l’intelligence artificielle.

Ce n’est que fin mai que le président de Microsoft, Brad Smith, a révélé qu’il avait construit son «centre de données de superordinateur pour l’IA avancé» dans l’Iowa, exclusivement pour permettre à OpenAI de former ce qui est devenu son modèle de quatrième génération, GPT-4. Le modèle alimente désormais les versions premium de ChatGPT et certains produits propres à Microsoft et cela a accéléré le débat sur la maîtrise des risques sociaux de l’IA.

Selon des experts, il peut être judicieux de «pré-entraîner» un modèle d’IA à un seul endroit en raison des grandes quantités de données qui doivent être transférées entre les noyaux de traitement.

Pendant une grande partie de l’année, le temps dans l’Iowa est suffisamment frais pour que Microsoft puisse utiliser l’air extérieur pour assurer le bon fonctionnement du superordinateur et évacuer la chaleur du bâtiment. Ce n’est que lorsque la température dépasse 29,3 degrés Celsius qu’elle retire de l’eau, a spécifié l’entreprise dans un communiqué. 

Cela peut tout de même représenter beaucoup d’eau, surtout en été. En juillet 2022, le mois avant qu’OpenAI n’annonce avoir terminé sa formation sur GPT-4, Microsoft a pompé environ 11,5 millions de gallons d’eau vers son centre de données de l’Iowa, selon West Des Moines Water Works. Cela représentait environ 6 % de toute l’eau utilisée dans le quartier, qui approvisionne également en eau potable les habitants de la ville.

En 2022, un document du service d’eau municipal public West Des Moines Water Works indiquait que l’entreprise et le gouvernement municipal «n’envisageront les futurs projets de centres de données» de Microsoft que si ces projets peuvent «démontrer et mettre en œuvre une technologie permettant de réduire considérablement la consommation d’eau de pointe par rapport aux niveaux actuels» pour préserver l’approvisionnement en eau pour les besoins résidentiels et autres besoins commerciaux.

Microsoft a déclaré jeudi qu’il travaillait directement avec les usines d’eau pour répondre à ses besoins.