Idée reçue #9 : la data ne peut pas être éco-responsable
Avec l’avancée des technologies d’intelligence artificielle, la data prend de plus en plus d’ampleur, avec une augmentation de son volume, qui n’est pas sans conséquences pour l’environnement.
Avec cette croissance exponentielle des données, la data peut-elle vraiment être éco-responsable ?
Impacts environnementaux
D’après les prévisions de Statista, le volume de données générées dans le monde devrait dépasser 180 zettaoctets en 2025 et atteindre le seuil astronomique des 2 000 zettaoctets à l’horizon 2035.
Ces données sont stockées dans des data centers, qui sont alimentées en électricité 24h/24. Leur fonctionnement en continue dégage de la chaleur et nécessite d’être refroidi par des climatiseurs qui consomment eux aussi de l’énergie. D’après Jean-Marc Menaud, les data centers consomment 2 ou 3% de l’électricité mondiale.
Le numérique représente 4% des émissions de gaz à effet de serre dans le monde. Et ce chiffre risque de doubler d’ici 2025. En France, le secteur du numérique représente 2% des émissions de gaz à effet de serre et pourrait atteindre les 7% d’ici 2040.
Solutions
Deux modes d’hébergement coexistent, l’hébergement sur des serveurs on premise et le cloud computing. Les optimisations de fabrication et d’usage des acteurs leaders dans le cloud computing nous incitent à privilégier cette solution. L’impact est plus faible.
Au niveau de nos usage de traitements de données, certains acteurs sont encore dans la philosophie de tout stocker : « Cela servira bien un jour »… Nous ne nous inscrivons pas dans cette démarche, pas de « Data Swamp » au sein d’Effidic. Nous prévoyons des usages évolutifs en stockant les données pertinentes, et nous travaillons avec nos clients en amont pour définir cette cohérence (pas de vidéo par exemple).
Une autre piste pour limiter notre impact est de rationaliser les traitements. Nous sommes parfois confrontés à des traitements « historiques » chez nos clients qui peuvent prendre jusqu’à 10 heures (sic). En plus des coûts énergétiques, cela amène des difficultés de maintien en condition opérationnelle. Il existe des outils efficaces qui favorisent un temps de traitement plus rapide. Ce sont ces technologies que nous proposons à nos clients. C’est le cas par exemple du combo DBT – Snowflake, capable de gérer de gros volumes de données. Il extraie rapidement en profondeur les informations approfondies à partir des données pour répondre aux demandes des clients.
Enfin, il est désormais possible d’éteindre les services après chaque traitement. C’est le cas de Power BI Embedded dont le coût est fixé en fonction de la mémoire vive du serveur choisi, mais aussi à l’usage, c’est-à-dire au temps consommé. Nous sommes capables d’allumer un service pour lancer les traitements, puis d’éteindre le service après usage.
Conclusion
Nous devons être conscients de notre responsabilité sur les services numériques. A nous de choisir les technologies et méthodes qui mettent en œuvre ces nouveaux usages indispensables à la performance, en limitant au maximum les impacts environnementaux.