Big Data et Green IT, existe-t-il un paradoxe ?

connexion_bigdata

A l’heure où les entreprises s’intéressent au big data, valorisent leurs données et s’orientent de plus en plus vers les clouds de stockage, n’y a-t-il pas un paradoxe à vouloir également aller vers le Green IT ? Tiraillées entre une volonté de croissance économique et un besoin d’aller vers un développement plus durable en prenant en compte la dimension écologique de leurs actions, les entreprises vont devoir s’atteler à la résolution de cette difficile adéquation. Cet article met en lumière des pistes de réflexions en se basant sur des cas concrets.

L’intérêt du Big Data pour les entreprises

Le big data est un véritable phénomène d’actualité. C’est un afflux de données numériques très volumineux que les outils tels que les bases de données ou le stockage d’informations classiques ne peuvent traiter aisément. Cela a amené à des traitements complexes composés d’algorithmes informatiques et de puissants systèmes de stockage aptes à traiter ces mégas données. Le big data est produit par des multiples connexions et la création et la circulation de contenus sur la toile tels que les e-mails, les photos, les vidéos, les smartphones, les réseaux sociaux et tous autres objets numériques (internet des objets) que ce soient dans les entreprises ou dans la sphère personnelle. Le Big Data est généralement défini par les 3V (Volume, Variété et Vélocité) auxquels s’ajoutent fréquemment deux autres V de Véracité et Valeur. D’après une étude HP IDC [1], « le big data a représenté en France un marché de 652 millions d’euros en 2018 ».

Le big data permet aux entreprises d’améliorer leurs modèles prédictifs en vue de valoriser leurs données, de détecter de nouvelles opportunités, de créer de nouveaux marchés, de créer de nouveaux produits ou de les améliorer [2]. Depuis 2010, les grandes entreprises mettent en place des outils big data et considèrent que ceux-ci sont très importants pour la valorisation de leurs données internes. A titre d’exemple, nous pouvons citer une grande compagnie aérienne italienne qui a changé ses procédures de vols grâce à l’analyse des données clients massives issues des réseaux sociaux et de l’Internet. Plus remarquable encore, l’exploitation du big data par Netflix. Cette entreprise est devenue le n°1 du service de vidéo à la demande (streaming) en proposant à ses abonnées plus de 100 millions d’heures de séries télévisées par jour. Le nombre croissant des abonnées permet aujourd’hui à l’entreprise de mesurer par l’intermédiaire de techniques analytiques numériques, les habitudes, les préférences et la notion de plaisir des utilisateurs face à ces séries télévisées. Ces analyses sont possibles grâce à la production considérable des données engendrées par les millions d’utilisateurs qui utilisent les services du géant américain.
Deux outils permettent l’exploitation des données des abonnées Netflix. D’une part, le moteur de recommandations qui crée des modèles de prédiction pour proposer des séries adaptées au profil du consommateur, d’autre part, des suggestions par la gestion des mots clés utilisées par les abonnées lors du visionnage de séries. Dans les entreprises, chaque service devrait se questionner sur les apports qui peuvent être faits par cette nouvelle opportunité qui s’inscrit entre autres dans les recherches de l’avantage concurrentielle. Mais toutes les données sont-elles à collecter et quel est l’impact de ce choix ?

L’impact du Big Data sur l’écologie

En effet, big data est consommateur de ressources. La collecte et le stockage des données nécessitent l’utilisation de serveurs de stockage hébergés dans des Datacenter. Alors même que les big data peuvent contribuer au green en améliorant par exemple les dispositifs solaires, elles sont aussi une source de pollution numérique considérable.

Le Cloud, un modèle énergivore

nuage_greenbigdata

Le cloud computing ou informatique dans le nuage est l’accès à des ressources sur internet permettant le stockage, le traitement et le partage de données, facilement et sans connaissances informatiques avancées. Le cloud, comme il est appelé généralement, s’appuie sur un ensemble de ressources technologies, matérielles, d’infrastructures, de logiciels dont la gestion dépend du fournisseur de service (par exemple : Amazon, Google, etc.). L’accès au cloud est désormais une pratique quotidienne chez un grand nombre d’utilisateurs. Cette expansion des données a un véritable impact sur l’environnement, elles polluent et produisent environ « 200kg de gaz à effet de serre, 3000 litres d’eau et 350 kWh d’énergie » pour un internaute ce qui n’est pas négligeable pour l’environnement lorsqu’on s’aperçoit que nous sommes plusieurs millions d’utilisateurs sur terre. Le Cloud consomme et a des effets importants sur l’écologie puisqu’il incite à accroître le nombre de matériels. Plus on augmente l’équipement, plus l’impact sur l’empreinte écologique est fort, par la consommation en fonctionnement et par le recyclage des anciens matériels.

Twitter, un gisement de données

Twitter est un réseau social qui permet de poster des micros messages. Contrairement à d’autres réseaux sociaux, les tweets sont complètement publics et les données peuvent être extraites. Cela est un avantage pour réaliser des analyses, des requêtes complexes contribuant à réaliser des observations sur ses échanges. C’est ce qui a été effectué au salon Big Data à Paris qui s’est tenu les 12 et 13 Mars 2018. Le flux de données généré par Twitter est très important et génère une pollution numérique (par leur stockage, leur diffusion, etc.) [3]. Ils sont exportés sur des serveurs afin d’être exploitées en vue de connaître les opinions, les idées des utilisateurs sur des sujets donnés. Plus de 336 millions de personnes dans le monde sont actifs sur Twitter, ce qui représente plus de 60 millions de tweets par jour. Un monde « en ligne » qui demande plus d’électricité utilisée par des sources d’énergies les plus polluantes. Twitter serait un réseau social ayant recours au charbon et au nucléaire ce qui le classerait dans les derniers de l’informatique durable selon le rapport de Greenpeace. Ce qui constituerait des mauvais points pour cette entreprise américaine par rapport à son impact écologique du numérique. Le retrait des anciens tweets pourrait être une solution mais les états prennent le relais pour pérenniser ces fonds à plus long termes, ce qui limite cet effort pour le verdissement.

De plus en plus de données stockées dues aux innovations numériques

Depuis quelques années de nouvelles innovations apparaissent sur le marché. Il s’agit des objets connectés [4], cela va de l’aspirateur au robot ménager connecté mais aussi des appareils de santé. Plus de 20 milliards d’objets seront connectés d’ici 2020. Une transformation digitale qui va changer nos habitudes, nos modes de vie et favorisera des progrès dans le domaine de la santé, bien qu’un certain nombre de personnes soient potentiellement sensibles aux ondes. L’exploitation de ces données fait le lien entre le monde réel et virtuel. Ce sont donc de plus en plus de données qui sont stockées sur les serveurs, donc plus de data centers qui vont stockées ces données issues de capteurs, de manière continue et en augmentation constante : données issues des smartphones, des robots connectés, du nouveau mobilier urbain de la « smart city », etc. Or ceci va démultiplier le nombre de données donc les besoins en termes de traitements et de stockage.

Comment concilier Big Data et Green IT?

Alors que les méga données peuvent avoir un impact fort sur la pollution et entraîner des dangers pour l’environnement, le Green Big Data contribue par certains aspects à l’économie et l’écologie de plusieurs pays.

Green Big Data

Le Big Data constitue un flux de données pouvant avoir également des impacts positifs sur l’environnement. Aux États- Unis ces masses de données sont utilisées pour permettre aux propriétaires de logement de mesurer la consommation énergétique par rapport à leurs voisins.

OPower, une société appartenant aujourd’hui à Oracle fournit des plateformes aux particuliers ou aux services publics afin d’avoir des données sur la consommation énergétique. Par l’intermédiaire d’algorithmes statistiques, les particuliers peuvent aujourd’hui évaluer leurs consommations de chauffage et les villes améliorent par exemple, le minutage des feux de circulation pour réduire les bouchons. On arrive à respecter l’environnement avec des méga données. Cela comprend également l’informatique et les communications vertes. L’informatique verte est soucieuse des pratiques environnementales lors de la conception jusqu’à la destruction d’un ordinateur avec un impact réduit sur l’environnement.

eolienne_greenbigdataDans des pays en voie de développement comme l’Afrique, le big data vient en appui à l’agriculture. Certains pays mobilisent les innovations technologiques en matière d’intelligence artificielle et de Big Data pour améliorer la production de mangues dans les champs. Par la prise de clichés et via des traitements par algorithmes complexes, le projet Pix Fruit est une avancée importante en Afrique développée par le CIRAD (Centre de Coopération Internationale en Recherche Agronomique pour le Développement) et l’Institut sénégalais de recherches agricoles [5]. Ce pourrait être un avantage important pour ce continent où l’agriculture est la principale activité. Ces applications numériques installées sur les smartphones permettent de compter les mangues, de gérer l’arrosage à distance. Le résultat de ces applications permet un recensement précis de la production qui engendre une rémunération plus juste des agriculteurs. L’Afrique ne s’arrête pas là en matière d’innovation [6]. Une ingénieure Telecom sénégalaise a créé une plateforme de commerce électronique utilisant le Big Data dont le but est de mettre en relation les cantines scolaires et les coopératives agricoles afin d’éviter de passer par de nombreux intermédiaires. Un croisement des données qui regroupent les offres et les achats, la gestion du transport des produits agricoles etc. Les résultats semblent prometteurs car le coût des repas est moins élevé et les menus sont plus équilibrés. Ceci montre un autre usage positif du Big Data.

Des solutions pour limiter l’impact écologique

Effectivement, il existe encore actuellement un paradoxe entre croissance économique via le big data et la volonté d’aller vers le green IT. Mais ce paradoxe devrait se résoudre en permettant l’aboutissement à un green big data tirant le meilleur parti de ces deux aspects : économiques et écologiques. Des solutions sont en cours de développement pour limiter l’impact écologique du Big Data qui exploite et stocke des milliards de données. Même si big data est un grand consommateur de ressources, les utilisateurs et les entreprises peuvent d’ores et déjà réaliser des gestes limitant l’impact. Il paraît important de faire en sorte qu’il y ait un équilibre et que l’on s’achemine vers une gestion responsable du Big Data. Par exemple les utilisateurs peuvent déterminer les données inutiles à supprimer et les entreprises peuvent utiliser des logiciels de déduplication de données. Les particuliers peuvent utiliser des moteurs de recherche faisant des efforts pour limiter leur empreinte numérique et demander aux grands fournisseurs de services de prendre en compte cette dimension de manière plus forte. Pour les entreprises et les administrations, il serait judicieux de choisir des hébergeurs qui suivent une charte environnementale reconnue et d’adopter des plateformes sociales qui adhèrent à des services éthiques et écologiques. Ces résolutions de la part des clients ont une influence sur les offres de services et au travers de celle-ci sur l’impact des solutions big data. L’avenir devrait donc s’ouvrir au green big data.

 

SOURCES

[1] HP-IDC, (2015), Le marché du Big Data dans les entreprises. IDC, disponible sur :
https://fr.scribd.com/document/277704837/La-dynamique-du-Big-Data-en-France#download&from_embed

[2] Wu, J., Guo, S., Li, J., & Zeng, D. (2016). Big data meet green challenges : Big data toward green applications. IEEE Systems Journal, 10(3), 888-900.

[3] Aude Deraedt (10 Avril 2014), Twitter et Amazon, champion de la pollution, Libération, site web :
https://www.liberation.fr/terre/2014/04/10/twitter-et-amazon-parmi-les-sites-lespluspolluantsdu-web_994597

[4] Objets connectés et Big Data, 3 exemples d’utilisation de la donnée qui vont bouleverser nos usages disponibles sur :
https://invenis.co/objets-connectes-big-data-3-exemples-dutilisations-de-donnee-bouleverser-nos-usages/

[5] Des applications numériques à la rescousse de l’Agriculture Africaine, 1 Mai 2019, France Info Afrique, site web :
https://www.francetvinfo.fr/monde/afrique/economie-africaine/lesapplicationsnumeriques-a-la-rescousse-de-lagriculture-africaine_3422283.html

[6] Bastien Contreras (8 Mai 2019) Afrique : quand le big data vient optimiser l’agriculture, Clubic, Sciences et Technologies :
https://www.clubic.com/technologies-d-avenir/actualite-856082-afrique-big-dataoptimiseragriculture.html