Data Marketing : notions clés, technicités et enjeux pour l’Entreprise

Les technicités du Big Data : technicités NoSQL et écosystème Hadoop

Logo Hadoop et réseaux sociaux ( Source : Wikimedia Commons - CC-by - Apache Hadoop)
Logo Hadoop et réseaux sociaux ( Source : Wikimedia Commons – CC-by – Apache Hadoop)

Les bases de données traditionnelles évoluent vers des solutions dédiées à l’exploitation de données massives. En effet, le silo traditionnel de données marketing ne permet pas une gestion globale du cycle de vie du client. Ce fichier client ne contient que des données simples. Or, l’univers numérique foisonne de données non structurées et porteuses de sens pour l’Entreprise. La technologie NoSQL2 est favorable au stockage de données aux formats variés. Des solutions logicielles, nativement NoSQL automatisent la collecte à grande échelle de données dispersées dans les différents systèmes d’information de l’Entreprise et les canaux de connexion entre la marque et le client (Facebook, sites Web, centre d’appels… etc.). L’enthousiasme pour le « mouvement NoSQL » tient donc en partie aux limitations du modèle relationnel. Les utilisateurs et les entreprises recherchent une meilleure solution de stockage, mais également de restitution de l’information à l’échelle du Web. Ainsi, le choix de la technique NoSQL répond aux critères du « big3 » connus sous l’acronyme « 3V ». Le volume, la variété et la vélocité du big data imposent un traitement en masse et en vitesse d’une collection de données hétérogènes. Il s’agit de collecter, stocker et d’analyser un volume exponentiel de traces numériques au fil de leur propagation sur le Web. Le succès des dispositifs NoSQL est donc lié à l’évolution du matériel de stockage d’informations, de la baisse des coûts de mémoire et de l’augmentation de la puissance de calcul des serveurs. Logiquement, les entreprises en rapport avec Internet développent leur propre solution selon le modèle NoSQL. En 2004, Google met en œuvre un environnement de traitement distribué de données collectées : MapReduce. Ce système propriétaire prend le nom d’Hadoop dans sa version Open Source. Il s’agit d’un écosystème logiciel qui permet le traitement massivement parallèle de l’information. L’architecture sur un ensemble de serveurs distribués permet de répartir les données et les opérations de calcul en simultané sur des milliers d’ordinateurs.

Le tableau ci-après présente les acteurs majeurs du domaine du Big Data. On note que certaines sociétés figurent parmi les premières d’Internet.

Acteurs

Solutions Big Data

Google

MapReduce, BigTable

Facebook

Cassandra, Hive

Linkedin

SenseiBD, Voldemort

Oracle

No Database SQL

Twitter

Storm, FlockDB

Yahoo !

Hadoop, S4

Les principaux acteurs du domaine du Big Data

Source : Jouanny 2014, p.23

Le Big Data d’un point de vue économique : enjeux pour l’Entreprise

L’enjeu du Big Data pour l’entreprise est d’optimiser la valeur des données qualifiées par les outils du big data. La collecte, le traitement et le stockage des données sur un long terme ont un coût que l’Entreprise doit maîtriser. Le big data marketing crée de la valeur économique. L’entreprise est plus compétitive. Elle augmente son chiffre d’affaires par l’exploitation de données big data4. Les nouvelles technologies sont sources d’innovations et de création d’emplois. Le marché du big data est estimé à 28 milliards de dollars. En 2021, cette valeur s’élèverait à 66,71 milliards de dollars. Cette croissance montre que de nombreuses entreprises investissent dans les technologies big data pour optimiser la prise de décision. Cette nouvelle industrie se divise en deux segments: les outils d’analyse et les services. Parmi, les principaux acteurs de ce marché on note, IBM, le géant Microsoft ou encore Amazon Web Services. Néanmoins, le coût d’un projet big data reste élevé. Le ticket d’entrée varie entre 10000 euros par an pour une solution Opensource, telle que Hadoop, à 60000 euros et plus pour une solution propriétaire, telle qu’Oracle. Cette réalité n’est pas la même pour toutes les entreprises. Chaque initiative organisationnelle demande des prérequis et de nombreuses firmes manquent encore de compétences internes pour envisager ce changement. L’enjeu majeur pour supporter la démarche big data reste donc le retour sur investissement (ROI). La création de richesses à partir du traitement d’un large volume de données à faible densité en information fait encore débat. D’autant que la sécurité de l’information et les aspects juridiques sous-jacents à la collecte, au stockage et au traitement de données personnelles sont des coûts non négligeables dans la masse des charges d’un projet informatique. Paradoxalement, la loi Informatique et Libertés5 peut difficilement répondre en l’état aux critères de volume, variété et vélocité du big data. En outre, l’Open Data6 associé au big data facilite le recoupement des données personnelles et donc l’idenification potentielle d’un individu. Il reste à noter un enjeu économique et stratégique de taille pour l’Entreprise, à savoir le rôle des fournisseurs de traces numériques en masse. Le modèle de traitement du social par les traces numériques est largement diffusé les plateformes GAFA7. Dors et déjà les géants du Web s’imposent comme les « gatekeepers8 » d’un nouveau marché.

NOTES————————————————-

[2] Not only SQL, en anglais- Le terme né en 2009.

[3] Gros, en anglais

[4] La données big data se caractérise par une faible densité informationnelle

[5] La loi n° 78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés – dite loi « Informatique et libertés » – encadre la collecte et l’utilisation des données à caractère personnel. Elle confère des droits aux personnes dont les données sont collectées et traitées et impose le respect de plusieurs obligations aux responsables du traitement de ces données.

[6] Open data : données ouvertes par les administrations dans un premier temps

[7] Cet acronyme désigne les « géants du Web » : Google, Apple Facebook, Amazon. Il s’agit des sociétés de l’univers du numérique qui se caractérisent par l’énorme volumétrie de leur base utilisateurs.

[8] Les gardes-barrières, en anglais.