La veille et le Big Data

La veille (source : Pixabay - CC0)
La veille (source : Pixabay - CC0)

La veille, selon le vocabulaire de la documentation, est définie comme « un dispositif organisé, intégré et finalisé de collecte, traitement, diffusion et exploitation de l’information qui vise à rendre une entreprise, une organisation, quelle qu’elle soit, capable de réagir, à moyen et long termes, face à des évolutions ou des menaces de son environnement, que celles-ci soient technologiques, concurrentielles, sociales, etc. »[1]. A l’ère du web 2.0 où les blogs, les avis de consommateurs et les flux RSS se sont très largement développés, les dispositifs de veille évoluent au rythme du cycle de l’information. De la collecte à la diffusion des données, les veilleurs sont confrontés à l’infobésité, à la variété des sources et à la volatilité des informations.

La veille est à envisager pour appréhender la gestion du risque, elle permet d’anticiper et de réduire les zones d’incertitudes. Traditionnellement, la veille est associée à des compétences métier (veille juridique, veille technologique, veille réglementaire, etc.). Elle s’attache à la maîtrise d’une compétence spécifique, d’une compétence clé. La veille aide à la maîtrise de la communication et de l’information, elle permet de s’assurer du lien entre l’organisation et son environnement en plus de la maîtrise des règles organisationnelles. Jusqu’à l’avènement du web 2.0, la veille se limitait à la surveillance de sources accréditées, bien souvent de nature textuelle. Depuis lors, il a fallu qu’elle évolue au gré des innovations.

Comment la veille s’adapte-t-elle aux spécificités du Big data qui peuvent être résumées en trois mots : volume, variété et vélocité des données ?

Les défis du veilleur 2.0

La recherche d'informations (source : Pixabay - CC0)
La recherche d’informations (source : Pixabay – CC0)

Le volume des données disponibles est colossal. La mise en ligne du service public de la donnée[2], courant avril 2017, laisse présager un accroissement constant des ressources en open data. Le volume des données du web croît sans cesse et le développement de l’usage des objets connectés vient confirmer cette tendance. Le veilleur n’a plus la possibilité de ne compter que sur la collecte manuelle, celle-ci doit être automatisée. Désormais, elle s’effectue aussi sur des données collectées par des robots.

Cette masse de données variées pose la question de l’analyse. Pour le veilleur, la difficulté consiste à dégager une information qualitative à partir des données quantitatives issues de la collecte. Il convient de dévoiler la valeur de l’information transmise par les données : est-ce positif, négatif ou neutre ? Il est impossible pour un humain d’en extraire la portée sans l’aide de machines.

Il s’agit en effet d’appréhender une information issue d’une masse de données non assimilable sans assistance technologique. La restitution de l’information est souvent associée à des outils de datavisualisation et d’infographie. La datavisualisation prend sa source dans la restitution de données brutes quand l’infographie met en lumière une information grâce à une représentation graphique qui peut être de l’ordre de la relation entre des données, de la modélisation d’un processus ou bien élaborer une vue textuelle comme un nuage de tags.

Les compétences du veilleur doivent permettre d’anticiper les tendances, de détecter les opportunités de développement et procurer un avantage concurrentiel à l’organisation. Il doit capter, analyser et diffuser les informations stratégiques aux décideurs en s’adaptant à un environnement aujourd’hui centré sur la donnée. Il convient de maîtriser les outils informatiques et d’en comprendre les mécanismes. Par extension, la maîtrise de la langue anglaise lui offre de sérieux atouts.

Les spécificités du web nouvelle génération auxquelles la veille doit faire face…

L’une des spécificités essentielles du web est caractérisée par « l’information multiforme », c’est à dire que les informations sont de nature multimédia. Les contenus peuvent prendre la forme de vidéo, d’image fixe, de texte, d’enregistrement sonore, etc. Une partie de l’information est produite par les internautes (on qualifie cela de « User Generated Content »), presque dans l’immédiateté, au sens où celle-ci est rendue disponible extrêmement rapidement voire instantanément. La multiplication des canaux de diffusion rend la veille complexe.

En effet, le web se compose d’une multitude de réseaux. Il peut s’agir de réseaux sociaux qui concernent la sphère privée tels Facebook et Google+, ou bien la sphère professionnelle tel LinkedIn. Il est composé de communautés virtuelles d’internautes qui partagent des informations sur des blogs ou sur des chaînes Youtube. Ainsi il est recommandé de veiller sur les réseaux sociaux, les blogs, les plateformes de partage vidéo pour ne pas manquer une information stratégique et faire valoir sa réactivité.

Une autre spécificité du web réside dans la viralité. L’information se propage sur les réseaux à la manière du bouche-à-oreille. Un internaute va apporter du crédit ou du discrédit à une information en la commentant, en la partageant. Il se crée alors de nouvelles informations qu’il convient de surveiller de près, notamment lorsqu’elles concernent l’image de marque de l’organisation. L’analyse de la viralité vient s’ajouter aux défis rencontrés par les dispositifs de veille et ouvre les portes de l’analyse de l’impact stratégique. La possibilité de suivre la propagation d’une campagne marketing, par exemple, donne accès à de précieuses informations sur la réception de cette même campagne.

Les nouveaux axes de veille

La veille sur l’e-réputation consiste à suivre les flux d’informations qui circulent sur l’organisation et son image de marque. Les informations peuvent émaner de l’organisation (site institutionnel), mais aussi des clients, des partenaires, des collaborateurs. Ce type de veille est très intéressant dans la gestion du risque car elle permet d’être alerté rapidement et de réagir en cas d’usurpation d’identité ou de fuites d’informations confidentielles par exemple. Elle anticipe la veille de l’information sensible où l’accent est mis sur la surveillance des plateformes de partage pour vérifier qu’il n’y ait pas de fuites de données.

La veille sur les réseaux sociaux (qualifiée aussi par l’expression « social media listening ») est importante à cause de l’information produite par les utilisateurs (user generated content) qui sont très nombreux. Il devient possible de saisir l’influence des campagnes émises par l’organisation grâce à une offre en social media listening dynamique et innovante. L’image de marque de l’organisation est soumise à l’analyse de l’humeur et du comportement des internautes. L’exploitation des métadonnées issues des réseaux sociaux sert de capteur d’opinion et favorise le dégagement de tendances.

La veille « temps réel » intervient au moment où il faut gérer une crise. L’information recueillie sert à prendre des décisions d’urgence. L’information est collectée via des requêtes sur les moteurs de recherche, sur les sites de presse et d’actualités et fournit des informations de publication récente.

Les innovations des logiciels dédiés à la veille sur le web

Social media listening (source : http://www.activitycloud.com/)
Social media listening (source : http://www.activitycloud.com/)

Les outils de veille répondent aux problématiques posées par les spécificités du web en mettant à disposition des interfaces « social media listening » via des connecteurs intégrés sur les API des détenteurs d’information (Twitter, Instagram, Facebook et Youtube notamment). Les données collectées sont conservées dans le cloud. Même si cela peut sembler poser des problèmes de confidentialité, il n’en est rien car il s’agit pour l’essentiel de données brutes dont on garantit la protection mais qui ne représentent pas de connaissance particulière.

Les outils de veille de nouvelle génération permettent de produire des tableaux de bord, de formuler des hypothèses d’interprétation, de faire des recommandations. Les outils et les résultats de la veille sont partagés par des équipes et peuvent être utilisés en mobilité, être commentés et enrichis. Le volume des données est rendu intelligible par des interfaces de datavisualisation. Il devient possible de visualiser les tendances, les relations, les sujets en régression ou en progression d’un seul coup d’œil.

Certains acteurs du domaine proposent également des outils prédictifs, par exemple Palantir[3], spécialisés dans l’intégration de jeux de données en temps réel. Ces acteurs se spécialisent dans le Big data, leurs produits permettent de dévoiler les tendances qui se dégagent d’un volume de données massif collecté et exploité en temps réel.

Voici un panel d’outils de veille, classés alphabétiquement, compatible avec les spécificités du Big data :

 

Nous pouvons noter un changement dans les pratiques de veille à l’ère du web 2.0 : « il faut substituer à la validation de la source la validation de l’information qu’elle produit »[4]. Il ne suffit plus de suivre des sources d’autorités identifiées, il faut dénicher l’information qui fera la différence parmi le volume informationnel du web. Les technologies Big data permettent l’analyse d’opinion, de comportement de masse ce qui était impossible avec une approche de veille traditionnelle. Avec le web 2.0, la veille devient un outil collaboratif au service d’une intelligence collective avec un bémol cependant : les profils utilisateurs du web ne sont pas forcément représentatifs de la société actuelle ce qui signifie que l’interprétation peut s’éloigner de la réalité… Toutefois, les générations nées avec le numérique viendront bientôt rétablir la confiance dans la représentativité de la population.

NOTES 

[1] http://www.adbs.fr/veille-19022.htm?RH=OUTILS_VOC  consulté le 11/04/2017

[2] http://www.data.gouv.fr/fr/reference

[3] https://www.palantir.com/

[4] « La veille dans un environnement numérique mouvant » de Christophe Deschamps, dans Guide Pratique Archimag n°47 « Outils et efficacité d’un système de veille »

BIBLIOGRAPHIE

« La veille multimédia ou la kaléidoscopie de l’information » / Antoine Raulin, I2D – Information, données & documents 2016/4 (Volume 53), p. 4-6

Archimag Guide pratique n°47 « Outils et efficacité d’un système de veille »

Archimag n°301 de février 2017 « Réinventer la veille »

https://www.1min30.com/dictionnaire-du-web/social-media-monitoring-veille (consulté le 10/04/2017)

L’intelligence économique au service de l’innovation / Christian Coutenceau, François Barbara, Véronique Chapuis-Thuault… [et al.] ; Editions Eyrolles, 2014.

Nouveaux usages de la veille : 5 pratiques en émergence / Groupe de travail intelligence économique et économie de la connaissance – Groupement Français de l’Industrie de l’Information, 2012.

 

Soyez le premier à commenter

Poster un Commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.