Les données prennent une importance croissante dans la recherche avec le mouvement de l’ouverture des données qui permet leur réutilisation mais aussi car les outils de mesure sont aujourd’hui très précis et récoltent énormément de données qu’il faut ensuite analyser. Pour les exploiter et pour travailler de façon collaborative sur les données, les chercheurs ont donc besoin d’outils adaptés comme :
Les outils de calculs puissants et de traitement statistique
Par exemple le logiciel R.
Les outils de text and data mining
La notion de text and data mining (TDM) ou encore, en français, la fouille de textes et de données est apparue au début des années 1990, dans le domaine du Marketing. Aujourd’hui elle s’est beaucoup répandue dans le domaine scientifique avec le développement des archives ouvertes. Cependant, les TDM subissent, un frein juridique, car la fouille de contenus implique techniquement la création d’une copie de l’œuvre à traiter ainsi que la sécurisation de l’accès à ces données. On retrouve notamment plusieurs lois sur le droit du TDM, comme par exemple l’article 38 de la loi pour une République numérique qui confère un droit au TDM en insérant une exception au droit d’auteur et droit du producteur de base de données. On note que beaucoup d’entrepôts de données proposent des fonctionnalités de Text and Data Mining.
Les outils de visualisation
Par exemple, le logiciel Gephi et The Vistorian.
Les outils de visualisation des données ont pour objet de faciliter leur analyse. Les principales représentations des données sont : la cartographie, les représentations temporelles, l’analyse de réseaux et l’analyse de données textuelles. Avec l’évolution des sources de données, les outils de visualisation doivent également s’adapter, que ce soit pour prendre en considération des données hybrides ou pour correspondre au monde de la recherche actuel qui est de plus en plus pluridisciplinaire et international et demande donc des outils collaboratifs.
Les outils de collaboration autour des données
De plus en plus de disciplines travaillent sur les données et leur exploitation nécessite des analyses décloisonnées et transdisciplinaires. Le travail des chercheurs est donc de plus en plus collaboratif en particulier au niveau de la recherche européenne qui fédère des chercheurs et des laboratoires situés dans différents pays. La France et l’Union européenne développent donc :
– Des outils de stockage sécurisés et de partage de jeux de données : plateformes d’hébergement équipées de dispositifs d’authentification et d’autorisation.
– Des outils de travail collaboratif en réseau pour les données : cloud, environnement virtuel de recherche (EVR) dédiés aux données et à la gestion de workflow.