La véritable histoire du Big Data (épisode 2)

10 avril 2018

5 minutes de lecture

Résumé de l’épisode  précédent:
Nous sommes passés du stockage simple de l’information incluant des bases de données relationnelles (grand Volume de données), à l’analyse rapide de données non normalisées. La visualisation de ces données s’opère avec la BI. Enfin, le data mining permet de créer des modèles prédictifs et d’approfondir l’analyse.

 

Dans ce second épisode, nous aborderons la question de l’IA, du machine learning, et du RGPD.

Si le terme “Big Data” trouve son origine en 1997, il aura fallu attendre 2001 pour obtenir un consensus sur les trois dimensions du Big Data: les 3 V (Volume, Variété et Vélocité).
Nous avons déjà vu que le Volume des données grandit de manière exponentielle, qu’elles soient Variées (commentaires Facebook pouvant contenir des images, des vidéos ou du texte) et que leur Vélocité (la fréquence à laquelle les données sont à la fois générées, capturées, partagées et mises à jour) augmente. Pour compléter la définition du Big Data, il est également important de noter que sa valeur économique dépend de 2 V supplémentaires : la Véracité (fiabilité et crédibilité) des données et leur Valeur par rapport à un réel besoin métier.

Pour mieux comprendre la différence entre le Big Data et la BI, il convient de partir de l’exemple suivant : Uber collecte des données durant chaque trajet, et les analyse pour déterminer l’ampleur de la demande selon les zones géographiques.
Big Data permet l’analyse et retour en temps réel des prédictions concernant la demande pour mieux répartir les conducteurs.
Quant à la Business Intelligence, celle-ci permet la visualisation a posteriori du nombre de clients pour chaque zone géographique, la rentabilité de certaines heures…

Si le Big Data rend de nombreux services aux entreprises, il n’est pas toujours utilisé à bon escient. Tout le monde se rappelle du scandale provenant de PRISM par exemple. Ce programme de surveillance établi par la NSA et révélé par Edward Snowden, collecte toutes les données personnelles (Facebook, e-mail, informations contenues sur les téléphones...) et les stocke dans un seul endroit à des fins de renseignement.

L’Union Européenne a depuis décidé de protéger ses citoyens via une loi, le RGPD (Règlement Général sur la Protection des Données). Le RGPD contraint, à partir du 28 mai 2018, les entreprises à renforcer la protection des données à caractère personnel et permet un droit à l’oubli pour les personnes concernées

Afin de traiter plus efficacement l’ensemble de ces données, une couche technologique supplémentaire a été ajoutée au Big Data. Cette couche est appelée Intelligence Artificielle (IA ou AI). Pour définir celle-ci, il faut tout d’abord, rappeler qu’il existe aujourd’hui que des IA faibles qui sont des machines qui reproduisent l’intelligence humaine (sans conscience de ce qu’elles font).

Voici quelques capacités dites intelligentes à l’heure actuelle :

  • Compréhension du langage naturel
  • Les voitures autonomes
  • L’interprétation de données complexes (images et vidéos)
  • Battre des joueurs humains de haut niveau à certains jeux (échec et go)

Les avancées en deep learning (méthodes d’apprentissage automatique fondées sur l’apprentissage de modèles de données) et l’augmentation de la puissance des machines ont permit à l’IA de devenir une technologie incontournable dans le traitement des données.

 

Le Big Data et l’Intelligence Artificielle ne sont plus des buzzwords réservés à des experts. Ils deviennent accessibles à tous. Pour autant, leur démocratisation ne doit pas faire oublier le fait que leur utilisation doit provenir d’un besoin métier. Pour découvrir les enjeux économiques et sociaux de ces technologies, la #TeamNexton vous donne rendez-vous dans un prochain épisode.

 

Chloé / Victor / Houssem

 

Partagez l'article

Articles récents Commentaires récentsArchives Catégories Méta
L'IoT : Un courant multi-secteurs et au centre des technologies
Imprimer à l'ère du digital : Redesign du journal The Guardian

Conseil, accompagnement et production digitale
5-7 rue Saint Fiacre 75002 Paris
01 81 69 73 90