Prise de décision

Le Big Data prédictif

La bonne définition du Big Data, c’est l’idée que les données en elles-mêmes renferment une connaissance, une information qu’avec des technologiques nouvelles, on va pouvoir valoriser. J’aurais tendance à opposer le Big Data prédictif au Big Data descriptif : le Big Data descriptif, c’est quand on utilise de grandes quantités de données, mais en suivant les mêmes modes de pensées, les mêmes modes de raisonnement qu’avant : quelqu’un va formuler une hypothèse, par exemple la corrélation entre le taux de testostérone et le goût pour le piment. Il va faire un test, prendre une cohorte. Il va avoir un résultat d’analyse et va décider si c’est vrai ou si c’est pas vrai avec les données.

Prise-de-decision

Le Big Data prédictif, c’est quand les algorithmes ont eux-mêmes formulé les hypothèses et vont eux-mêmes prendre des décisions. Et on se rend que pour vraiment valoriser de grandes quantités de données, il faut remplacer l’humain y compris dans la décision. C’est un nouveau mode de connaissance scientifique : au lieu que ce soit les humains qui formulent les hypothèses, ce sont les algorithmes qui vont inventer des concepts, ranger les gens en catégorie, se rendre compte qu’il y a des affinités entre tel film ou tel autre film par exemple.

Si on veut prendre une définition un petit peu formelle d’un technicien qui fait du traitement de données, on définit souvent le Big Data avec cinq V :

  • Volume : les données sont grandes
  • Vitesse : elles arrivent ou changent vite
  • Variété : toutes sortes de données sont à traiter
  • Véracité : certaines données peuvent être justes ou fausses
  • Valeur : peut-on trouver une valeur ajoutée