Bigdata : de quoi parle-t-on ?

Sur ce que c’est, les analystes se retrouvent sur une définition de Bigdata  qui revient à manipuler des tonnes de données disparates en forme et en origine, pour en tirer quelque chose de valeur – Il y a aussi la volonté de faire comme avant en manipulation de données mais pour moins cher.

Du coté exploitation des données, ce qui change par rapport aux années 2000 n’est pas tellement sur la technologie mais c’est que cette technologie est accessible à beaucoup plus de monde. C’est tout ce que l’on met derrière « infinite computing » qui rend le big data accessible au grand nombre. En dix ans, grâce à la loi de Moore appliqué au Cloud, ce qui coûtait à Wal-Mart au minimum 1 MM€ sur Terra Data, peut être abordé aujourd’hui pour moins de 100 K€ dans le Cloud.

Du coté collecte des données, il y avait surtout une collecte très important dans le monde virtuel et notamment l’observation de votre souris lors de votre passage sur les sites marchands.  Le Smartphone révolutionne tout… et le monde physique cherche à capturer lui aussi un maximum de data. Celui qui se laisse géolocaliser aux USA envoie en moyenne 2000 bips par jour. Demain avec les nouveaux chip, chaque BIP en plus des données de géo location inclura quatre autres paramètres comme la température, la lumière, la présence physique. Des nouvelles caméras présentes partout sont capables maintenant d’analyser vos expressions de visages devant des images ou des vitrines (Cf. Affectiva).

Et puis Oracle a décidé de lancer le Hype avec le mot « Big Data » lâché il y a trois ans.

Mais que faire de toutes ces données ? Là où les avis divergent c’est quand il s’agit de décider

  • Soit de tout stocker en se disant que l’on verra bien plus tard ce que l’on peut en faire,
  • Soit au contraire, d’adopter une approche de « problématicien », en posant la bonne question au décideur quant à l’utilisation future et de faire, à la volée, avant de stocker du traitement de donnée, de la classification, avant de stocker une data déjà synthétisée en partie.

Une des applications futures de grande valeur de cette analyse de comportement, est d’être capable de faire du « tagage » et d’envoyer en push des offres bien ciblées. C’est là toute la difficulté. En effet, la grande hantise des Marketeux est dans le « Opt out » qui pourrait détruire avec une reco des années d’efforts de patiente collecte d’info. Donc avant de pousser une offre promotionnelle un individu je veux m’assurer que les informations marketing que j’utilise sont de qualité.

Tout le débat dans le Bigdata est de savoir s’il suffit de capturer de l’information dont on trouvera potentiellement plus tard de la valeur ou s’il faut en amont faire après traitement en fonction de la question posée. La deuxième approche semble la plus professionnelle surtout si on regarde la finalité qui est d’avoir de l’information de qualité.

Pour beaucoup de marketeux, toutes les informations de trafic sont rapidement obsolètes et une historique de six mois n’a pas forcément beaucoup de valeur marketing. Pour d’autres … peut-être.

Continuons à faire de la veille innovation.