24/02/2015 | Avis d'expert - Nicolas Odet, Directeur général adjoint, Hardis Group
Le véritable enjeu du Big Data n'est pas technologique : il est "business". Il implique nécessairement une expertise humaine pour enrichir et "faire parler" les données. Comment passer du Big Data au Smart Data, et transformer vos données en avantage concurrentiel, en 8 points.
1. Big Data : un projet, pas un outil !
Hadoop, Cassandra, Mahout... Le Big Data ne se résume pas au "simple" choix d'une solution. Bien sûr,in fine, l'implémentation de technologies capables d'analyser et de traiter des téraoctets de données est indispensable. Mais là n'est pas l'essentiel : comme pour la quasi-totalité des projets informatiques, l'outil n'est qu'un support à un besoin métier et/ou opérationnel. En d'autres termes, les projets d'exploitation transversale des données internes et/ou exogènes de l'entreprise ne présentent un intérêt que s'ils répondent à des objectifs précis et apportent de la valeur métier.
2. Poser les bonnes questions
En premier lieu, le Big Data n'a rien de magique : il ne suffit pas de "secouer le cocotier" et d'attendre de voir ce qui va tomber. Pour obtenir les bonnes réponses, il faut avant tout poser les bonnes questions : comprendre et anticiper les comportements clients pour définir les scores d'appétence (prédiction d'achat d'un produit ou service), comprendre les mécanismes qui conduisent à un incident pour mettre en place les actions de maintenance préventive adéquates, analyser les comportements pour limiter la fraude en ligne, etc.
3. Commencer avec les données internes
Les données, à la fois structurées et non structurées, sont déjà très nombreuses dans les entreprises : véritable mine d'or, elles ne sont bien souvent pas exploitées correctement, car envisagées de façon parcellaire au sein du système d'information, en "silos" fonctionnels, métiers ou géographiques, ou à travers des solutions de business intelligence proposant une analyse plus ou moins précise et efficace du passé.
Commencer par les données internes semble être issu que du bon sens. Mais combien de projets n'arriveront pas à leur terme en raison d'un manque de travail de fond sur la structuration de référentiels de données ?
4. Enrichir et croiser les données existantes
Pour "faire parler" les données existantes, il est nécessaire de les enrichir. Par exemple, à partir d'une date, il est possible d'analyser les jours de la semaine, semaines et/ou mois les plus propices à un achat en ligne, et de travailler sur les comportements pour les dérivés (jour d'avant, jour d'après). Des tendances peuvent être dégagées en croisant les résultats avec d'autres données (distance aux soldes, jours fériés, promotions en cours...).
5. Enrichir les modèles avec des données exogènes
Pour affiner le modèle d'analyse et de prédiction, de nombreuses données exogènes sont disponibles : météo, données INSEE, études d'instituts de sondages, réseaux sociaux, objets connectés, etc. Tout l'enjeu des Data Scientists est de déterminer les données réellement pertinentes pour le modèle : celles qui permettent de comprendre les mécanismes et les corrélations autour d'un axe.
6. Impliquer les experts métiers
La conception des modèles prédictifs nécessite d'impliquer et de faire collaborer les différents départements de l'entreprise (marketing, vente, production, informatique, finances, service client, etc.), pour intégrer les informations et expertises métiers et/ou opérationnelles. Dans notre exemple, pour comprendre les mécanismes qui conduisent à un achat, le modèle devra, par exemple, intégrer les données issues du système d'information (nombre de pages vues, temps moyen passé sur le site, panier...) et du marketing (campagnes de publicité, de marketing direct, programme de fidélité...).
7. Déverrouiller les paradigmes humains ou ne pas présupposer du résultat
Pour éviter l'écueil de modèles d'analyse de données dont la logique et le résultat pourraient être biaisés par des a priori humains, les Data Scientists utilisent des techniques d'apprentissage et d'analyse, telles que les forêts d'arbres décisionnels (RandomDecisionForest). Ces modèles mathématiques permettent d'identifier au sein d'un volume important de variables, les indicateurs les plus pertinents pour l'établissement d'un graphe de décision. Ils facilitent l'identification d'axes d'analyse qui n'auraient pas forcément été pris en compte, du fait des potentiels paradigmes des experts métiers.
8. Rester agnostique pour transformer les Big Data en Smart Data
Pour devenir Smart Data, les données doivent être enrichies et analysées de façon agnostique, tout en s'appuyant sur l'intelligence humaine. Avec la capacité de traitement des outils du Big Data et des champs d'application presque illimités, dans tous les secteurs d'activité, nulle doute que le prédictif soit promis à un bel avenir dans les années à venir pour sa capacité à faire de la donnée un véritable avantage concurrentiel.