Les modeles predictifs du big data ont fait des merveilles dans les domaines du marketing ou de la maintenance industrielle, entre autres. L'etape suivante consiste non seulement a predire l'avenir mais aussi a soumettre a l'homme des propositions de decision.
Rafik Djedour, responsable Data-Science, nous explique pourquoi.
Retrouvez l'intégralité de la tribune dans Les Echos en cliquant ici
Big data, internet des objets (IoT), data science, machine learning, intelligence artificielle… les buzzwords s'enchainent sans que l'on ne sache toujours ce que ces termes recouvrent, générant de la confusion. En fait, ces differents domaines interviennent a plusieurs etapes de la chaine de traitement de données.
Jusque-la, les entreprises avaient l'habitude de gerer leurs propres données, des données structurées, maîtrisées et a un format connu. Avec le big data, elles s'ouvrent a de nouvelles sources qu'il s'agisse des flux d'informations generes par les objets connectes, des commentaires laisses sur les réseaux sociaux, des parcours de navigation sur le web ou encore l'open data. Ces données exogenes, parfois non structurées, viennent enrichir le patrimoine d'informations existant.
Faire parler les données
Les plateformes big data permettent de collecter et de rendre intelligibles ces donnees aux formats exotiques. « Scalable », elles peuvent absorber de fortes volumetries de donnees sans connaitre par avance leur evolution et la valeur que l'on pourra en tirer. Cette recherche de valeur, c'est le role du data scientist. Il va faire « parler » les donnees en construisant des modeles predictifs a memes de repondre a des enjeux metiers.
Alors que le « data miner » choisit et calibre « manuellement » le bon algorithme (arbre decisionnel, regression lineaire, ACP, K-means…), le « data scientist » s'aidera du « machine learning » pour tester automatiquement differents algorithmes et plusieurs parametres afin de construire le meilleur modele. La puissance de calcul d'une plateforme big data rend cette automatisation possible. Le « machine learning » represente donc une methode puissante a disposition des « data scientists », tandis que le Big data lui fournira les briques technologiques necessaires.
Le « data scientist » va restituer les indicateurs aux metiers sous forme de de tableaux de bord traditionnels ou de data visualisation plus interactives. Il fournit une aide a la decision mais celle-ci reste aux mains de l'humain. L'intelligence artificielle va, elle, lancer automatiquement des actions selon des parametres predefinis en amont a l'aide d'experts ou a l'issue de plusieurs simulations.
Prenons l'exemple de la maintenance predictive d'une voiture connectee. Des capteurs thermiques ou sensoriels vont retourner un ensemble de metriques sur la temperature du moteur, son niveau d'huile, l'usure des pneus … La plateforme big data collecte et structure ces donnees brutes.
Le modele concu par le « data scientist » peut alors s'appliquer et livrer sa prevision : le risque de panne dans les sept prochains jours s'eleve a 93 %. Alerte, le concessionnaire prend, ou non, la decision de contacter le proprietaire du vehicule. L'intelligence artificielle va, elle, declencher automatiquement l'intervention et meme guider le garagiste dans les actions de reparation a effectuer.
Aller au-delà de la prévision
Il ne s'agit plus de livrer uniquement des indicateurs mais une proposition de decision. Ce passage du modele predictif au modele prescriptif s'applique a un grand nombre de cas d'usage. Un refrigerateur connecte ira au-dela du constat que les yaourts ou les oeufs viendront bientot a manquer mais etablira une liste de courses par rapport aux habitudes de consommation du foyer. Une application dediee aux transports en commun ne se contentera pas de fournir un temps de trajet estime mais soumettra le meilleur itineraire.
On le voit avec ces exemples, le big data prescriptif est deja une realite pour le grand public. La nouveaute, c'est qu'il gagne le BtoC et le BtoB. Les metiers les plus preneurs de ce mode prescriptif sont le marketing – comment proposer une offre la plus personnalisee possible – et la fonction commerciale. La lutte anti-fraude et le controle de gestion arrivent apres. Les fonctions RH n'y sont pas encore mais elles ont tout a gagner de ces avancees pour attirer et fideliser les jeunes actifs des generations Y et Z en leur proposant des evolutions de carriere adaptees a leurs profils.
Certains secteurs d'activite sont plus en avance comme la banque dans le cadre de la lutte anti-fraude. Prenons l'exemple d'une transaction qui s'effectue en Chine alors que le smartphone du client est geolocalise en France. Classiquement, un conseiller va appeler son client pour s'assurer qu'il est bien en Chine. L'intelligence artificielle pourra – si le client a donne son consentement – bloquer automatiquement la transaction.
Calcul du ROI et privacy
Bien sur, il n'existe pas de modele parfait. Il convient donc d'accepter une certaine marge d'erreur et d'incertitude dans tout modele developpe. Si l'on reprend l'exemple de la maintenance automobile, le fait d'enclencher la reparation alors que la panne ne s'est pas encore produite peut entrainer des faux positifs et generer une maintenance facultative. Il y a un equilibre a trouver et l'humain doit conserver la possibilite d'agir ou de corriger la machine, si besoin.
L'autre difficulte porte sur le calcul du ROI. Comment mesurer le cout de phenomenes qui ne se seraient peut-etre pas realises. On est plus dans du qualitatif. Analyser le comportement au volant d'un conducteur fait certainement economiser du carburant mais renforce surtout sa securite sur la route.
Pour prouver ce ROI, il faut commencer par le bon cas d'usage qui donnera confiance en la data science (le quick win). Lutter contre la fraude permet a une banque d'economiser les frais de remboursement. La possibilite d'echec doit egalement etre integree des le debut du projet. On ne trouve pas le bon modele du premier coup, il s'affine avec le temps.
Enfin, se pose la question du respect de la vie privee. Quand l'anonymisation n'est plus suffisante, une solution consiste a deporter les calculs au sein de l'equipement sans que les informations ne soient stockees, on parle alors d'intelligence embarquee. De nouvelles generations de radars pourront ainsi analyser en temps reel la video pour verbaliser a la volee les infractions au code de la route.
8 juin 2017