Gourou de notre société, oiseau rare appartenant à une nouvelle « caste » de professionnels⦠Dans un précédent opus de notre revue centré sur la Data (publié en 2014), Jean-Paul Isson, le chef de la science des données et de lâintelligence artificielle chez le fournisseur de solutions technologiques pour le secteur aérien Sita, faisait un véritable panégyrique des data scientists. Sept années ont passé, soit une éternité dans ce monde où la technologie sâaccélère à une vitesse exponentielle. En 2015, le volume annuel de données numériques créées à lâéchelle mondiale ne dépassait pas 12 zettaoctets (1 zettaoctet [Zo] équivaut à 1000 milliards de gigaoctets [Go]). Cinq ans plus tard, il atteignait déjà 47 Zo et le cap de 612 Zo sera probablement franchi en 2030. Pour 2035, les prévisionnistes â qui publient leurs estimations dans le Statista Digital Economy Compass â tablent sur un chiffre de 2142 Zo. En deux décennies, le volume de données devrait ainsi être multiplié par plus de 178 fois ! « La data, câest le nouvel or noir de la planète, mais si vous nâavez pas les moyens de le raffiner, vous vous retrouvez juste avec un truc polluant dont vous ne savez quoi faire, résume Olivier Girardot, le directeur de la data chez Malt, une plateforme de 280 000 free-lances qui comprend une majorité de profils âtechâ. Les spécialistes de la data sont ceux qui transforment ce pétrole en carburant. »
Une pyramide dâexperts
Longtemps, ces « geeks » capables de déceler des tendances ou des anomalies en lisant des colonnes de milliers de chiffres étaient tous définis comme des data scientists. Avec le temps, ce secteur sâest professionnalisé, segmenté, et de nouveaux titres sont apparus sur le marché du travail : data analyst, data architect, data engineer, data visualisation⦠Néanmoins, dans le lot, le data scientist a conservé ses « lettres de noblesse ». « Son rôle est de déceler des choses intelligentes au sein des données et de développer des modèles prédictifs, décrit Olivier Girardot. Il est capable de trouver trois points parmi des milliers de chiffres afin de tracer une ligne qui montrera une direction à suivre. Son profil est celui dâun mathématicien qui utilise beaucoup les techniques de la probabilité, des algorithmes et du machine learning. » Ces scientifiques se trouvent au sommet de la pyramide des spécialistes de la donnée. « Lâanalyste a pour mission de remettre de lâordre dans toutes les data quâil peut récupérer, alors que le scientifique cherche surtout à comprendre ce qui va se passer dans le futur en faisant des projections sur les trois prochaines années », précise Julia Cames, la directrice du marketing de HubSpot France.
Le data scientist de 2014 ne pourrait plus travailler pour une entreprise de 2021
Miroir, mon beau miroir⦠En 2012, la Harvard Business Review avait déjà décrit la data science comme étant le « job le plus sexy du xxie siècle » et cet article avait créé une véritable lame de fond dans le monde de la tech. Les universités et les écoles ont voulu profiter de lâaubaine et mis en place des formations spécialisées dans la data science. « Les premiers scientists avaient suivi des études de mathématiques et de statistiques, rappelle Olivier Girardot. Beaucoup avaient un doctorat, dâautres étaient ingénieurs et ils se tous formés sur la data sur le tas. »
Les trois quarts des algorithmes qui sont utilisés dans la data science ont été créés dans les années 1970-80
Si la collecte, le traitement et lâinterprétation des données collectées sur le Web sont des métiers assez récents, la plupart des théories qui permettent aux data scientists de faire leurs prévisions ne datent pas dâhier, ni même dâavant-hier. « Un des algorithmes les plus utilisés aujourdâhui pour résumer de longs textes se base sur une méthode inventée en 1870, dévoile le directeur de la data chez Malt. Cet algorithme est tombé dans les oubliettes jusquâà ce quâon le traduise en langage informatique cent ans plus tard. Les trois quarts des algorithmes qui sont utilisés dans la data science ont été créés dans les années 1970-80 et ils se basent presque tous sur les techniques de la probabilité. » Et bien que la plupart des théories dont elle se sert soient relativement anciennes, la profession la plus « sexy » au monde fait montre de réelles capacités dâévolution. « Le data scientist de 2014 ne pourrait plus travailler pour une entreprise de 2021, résume Christophe Negrier, vice-président Technologie chez Oracle France. Il doit aujourdâhui avoir une approche plus transparente parce que lâéthique est devenue un sujet central. Il doit aussi pouvoir communiquer et interagir avec les autres collaborateurs de la société qui lâemploie. Il a également besoin de nos jours dâêtre épaulé par dâautres spécialistes (comme des codeurs et des statisticiens) et il doit être capable dâembarquer ses collègues pour monter des projets en commun. Le data scientist ne peut plus être, comme cela pouvait être dans le passé, une sorte de professeur Tournesol qui imagine des algorithmes tout seul dans son coin. »
Autocréation de métiers
Sans compter que la machine, elle, boostée à lâIA, est capable bien souvent maintenant de remplacer ces mathématiciens du numérique. « Ce métier va continuer dâévoluer, car le marché va devenir de plus en plus mature, prédit Christophe Negrier, qui a occupé auparavant le poste de vice-président en charge des ventes chez SAP France. Les offres packagées et enrichies de capacités dâanalyse des données vont être plus nombreuses. La plupart des demandes des entreprises seront satisfaites par les solutions proposées par des groupes comme le nôtre. Depuis quelques années, on constate en effet que le nombre de data scientists essentiellement dédiés à la recherche pour les sociétés est en baisse constante. Les grands groupes qui ont des besoins spécifiques, les startups du numérique et les sociétés de la tech comme Oracle continueront à embaucher ces profils, mais les autres firmes vont, elles, chercher à recruter dâautres types de métiers liés à la data. » Ce phénomène est déjà perceptible aujourdâhui. « Beaucoup de gens veulent être data scientist, mais lâoffre dépasse déjà la demande, prévient Olivier Girardot. Sur Malt, le nombre de requêtes mensuel sur les mots clés afférents à âdata scientistâ avoisine les 3000, alors que nous avons près de 4500 profils free-lances de ce type sur notre plateforme. Ce fossé est logique. Le nettoyage et le traitement des données représentent en effet 80% des besoins des entreprises, et ce travail peut être accompli par des analystes et non par des scientifiques â qui sont frustrés par ces tâches et préfèrent mettre au point des modèles prédictifs. » Avec un salaire annuel de départ compris entre 35000 et 38000 euros, qui peut grimper à 45000 ou 55000 euros après quelques années, un data analyst coûte également bien moins cher quâun data scientist, qui espère toucher entre 50000 et 60000 euros dès la fin de ses études et dont les émoluments peuvent approcher 80000 voire 100000 euros lorsquâil sera considéré comme « senior ».
La collecte et lâexploitation des données sont devenues des questions de survie pour les entreprises. Et pour donner de la valeur à la data, rien ne vaut un data scientist.Â
Les « as de la données » ne risquent toutefois pas dâêtre détrônés par la machine de si tôt. « Les data scientists ne vont pas disparaître, conclut Julia Cames. Leur métier a beaucoup évolué. Par le passé, on leur demandait de faire un peu tout et nâimporte quoi. Aujourdâhui, ils doivent juste faire ce quâils font le mieux : des projections pour les prochaines années basées sur les données recueillies aujourdâhui. » Christophe Negrier partage la même opinion : « La collecte et lâexploitation des données sont devenues des questions de survie pour les entreprises. Et pour donner de la valeur à la data, rien ne vaut un data scientist. » Les journalistes de la Harvard Business Review ne diront pas le contraireâ¦
source : www.influencia.net