Data scientist – Quels profils recruter ? (2/4)

Le marché de l’emploi dans le domaine des sciences des données (Datascience) a évolué à pas rapides au cours des dernières années. Cependant, le manque de maturité de certaines entreprises vis-à-vis des données et l’absence de stratégie claire pour guider les décisions d’embauche conduisent à la publication de descriptifs de postes vagues ou inadéquats. 

Dans cet article, nous vous aidons à y voir plus clair dans les profils de Data Scientist à recruter. Quels sont les rôles spécifiques de chacun ? Que peuvent-ils apporter à votre entreprise pour développer vos affaires ? Comment reconnaître un bon Data Scientist suivant sa spécialité ?

Le spécialiste des algorithmes (Data Scientist type B)

Qu’est-ce qu’un Data Scientist spécialiste des Algorithmes ?

Ce Data Scientist de type B (« B » pour « Building») est un ingénieur spécialisé en génie logiciel qui s’est spécialisé dans l’apprentissage automatique appliqué. 

Il peut construire des pipelines de données, former des modèles pour optimiser un objectif commercial et, plus important encore, déployer ces modèles dans un environnement de production. Ces modèles peuvent notamment répondre à un besoin commercial. Exemple : prédire des activités frauduleuses.

Parmi ces spécialistes de la donnée, on retrouve aussi le Deep Learning Engineer, qui se concentre tout particulièrement sur des modèles d’apprentissage profond plutôt que sur l’apprentissage automatique traditionnel.

 

Pourquoi embaucher un Data Scientist de type B ?

Les apports d’un Data Scientist Algorithms sont nombreux. Voici 3 exemples concrets : 

  1. Système de recommandation : 

Un e-commerce doit recommander des produits appropriés à ses clients afin de maximiser ses ventes et d’améliorer l’expérience de ses clients. Grâce à l’analyse des habitudes d’achat des clients, des préférences des produits et des similitudes de profil, un ingénieur en apprentissage automatique peut créer un moteur de recommandations. Objectif : suggérer de nouveaux produits que les clients seront susceptibles d’acheter. 

  1. Prédiction du Churn

Un opérateur de télécommunications doit identifier les clients les plus susceptibles de rompre leur contrat de service dans un avenir proche. Ce cas d’usage est très important, car la baisse du nombre de clients génère automatiquement une diminution de revenus. Et le coût de rétention d’un client existant est majoritairement moins élevé que le coût d’acquisition d’un nouveau. 

Le Data Scientist Algorithms analyse les données, les comportements passés et actuels des clients en vue d’élaborer des modèles de prédiction de churn relativement précis. Ces modèles peuvent notamment envoyer des alertes lorsqu’un client risque de quitter le navire. Cela peut permettre à l’entreprise de lancer des campagnes de fidélisation ou de concentrer ses efforts marketing sur les clients à risque.

  1. Maintenance prédictive

Un manufacturier doit prédire à l’avance les pannes d’équipement afin de lancer une action de maintenance pour résoudre le problème. Cela peut contribuer à :

  • prévenir les interruptions de service. Exemple : la maintenance des avions dans les compagnies aériennes.
  • améliorer la rentabilité. Exemple : maximiser le temps de disponibilité des équipements
  • garantir des performances conformes aux spécifications. Exemple : détecter les composants défectueux, mais fonctionnels. 

Ce cas d’usage implique généralement la collecte de données structurées sur les équipements (date de production, lot, modèle, etc.) ainsi que des données d’utilisation multi-structurées (entrées de log, messages d’erreur, enregistrements de capteurs, etc.). Ces données sont ensuite transmises à un algorithme d’apprentissage automatique pour prédire si l’équipement tombera en panne dans un avenir proche.

Comment reconnaître un bon Data Scientist Algorithms ?

Ces ingénieurs de la donnée doivent avoir des bases solides en matière de génie logiciel. Les fondamentaux de l’informatique, la conception d’architecture de systèmes, les structures de données, les algorithmes informatiques : tout cela ne doit plus voir de secret pour un bon Data Scientist Algorithms. 

Selon les contextes, il doit aussi savoir maitriser des outils courants comme Git pour le contrôle de version, Docker pour la conteneurisation, Kubernetes pour l’orchestration ou encore HTML/CSS/JavaScript pour le développement web.

Ces professionnels de la data doivent aussi maîtriser les réseaux internet, les protocoles de communication, les technologies de base de données, le cloud, le contrôle de version, les tests unitaires, les méthodologies agiles/scrum, la conteneurisation, le shell scripting ou encore le développement web. 

Le data scientist de type B doit également être compétent en apprentissage automatique appliqué. Cela inclut la construction de pipelines de données, la modélisation, le déploiement, la supervision des modèles déployés et leur ré-entrainement.

Les langages de programmation Python et SQL suffisent généralement pour effectuer la plupart des tâches courantes de data engineering. Mais pour construire et entraîner des modèles prédictifs, les bons Data Scientists de type B doivent savoir utiliser des librairies telles que scikit-learn, numpy, pandas et tensorflow. 

Lire l’article suivant : Quels profils de Data Scientist recruter ? (3/4)