Stage 6 mois – Data Scientist H / F – Transfer Learning
#Contexte du stage
Aujourd’hui, les modèles de machine learning sont de plus en plus abondants. En plus de la donnée qui devient plus facile d’accès et de traitement, les use-cases de data science et d’Intelligence Artificielle (IA) se multiplient. L’émergence des acteurs cloud (principalement AWS, Azure et GCP) et des outils dédiés au développement et au déploiement de modèles de Machine Learning (ML) à démocratiser l’accès à l’IA.Il devient, donc, de moins en moins nécessaire de construire des modèles de ML from scratch (de zéro). C’est à ce niveau là qu’interviennent les techniques de transfer-learning qui permettent de prendre des modèles ML déjà entraînés et de les ajuster, avec un coût en données et en puissance de calcul relativement faible, pour les use-cases cibles.
Votre mission
Au sein de la direction R&D et Innovation, vous aurez en charge de mettre en place un cadre de conception, développement, déploiement et maintien de modèles de Machine Learning basés sur des modèles pré-entraînés grâce au Transfer Learning.
Le stage se déroulera comme suit, le tout étant testé et déployé en parallèle sur des use-cases réels afin de valider en continu l’applicabilité des concepts théoriques :
- Identifier et cartographier les types de transfer learning
- d’un point de vu méthode
- d’un point de vu use-case
- comparer aux autres méthodes similaires telles que le Semi-Supervised Learning, Incremental Learning et Active Learning, voire auto-ml
- Identifier les acteurs et les outils (open source ou non) principaux
- comparer fonctionnellement, techniquement, et en termes de coûts
- Identifier et formaliser les mesures génériques (extrinsèques) d’évaluation des modèles entraînés grâce au Transfer Learning
- Finaliser et déployer les use-cases
Livrable
- mémoire de recherche
Gratification
1300€ / mois
Qui sommes-nous ?
Octopeek est une société de conseil, de formation dans le Big Data et l’Intelligence Artificielle pour les entreprises.
Octopeek accélère la transformation digitale des entreprises et façonne le futur de leur business.
Notre mission
La mission d’Octopeek est de faciliter l’accès à la data et permettre aux entreprises de décider en s’appuyant facilement sur des données : transformer la technologie en bénéfices pour le quotidien de chacun.
Nos valeurs
- Satisfaction client
- Engagements
- Respect
- Loyauté, honnêteté et bienveillance
Votre profil
Elève Data Scientist en fin de cursus type école d’ingénieur
Références bibliographiques pertinentes
Quelques ressources et références qui pourraient être pertinentes dans le cadre de votre futur stage de recherche
- https://towardsdatascience.com/5-websites-to-download-pre-trained-machine-learning-models-6d136d58f4e7
- https://modelzoo.co/
- https://medium.com/starschema-blog/transfer-learning-the-dos-and-donts-165729d66625
- Zhao, P., Hoi, S. C., Wang, J., & Li, B. (2014). Online transfer learning. Articial Intelligence, 216, 76-102.
- Wu, Q., Zhou, X., Yan, Y., Wu, H., & Min, H. (2017). Online transfer learning by leveraging multiple source domains. Knowledge and Information Systems, 52(3), 687-707.
- Liu, F., Zhang, G., & Lu, J. (2017). Heterogeneous Transfer Learning: An Unsupervised Approach. arXiv preprint arXiv:1701.02511.
- Day, O., & Khoshgoftaar, T. M. (2017). A survey on heterogeneous transfer learning. Journal of Big Data, 4(1), 29.
- Weiss, K., Khoshgoftaar, T. M., & Wang, D. (2016). A survey of transfer learning. Journal of Big Data, 3(1), 9.
- Yang, Q., Chen, Y., Xue, G. R., Dai, W., & Yu, Y. (2009, August). Heterogeneous transfer learning for image clustering via the social web. In Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th international joint Conference on Natural Language Processing of the AFNLP: Volume 1-Volume 1 (pp. 1-9). Association for Computational Linguistics.
Pour postuler
Merci d’adresser CV + lettre de motivation à rh-admin@octopeek.com en rappelant la référence de l’annonce.