Offre de Stage de Recherche en IA : Explorer les Frontières de l’Apprentissage Auto-Supervisé et de la Distillation de Données
Plongez au cœur des défis les plus stimulants de l’intelligence artificielle moderne ! Face à l’explosion exponentielle des données numériques, comment développer des modèles d’IA à la fois performants et économes en ressources ? C’est précisément la question qui anime notre laboratoire et que nous vous proposons d’explorer ensemble.
L’Université Paris Cité, à travers le Laboratoire d’Informatique Paris Descartes (LIPADE) et son équipe « Systèmes Intelligents de Perception », ouvre une place de stage de niveau Master 2 ou fin d’études d’ingénieur. Ce projet vous immergera dans l’intersection fascinante entre deux domaines de recherche particulièrement prometteurs : l’apprentissage auto-supervisé et la distillation de jeux de données.
Au Cœur des Enjeux Scientifiques
L’Apprentissage Auto-Supervisé : Repenser l’Apprentissage Machine
Imaginez pouvoir apprendre à un modèle à comprendre le monde sans avoir à étiqueter manuellement des millions d’images ou de textes. C’est la promesse de l’apprentissage auto-supervisé (SSL). Contrairement aux approches traditionnelles qui nécessitent un fastidieux travail d’annotation, le SSL permet aux modèles de générer leurs propres signaux d’apprentissage directement à partir des données brutes. Par exemple, un modèle pourrait apprendre à reconnaître des objets en devinant des parties manquantes d’images ou en reconstruisant des séquences temporelles.
La Distillation de Données : L’Art de la Synthèse Intelligente
De l’autre côté, la distillation de jeux de données répond à un défi tout aussi crucial : comment condenser l’immense volume d’informations disponibles sans perdre l’essentiel ? Prenons l’exemple d’ImageNet et ses millions d’images. La distillation vise à créer un jeu de données synthétique beaucoup plus compact – peut-être seulement quelques dizaines d’images par classe – mais capable d’entraîner des modèles presque aussi performants que l’ensemble original. Cette approche ouvre des perspectives formidables pour le déploiement d’IA sur des appareils embarqués ou l’accélération des cycles de recherche.
Votre Mission : Créer des Synergies Innovantes
Le cœur de ce stage consiste à explorer comment ces deux approches peuvent se renforcer mutuellement. Serait-il possible d’utiliser des jeux de données distillés pour rendre l’apprentissage auto-supervisé plus accessible et moins coûteux en calcul ? C’est l’hypothèse passionnante que nous vous proposons d’étudier.
Votre parcours de recherche s’articulera autour de plusieurs axes :
– Une immersion dans la littérature scientifique récente pour maîtriser les méthodes state-of-the-art (comme SimCLR ou MoCo pour le SSL, et les techniques de condensation de données)
– La mise en œuvre et l’adaptation d’algorithmes existants, voire la proposition d’approches innovantes
– La conception et la réalisation d’expérimentations rigoureuses comparant les performances sur des jeux de données complets versus distillés
– Une analyse approfondie des résultats pour comprendre les forces et limites de cette approche hybride
Le Profil que Nous Recherchons
Nous cherchons un(e) étudiant(e) passionné(e) par la recherche en IA, avec :
– Une solide formation en apprentissage automatique, vision par ordinateur et deep learning
– Une excellente maîtrise de Python et des frameworks comme PyTorch ou TensorFlow
– Une capacité avérée à travailler en autonomie tout en s’intégrant dans une équipe
– Le goût pour la lecture et la synthèse d’articles scientifiques complexes
Ce Que Nous Vous Offrons
En rejoignant le LIPADE, vous intégrerez un environnement de recherche stimulant au cœur du campus des Saints-Pères, à Paris. Vous bénéficierez d’un encadrement personnalisé par des chercheurs expérimentés et aurez l’opportunité de contribuer à des avancées scientifiques concrètes. Les résultats les plus significatifs pourront donner lieu à une publication scientifique.
Informations Pratiques
– Durée : 6 mois
– Début : Février 2026
– Lieu : Campus des Saints-Pères, Paris
– Rémunération : Conforme à la réglementation en vigueur
Si cette aventure scientifique vous intéresse, envoyez-nous votre CV, une lettre de motivation personnalisée et vos relevés de notes à :
camille.kurtz@u-paris.fr Ou ayoub.karine@u-paris.fr
Une synthèse bibliographique ciblée
Plutôt que de vous noyer sous une montagne de lectures, commencez par vous concentrer sur l'essentiel. Demandez à votre encadrant de vous indiquer les trois articles fondamentaux qui définissent véritablement l'état de l'art dans votre domaine, notamment en Distillation de Jeu de Données et en Apprentissage Auto-Supervisé (SSL). L'objectif n'est pas de tout lire, mais de bien comprendre les fondations. Prenez le temps d'assimiler parfaitement les métriques de performance utilisées dans ces références - c'est souvent là que se cachent les subtilités importantes.
Comprendre le "pourquoi" derrière le projet
Au-delà de la simple compréhension technique, efforcez-vous de saisir la véritable raison d'être de votre sujet de stage. Pourquoi cette combinaison spécifique entre SSL et Distillation est-elle pertinente aujourd'hui ? Quel problème de recherche concret votre travail vise-t-il à résoudre ? Identifiez clairement la lacune dans la littérature scientifique que vous allez contribuer à combler. Cette vision d'ensemble vous guidera tout au long de votre stage.
Une mise en place rapide et efficace
Évitez le piège de passer tout votre premier mois uniquement sur la lecture théorique. Dès les 2-3 premières semaines, lancez-vous concrètement en essayant de reproduire les résultats de base (le "baseline") d'un article clé. Cette approche pratique vous permettra de vous familiariser rapidement avec l'environnement de calcul, les outils de développement et le code existant. C'est souvent en mettant les mains dans le cambouis qu'on comprend le mieux les véritables enjeux du projet.

