DiscoverSciences des données - Stéphane Mallat
Sciences des données - Stéphane Mallat
Claim Ownership

Sciences des données - Stéphane Mallat

Author: Collège de France

Subscribed: 171Played: 1,835
Share

Description

Traiter des données pour valider une hypothèse ou estimer des paramètres est longtemps resté du ressort exclusif des statistiques. Cependant, l'augmentation de leur dimension a fait exploser la combinatoire des possibles. Cette malédiction de la dimensionalité est une difficulté centrale de l'analyse de données, que ce soit des images, sons, textes, ou des mesures expérimentales comme en physique, biologie ou économie. Modéliser et représenter les structures cachées des données fait appel à diverses branches des mathématiques, mais aussi à l'informatique. Les algorithmes d'apprentissage statistique, comme les réseaux de neurones, sont configurés pour optimiser l'analyse des données à partir d'exemples. Ils sont à l'origine des résultats spectaculaires de l'intelligence artificielle. Les applications scientifiques, industrielles et sociétales sont considérables, et leurs performances progressent bien plus vite que notre maîtrise de leurs propriétés mathématiques.

La chaire propose un enseignement de mathématiques appliquées, qui tente de combler le fossé entre la jungle des nouveaux développements algorithmiques et la compréhension des principes généraux sous-jacents. Les applications couvrent tous les aspects du traitement du signal et de l'apprentissage statistique. Au-delà des statistiques et des probabilités, cela fait appel à l'analyse harmonique, à l'optimisation et à la géométrie. L'étude d'applications et de nouveaux algorithmes est proposée dans le cadre de challenges de données, qui sont organisés par la chaire.

L'équipe de recherche de Stéphane Mallat à l'ENS étudie les principes permettant de structurer l'analyse de données pour échapper à la malédiction de la dimensionalité. Elle développe notamment des modèles de réseaux de neurones, basés sur des principes de séparation d'échelles par ondelettes, de parcimonie et d'invariance. Les applications concernent aussi bien la reconnaissance d'images ou de sons que l'estimation de mesures physiques. Pour plus d'informations, on pourra consulter le site internet de l'équipe de recherche.

87 Episodes
Reverse
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-2025Séminaire - Génération de données en IA par transport et débruitage : Prédictions par interpolations stochastiquesIntervenant :Éric Van Den Ejden
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-2025Génération de données en IA par transport et débruitage (8)
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-2025Séminaire - Génération de données en IA par transport et débruitage : Problèmes inverses et IA générativesIntervenant :Éric MoulinesProfesseur à l'École Polytechnique
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-2025Génération de données en IA par transport et débruitage (7)
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-2025Séminaire - Génération de données en IA par transport et débruitage : Dynamique des modèles de diffusionsIntervenant :Tony BonnaireProfesseur à PSL
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-2025Génération de données en IA par transport et débruitage (6)
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-2025Séminaire - Génération de données en IA par transport et débruitage : Des modèles de diffusion aux ponts de SchrödingerRésuméLes modèles de diffusion ont révolutionné l'IA générative. Conceptuellement, ces méthodes définissent un mécanisme de transport d'une distribution de bruit vers une distribution de données. Des travaux récents ont étendu ce cadre pour définir des transports entre des distributions arbitraires, élargissant considérablement le potentiel de ces modèles de diffusion. Cependant, les méthodes existantes échouent souvent à approcher le transport optimal entre ces distributions. Dans cette présentation, nous montrerons comment il est possible de modifier les méthodologies actuelles pour obtenir les ponts de Schrödinger – une variante à entropie régularisée du transport optimal dynamique.Intervenant :Valentin De BortoliGoogle DeepMind
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-202505 - Génération de données en IA par transport et débruitage (5)
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-2025Séminaire - Génération de données en IA par transport et débruitage : Transport optimal et diffusions en apprentissage statistiqueIntervenant :Gabriel PeyréDirecteur de recherche au CNRS
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-202504 - Génération de données en IA par transport et débruitage (4)
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-2025Séminaire - Génération de données en IA par transport et débruitage : Présentations des gagnants des challenges 2024
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-202503 - Génération de données en IA par transport et débruitage (3)
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-2025Séminaire - Stéphane Mallat : Challenge de données 2025 (2)
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-202502 - Génération de données en IA par transport et débruitage (2)
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-2025Séminaire - Stéphane Mallat : Challenge de données 2025 (1)
Stéphane MallatCollège de FranceScience des donnéesAnnée 2024-202501 - Génération de données en IA par transport et débruitageLe cours présente l'état de l'art de la génération d'images, de sons et de données scientifiques par réseaux de neurones profonds. On se concentre sur l'échantillonnage de distributions de probabilités obtenues par transport d'un bruit blanc Gaussien. Après une revue de l'état de l'art, on étudie le transport par score diffusion, qui effectue un débruitage progressif pour générer des données (images, sons, …). Cela nécessite d'estimer le score de la densité de probabilité, avec un réseau de neurone profond. Le cours introduit les bases mathématiques, algorithmiques avec leurs applications. Les sujets suivants seront abordés :Transport de probabilités en apprentissage profond. Génération et échantillonnage par transport ;Équation de Fokker Plank donnant l'évolution de la densité de probabilité d'un système dynamique. Équation de Langevin pour l'échantillonnage de probabilités ;Génération de données par score diffusion. Estimation du score par débruitage avec la formule de Tweety-Myasawa ;Apprentissage du score avec des réseaux de neurones profonds. Généralisation de l'apprentissage. Applications à la génération d''images et de sons ;Analyse du calcul effectué par les réseaux de neurones. Débruitage et parcimonie dans des bases orthogonales ;Génération de données conditionnée par une information complémentaire ;Interpolant stochastiques pour la prédiction. Applications à la prédiction de systèmes physiques chaotiques comme la météorologie.
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-2024Séminaire - Francis Bach : Une vision alternative des modèles de diffusion par débruitage
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-202408 - Apprentissage et génération par échantillonnage aléatoire
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-2024Séminaire - Christian Robert : Calculs bayésiens approximés (ABC) : d'un substitut élémentaire à une nouvelle forme d'inférence
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-202407 - Apprentissage et génération par échantillonnage aléatoire
loading
Comments