DiscoverSciences des données - Stéphane Mallat
Sciences des données - Stéphane Mallat
Claim Ownership

Sciences des données - Stéphane Mallat

Author: Collège de France

Subscribed: 161Played: 1,794
Share

Description

Traiter des données pour valider une hypothèse ou estimer des paramètres est longtemps resté du ressort exclusif des statistiques. Cependant, l'augmentation de leur dimension a fait exploser la combinatoire des possibles. Cette malédiction de la dimensionalité est une difficulté centrale de l'analyse de données, que ce soit des images, sons, textes, ou des mesures expérimentales comme en physique, biologie ou économie. Modéliser et représenter les structures cachées des données fait appel à diverses branches des mathématiques, mais aussi à l'informatique. Les algorithmes d'apprentissage statistique, comme les réseaux de neurones, sont configurés pour optimiser l'analyse des données à partir d'exemples. Ils sont à l'origine des résultats spectaculaires de l'intelligence artificielle. Les applications scientifiques, industrielles et sociétales sont considérables, et leurs performances progressent bien plus vite que notre maîtrise de leurs propriétés mathématiques.

La chaire propose un enseignement de mathématiques appliquées, qui tente de combler le fossé entre la jungle des nouveaux développements algorithmiques et la compréhension des principes généraux sous-jacents. Les applications couvrent tous les aspects du traitement du signal et de l'apprentissage statistique. Au-delà des statistiques et des probabilités, cela fait appel à l'analyse harmonique, à l'optimisation et à la géométrie. L'étude d'applications et de nouveaux algorithmes est proposée dans le cadre de challenges de données, qui sont organisés par la chaire.

L'équipe de recherche de Stéphane Mallat à l'ENS étudie les principes permettant de structurer l'analyse de données pour échapper à la malédiction de la dimensionalité. Elle développe notamment des modèles de réseaux de neurones, basés sur des principes de séparation d'échelles par ondelettes, de parcimonie et d'invariance. Les applications concernent aussi bien la reconnaissance d'images ou de sons que l'estimation de mesures physiques. Pour plus d'informations, on pourra consulter le site internet de l'équipe de recherche.

71 Episodes
Reverse
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-2024Séminaire - Francis Bach : Une vision alternative des modèles de diffusion par débruitage
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-202408 - Apprentissage et génération par échantillonnage aléatoire
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-2024Séminaire - Christian Robert : Calculs bayésiens approximés (ABC) : d'un substitut élémentaire à une nouvelle forme d'inférence
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-202407 - Apprentissage et génération par échantillonnage aléatoire
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-2024Séminaire - Randal Douc : Échantillonnage par distributions auxiliaires : de la téléportation à l'échantillonnage d'importance par chaîne de Markov
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-202406 - Apprentissage et génération par échantillonnage aléatoire
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-2024Séminaire - Michèle Sebag : Modèles causaux : les modèles génératifs en support à des interventions
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-202405 - Apprentissage et génération par échantillonnage aléatoire
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-2024Séminaire - Marylou Gabrié : Modèles génératifs pour la simulation de systèmes à l'équilibre
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-202404 - Apprentissage et génération par échantillonnage aléatoire
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-2024Séminaire - Stéphane Mallat : Présentations de gagnants des challenges 2023
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-202403 - Apprentissage et génération par échantillonnage aléatoire
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-2024Séminaire - Stéphane Mallat : Apprentissage et génération par échantillonnage aléatoire : Challenges de données 2
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-202402 - Apprentissage et génération par échantillonnage aléatoire
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-2024Séminaire - Stéphane Mallat : Apprentissage et génération par échantillonnage aléatoire : Challenges de données 1
Stéphane MallatCollège de FranceScience des donnéesAnnée 2023-202401 - Apprentissage et génération par échantillonnage aléatoire
Stéphane MallatCollège de FranceScience des donnéesAnnée 2022-2023Modèles, information et physique statistiqueSéminaire - Marc Mézard : Physique statistique et inférence : le défi des données structuréesLes cinq dernières décennies ont vu la construction d'une nouvelle branche de physique statistique qui étudie les systèmes fortement désordonnés. Partant de l'étude des verres de spin, ce champ s'est étendu et s'est intéressé à des systèmes complexes dans différentes branches de la science, allant de l'informatique à la biologie en passant par la théorie de l'information. Quatre obstacles principaux ont dû être surmontés pour développer la théorie des systèmes désordonnés en très grande dimension : étudier des ensembles statistiques d'échantillons, analyser quantitativement le désordre microscopique, explorer des paysages d'énergie complexes, comprendre leurs liens avec les propriétés dynamiques. Cet exposé proposera tout d'abord une vision synthétique de ces développements. Il décrira ensuite le nouveau défi posé par l'application de ces méthodes en apprentissage machine, celle du désordre structuré.
Stéphane MallatCollège de FranceScience des donnéesAnnée 2022-2023Modèles, information et physique statistiqueLe cours introduit les outils mathématiques permettant de modéliser des données en grande dimension, en lien avec la physique statistique et la théorie de l'information. La physique statistique montre que les lois macroscopiques résultent de la statistique des interactions de particules microscopiques.La théorie de l'information relie cette perspective avec la modélisation de données, à travers les notions d'entropie, d'énergie de Gibbs et de dépendances locales. Les applications concernent l'inférence de modèles, la génération de nouvelles données ou la compression, ainsi que la résolution de problèmes inverses.
Stéphane MallatCollège de FranceScience des donnéesAnnée 2022-2023Modèles, information et physique statistiqueSéminaire - Erwan Allys : Modélisation et séparation statistiques de composantes en astrophysiqueUn des défis de l'astrophysique et de la cosmologie est d'étudier des processus non linéaires complexes à partir d'un nombre souvent limité d'observations multicomposantes. Cette tâche est rendue d'autant plus difficile que la modélisation physique de ces processus n'est pas toujours achevée, ce qui implique de ne reposer que sur les observations disponibles, sans étape d'entraînement préalable. Dans ce séminaire, on étudiera comment construire des modèles performants en basse dimension prenant en compte le caractère physique et la régularité des processus étudiés. Ces modèles de maximum d'entropie, construit à partir de représentations de type scattering transforms, peuvent être construits directement à partir des données observationnelles. On discutera ensuite comment ces outils permettent de développer de nouveaux types de séparations de composantes, permettant notamment d'estimer les statistiques, et donc de construire un modèle, de processus inconnus à partir d'observations multicomposantes.
Stéphane MallatCollège de FranceScience des donnéesAnnée 2022-2023Modèles, information et physique statistiqueLe cours introduit les outils mathématiques permettant de modéliser des données en grande dimension, en lien avec la physique statistique et la théorie de l'information. La physique statistique montre que les lois macroscopiques résultent de la statistique des interactions de particules microscopiques.La théorie de l'information relie cette perspective avec la modélisation de données, à travers les notions d'entropie, d'énergie de Gibbs et de dépendances locales. Les applications concernent l'inférence de modèles, la génération de nouvelles données ou la compression, ainsi que la résolution de problèmes inverses.
loading