#DataOops

57 Episodes

Reverse

Episode 58 : SQL Server 2025 et AI_GENERATE_EMBEDDINGS / MCP PowerBI

2025-12-0754:31

Episode timeline

Episode 57 : FastTransfer, DuckLake et quelques Oops

2025-10-0101:12:44

Episode timeline

Episode 56 : MongoDB

2025-07-1201:01:00

MongoDB vs PostgreSQL : différences et similarités. Démo d'Atlas SQL vs MQL MongoDB et l'IA : vecteur et search

Episode 55 : PostgreSQL 18 / DuckLake / SQL Server 2025

2025-06-22--:--

Episode timeline

Episode 54 : des nouvelles de DuckDB, des vecteurs chez les principales databases, no/low-code vs code

2025-03-2401:00:11

Des nouvelles de DuckDB avec l'interface graphique DuckDB UI, Les vecteurs dans les principales bases de données relationnelles comme Oracle, SQL Server ou PostgreSQL et comment fabriquer ses embeddings. Enfin une discussion sur les avantages et inconvénients entre la solution NO/Low Code et le Code de l'intégration à la BI

Episode 53 : Bilan 2024 des databases / dbt & dlt un duo gagnants ?

2025-01-2851:00

Episode timeline

Episode 52 : Iceberg et Delta, Migration de bases de données, Evidence.dev : Reports as Code

2024-12-0952:17

Episode timeline

Episode 51 : DuckDB v1.1 vs PostgreSQL v17 / SQL en difficulté

2024-10-2201:04:10

Episode timeline

Episode 50 : Performance d’un stockage physique récent | L’audit de sécurité dans SQL Server et PostgreSQL | Stockage objet

2024-07-15--:--

Dans cet épisode ont parle de Performance d'un stockage physique recent et la comparaison avec ce que l'on peut avoir sur du cloud public. De l'audit de sécurité dans SQL Server et PostgreSQL. Du stockage objet (S3 et Ceph), Cloud (ou pas)

Episode 49 : Migration de données et collations, Cas d’utilisations d’IA, DevOx

2024-05-28--:--

On parle : Migration/Transfert de données inter-databases et les problématiques de collations associées. Puis discussions sur les collations : performances, impacts Un REX sur un dataoops sur les datatypes text/varchar entre postgresqle et mssql Les grands cas d'usage IA : détection DevOx : retour d'Adrien sur ce qui lui a plus : Alto et Park et l'AGC (Appolo Guidance Computer : ou la programmation sous contraintes 😀 )

Episode 48 : Indexation – PostgreSQL vs MSSQL vs Oracle

2024-04-30--:--

On parle indexation dans les bases de données relationnelles et en particulier PostgreSQL, MSSQL et Oracle : index Btree, GIN, GIST, partiel ou filtré, couvrant, columnstore, FullText, Spatial, BRIN, Bitmap... Une heure de comparaison entre les 3 grands SGBDR

Episode 47 : PostgreSQL : MVCC et Vacuum – PowerBI : Analyser les performances – Modélisation One Big Table et le stockage colonne à la rescousse – Détection d’anti-pattern dans MSSQL

2024-04-06--:--

Retour pgday Paris. PostgreSQL : MVCC et Vacuum. PowerBI : Analyser les performances et quelques conseils pour les optimiser. OBT : modélisation One Big Table et le stockage colonne à la rescousse. Clause Non-Sargable et détection d'anti-pattern avec les extended events sur MSSQL

Episode 46 : Adrien Nayrat nous rejoint pour parler postgresql – DuckDB v0.10 – C/C++ bannis par les USA ?

2024-03-10--:--

Adrien Nayrat un spécialiste postgresql rejoint l'équipe Dataoops, il se présente et en profite pour nous rappeler l'histoire de postgresql et glisser quelques conseils sur les extensions. La deuxième partie concerne DuckDB et les nouveautés de la v0.10 ainsi que des remarques sur une nouvelle concernant les languages C/C++ considérés comme "à risques" par l'administration américaine.

Episode 45 : Chargement massif 1 Milliard de lignes dans un columnstore SQL Server en 6min, DuckDB v0.10, MS Fabrics et Vacuum

2024-02-1901:07:09

Comment accélérer un chargement massif dans un columnstore sur SQL Server : un retour d'expérience approfondi avec 1 milliard de lignes chargé en 6 minutes. DuckDB passe en v0.10 et stabilise son stockage. MS Fabric annonce que le Vacuum sera bientot possible et voici pourquoi c'est une bonne chose...

Episode 44 : REX dataoops modélisation et postgresql performance, DuckDB stars, MS Fabric ratio prix/performance

2024-01-3101:06:09

REX sur des erreurs de modélisation avec des vues trop imbriquées, performance postgresql windows vs linux. DuckDB une star sur Github qui rejoint Postgresql. MS Fabric des prix d'appel pour les entreprises avec un ratio prix/performance attractif.

Episode 43 : bilan 2023 une année spéciale pour la data avec l’émergence de l’IA et la progression des stockages objets et lakehouse

2023-12-3101:02:01

Episode 43 : bilan 2023 avec les lakehouses, la gouvernance des données, les bases de données vectorielles, les IA génératives et autres LLM, Oracle Cloud et les bases Autonomous

Episode 42 : MSSQL Server replication oops / Qdrant, PostgresML et LanceDB / chdb / tpch / oracle autonomous db

2023-12-26--:--

Episode timeline

Episode 41 : Onyxia et SSP Cloud avec Frederic Comte

2023-12-20--:--

Onyxia est une UX open source pour mettre en place un datalab avec des services basés sur des containers et orchestrés par K8s. Minio pour le stockage, Keycloak et Vault pour la sécurité s'intègre parfaitement. Cette solution est mise en oeuvre à l'INSEE avec le datalab SSP et Frederic Comte, Architecte Data à l'INSEE nous en explique les fondements et les avantages.

Episode 40 – Microsoft Fabric passe en GA

2023-12-0601:07:10

Microsoft Fabric passe en GA : on en parle

Episode 39 : Interview Sylvain Lesage, Développeur chez Hugging Face

2023-11-1901:05:28

Une interview de Sylvain Lesage développeur chez Hugging Face dans l'équipe en charge de la prévisualisation des datasets : le dataset viewer. Il nous parle de son parcours et de son expérience chez Hugging Face, une société très inspirée dans le monde de l'IA.

#box-pro-ellipsis-177618861864665{-webkit-line-clamp:2;}#DataOops