Die Data Engineering Reise

Podcast-Folgen zu diversen Data Engineering Themen. Begib dich mit mir auf die Reise hin zu einem Experten in Sachen Data Engineering und gehe den Unternehmens-Datenschätzen auf den Grund. Was steckt eigentlich in "BigData" und den großen Lagacy-Datenbanken der Unternehmen? Wir finden es gemeinsam heraus. Tools wie die größten Cloud Plattformen der Welt (AWS, Azure, GCP, ...), sowie Programmiersprachen (Python, ...), Scheduling Tools etc. helfen uns bei der Erschließung und der Bereitstellung spannender Insights.

Data Vault Tabellentypen - Hubs, Links, Satelliten

Eine Modellierungsmethode, um Daten im Data Warehouse zu strukturieren, ist das Data Vault Konzept. Was sind nun aber die Haupttabellentypen?

11-06
00:03

Gründe für die Normalisierung in Datenbanken

Normalisierung wird in Datenbanken angewendet, um Duplikate und Datenredundanz zu vermeiden, die Integrität und Konsistenz der Daten zu gewährleisten und die Performance der Datenbank zu verbessern.

02-09
04:14

NoSQL Datenbanken vs Relationale Datenbanken

Relationale Datenbanken nutzen eine tabellarische Struktur, während NoSQL-Datenbanken eine flexible nicht-relationale Struktur verwenden.

02-08
02:17

Normalisierung in Datenbanken

Redundanzen und Abhängigkeiten vermeiden.

02-07
08:10

Primärschlüssel und Fremdschlüssel in Datenbanken

Ein Primärschlüssel ist ein eindeutiger Wert, der verwendet wird, um einen Datensatz in einer Tabelle zu identifizieren. Ein Fremdschlüssel hingegen ist ein Primärschlüssel einer anderen Tabelle, der in einer anderen Tabelle verwendet wird, um eine Beziehung zwischen den Tabellen herzustellen.

02-06
04:54

Materialized Views vs Views / SQL Datenbanken und Performance-Verbesserung

Eine Materialized View speichert das Ergebnis einer Abfrage und stellt es als eine separate Tabelle bereit, während eine View lediglich eine virtuelle Tabelle darstellt, die auf das Ergebnis einer Abfrage verweist. Materialized Views bieten eine bessere Performance, da das Ergebnis einer Abfrage bereits gespeichert ist, während Views jedes Mal neu berechnet werden müssen, wenn sie abgefragt werden.

02-05
06:51

SQL Basics

Einige kurze Sätze zum Thema SQL und relationale Datenbanken.

02-04
04:13

Scrum im Data Engineering

Scrum ist ein agiles Projektmanagement-Framework, das einen iterativen Ansatz und eine enge Zusammenarbeit und Kommunikation zwischen Teammitgliedern bei der Produktentwicklung fördert. Es verwendet regelmäßige Überprüfungen, Anpassungen und kurze Iterationen (Sprints), um eine hohe Kundenzufriedenheit zu erreichen.

02-03
07:09

Einfache SQL Interview Frage

Frage: Wie kann man in SQL die häufigsten Werte in einer Spalte finden?

02-03
04:21

Data Vault - Daten Modellierung - flexibel und skalierbar

Schneller Überblick über das Data Vault Konzept. Mit Beispiel für die Hub, Link und Sateliten Tabellen.

02-02
08:38

Dimensional Modeling vs Entity Relationship Modeling

Die eine Modellierungsvariante ist eher für Data Warehouses und die andere für OLTP Systeme.

02-01
04:15

ACID Konzept in Datenbankmanagement-Systemen

ACID ist ein Konzept für Datenbankmanagement-Systeme, das Atomarität, Konsistenz, Isolation und Dauerhaftigkeit garantiert, um die Integrität und Zuverlässigkeit von Transaktionen in einer Datenbank zu gewährleisten.

02-01
03:58

Datenmodellierung kurzer Einblick und verschiedene Modelle

Datawarehouse-Modellierung kurzer Einblick. https://larsmuellensiefen.substack.com/

01-30
04:37

ER- Diagramm - OLTP Datenbank-Modellieren

Datenbankmodellierung mit ER Diagramm. https://larsmuellensiefen.substack.com/

01-30
06:04

FinOps => Cloud Finanzverwaltung und -optimierung

FinOps ist ein Ansatz zur Finanzverwaltung und -optimierung in Unternehmen, die Cloud-Computing-Dienste nutzen. Es beinhaltet die Verwaltung von Kosten, Compliance, Risiken und Governance in Bezug auf Cloud-Dienste, sowie Überwachung und Optimierung der Nutzung von Ressourcen, um sicherzustellen, dass sie effizient und kosteneffektiv genutzt werden... - https://larsmuellensiefen.substack.com/

01-29
07:17

Data Fabric, was ist das?

Ein Data Fabric ist ein Konzept der Datenarchitektur, das es ermöglicht, Daten auf flexible und skalierbare Weise zu organisieren und zu verwalten, über mehrere Systeme und Standorte hinweg und ermöglicht eine einheitliche und integrierte Datenverwaltung. https://larsmuellensiefen.substack.com/

01-29
05:41

KI Systeme - Einsatz in der Praxis ChatGPT o. ä. als Data Engineer

Ersetzten ChatGPT und ähnliche KI basierte Werkzeuge bereits einen Data Engineer?

01-28
04:31

KI als Werkzeug

Insgesamt ist KI ein leistungsfähiges Werkzeug, das die Effizienz und Genauigkeit von Aufgaben der Datenverarbeitung erheblich verbessern kann und Unternehmen ermöglicht, tiefere Einblicke zu gewinnen und aufgrund ihrer Daten informierte Entscheidungen zu treffen.

01-26
05:45

KI in der Datenverarbeitung

Insgesamt kann KI viele Aufgaben der Datenverarbeitung automatisieren und neue Möglichkeiten bieten, aber die menschliche Expertise und das Verständnis des Data Engineer für die spezifische Geschäftsdomäne kann entscheidend sein, um effektive Datensysteme zu entwerfen und umzusetzen.

01-25
06:53

Star Schema vs Snowflake Schema Daten Modellierung im Data Warehouse

Star Schema und Snowflake Schema sind beides Techniken, die in Data Warehouses verwendet werden, um Daten zu organisieren und zu strukturieren, damit sie leicht abgefragt und analysiert werden können.

01-24
04:36

Recommend Channels