STP077: Liste von Listen

Update: 2025-08-21

Description

Als der inoffizielle Wikipedia-Vorlesepodcast sehen wir es als unsere Pflicht, eine Eigenheit dieser anzusprechen: nämlich Listen von Listen, obwohl es uns eigentlich um Listen im Speicher geht.

Shownotes

Rückbezüge:
- fundamentale Datenstrukturen siehe STP071: Felder/Listen, ~~assoziative Datenfelder (Maps), Graphen~~
- Frage: Wie stellt man solche Datenstrukturen im Speicher dar? Gibt es darauf überhaupt die eine richtige Antwort?
- algorithmische Komplexität siehe STP029: Liste mit n Elementen ausdrucken in O(n), aber sortieren in O(n log(n)) bis O(n^2)
- Speicherallokation siehe STP047 und Speicherschutz siehe STP019: Bezug wird gleich klar werden

Listen kann man als verkettete Liste darstellen
- klassisches Studienobjekt in Erstsemester-Datenstrukturen-Vorlesungen
- intuitiv verständlich: Parallele zu segmentierten Halsketten
- wahlweise einfach oder doppelt verkettet
- effiziente Operationen: Einfügen am Ende, Entfernen am Ende
- ineffiziente Operationen: Einfügen in der Mitte, Wahlzugriff/Suche
- Vergleichstabelle mit Darstellung der Zeiteffizienz
- alles in allem durchwachsene Performance -> geht es besser?

alternative Strategie: interne Darstellung der Liste als balancierter Baum (oder evtl. "ausgeglichener Baum")
- außerdem Link auf die englische Wikipedia, die nicht nur unbalancierte, sondern auch balancierte Bäume zeigt
- kann nur sortierte Listen darstellen
- Idee: Wurzelknoten hat das Median-Element, dann der linke Ast alle kleineren und der rechte Ast alle größeren Elemente
- im Grunde alle gängigen Operationen mittelschnell: Wahlzugriff/Suche, Einfügen an beliebigen Stellen, Entfernen von beliebigen Stellen (Änderungen erfordern im Allgemeinen ein Austarieren des Baumes)
- große Variation von Implementationsstrategien für dieses Balancieren -> hier nicht

verkettete Listen und balancierte Bäume sehen auf dem Papier ziemlich effizient aus, haben aber in ihrer reinen Form pathologisch schlechtes Speicherverhalten
- hoher Platzverbrauch: z.B. bei einfach bzw. doppelt verketteten Listen muss zu jedem Element müssen noch eine bzw. zwei Speicheradressen abgelegt werden
- hohe Allokationslast: wenn nicht eine Arena oder ein vergleichbarer Small Object Allocator verwendet wird
- schlechte Lokalität: beim Durchlaufen nachfolgender Elemente werden im schlimmsten Fall ständig unterschiedliche Speicherseiten getroffen, was fortlaufend Seitenfehler verursachen kann

in der Praxis mit Abstand dominante Implementationsstrategie: dynamische Felder
- Beobachtung: Einfügen oder Löschen an beliebigen Stellen wird kaum gemacht; man hängt eher mehrmals ans Ende an und sortiert dann, falls nötig
- Idee: Optimieren auf Einfügen am Ende bei möglichst optimalen Speicherverhalten
- Umsetzung: einfaches Feld (ein fortlaufendes Stück Speicher, in dem mehrere Elemente hintereinander abgelegt werden) mit aktuellem Füllstand N und Kapazität K
- Einfügen ans Ende: normalerweise einfach N erhöhen; wenn N nicht in K passt, größeren Speicher reservieren, alles hinüberkopieren und die alten Speicherallokation verwerfen
- Löschen vom Ende: einfach N reduzieren, keine Deallokation erforderlich
- Einfügen am Anfang oder in die Mitte: alle Elemente dahinter nach hinten verschieben

nahezu optimales Speicherverhalten von dynamischen Feldern begründet ihre Dominanz
- Platzverbrauch: neben der Speichergröße der Elemente selber nur zwei Zahlen (N und K)
- Allokationslast: Vergrößern geht für gewöhnlich in exponentiellen Schritten und wird damit für wachsende Listen immer seltener nötig
- Lokalität: lineare Suche durch die Liste geht linear durch den Speicher hindurch -> folgende Speicherseiten können vom Prozessor oft schon auf Verdacht vorgeladen werden
- trotzdem: die anderen Datenstrukturen haben auch ihre Berechtigung (z.B. modifizierte balancierte Bäume als Basis für Datenbank-Indizes)

Xyrill will auch noch auf analoge Weise über Maps und Graphen reden -> weiter in STP079

Comments

In Channel

STP082: Literatur: Vom Mythos des Mann-Monats, Teil 3

2025-12-0401:41:20

STP081: Barrierefreiheit im Web (Teil 1)

2025-11-1301:04:52

STP080: Common Weakness Enumeration (Teil 2)

2025-10-2338:50

STP079: Feld von Feldern

2025-10-0201:02:44

STP078: Common Weakness Enumeration (Teil 1)

2025-09-1101:04:59

STP077: Liste von Listen

2025-08-2157:06

STP076: Debugging

2025-07-3158:36

STP075: Prozessorarchitekturen im Vergleich

2025-07-1056:22

STP074: Literatur: Vom Mythos des Mann-Monats, Teil 2

2025-06-1901:09:25

STP073: Was aus Holz

2025-05-2901:11:56

STP072: Der Datentypeneisberg

2025-05-0848:57

STP071: Das Periodensystem der Datentypen

2025-04-1701:02:01

STP070: Blitzgespräche

2025-03-2759:01

STP069: Anatomie einer GUI

2025-03-0601:10:47

STP068: Literatur: Vom Mythos des Mann-Monats

2025-02-1301:20:06

STP067: Linux auf dem Desktop

2025-01-2358:56

STP066: Desktop-PC basteln, Teil 2

2025-01-0201:09:06

STP065: Desktop-PC basteln

2024-12-1151:15

STP064: Cursed Computer Iceberg Meme, Runde 2

2024-11-2101:07:33

STP063: Fleißige Biber

2024-10-3101:00:50

00:00

#box-pro-ellipsis-176535161785880{-webkit-line-clamp:2;}STP077: Liste von Listen

Shownotes

STP077: Liste von Listen

Xyrillian Noises

STP077: Liste von Listen