DiscoverAttention Heads - Schweizer Perspektiven auf KI und die Technologie von morgenDeepSeek V3: Open-Source-Powerhouse – Das Geheimnis hinter dem Hype
DeepSeek V3: Open-Source-Powerhouse – Das Geheimnis hinter dem Hype

DeepSeek V3: Open-Source-Powerhouse – Das Geheimnis hinter dem Hype

Update: 2025-02-22
Share

Description

In dieser Folge nehmen wir das DeepSeek V3 Paper genau unter die Lupe – das Open-Source-Powerhouse, das aktuell für Furore in der KI-Szene sorgt. Wir erklären, warum dieses Modell mit seinen 671 Milliarden Parametern (37 Milliarden aktiv pro Token) und innovativen Architekturen wie Multi-Head Latent Attention und Mixture-of-Experts den Markt revolutioniert. Dabei beleuchten wir, wie DeepSeek V3 trotz geringer Kosten (nur ca. 5,58 Mio. USD für das Training) durch eine effiziente Nutzung von Nvidia H800 Chips und einen sparsamen Datenaufwand beeindruckende Leistungen erzielt. Erfahrt, was hinter dem Hype steckt, welche technischen Neuerungen das Modell auszeichnen und warum es als Gamechanger in der Open-Source-KI gilt.


Comments 
loading
In Channel
Wenn KI tötet

Wenn KI tötet

2024-12-2101:11:39

loading
00:00
00:00
1.0x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

DeepSeek V3: Open-Source-Powerhouse – Das Geheimnis hinter dem Hype

DeepSeek V3: Open-Source-Powerhouse – Das Geheimnis hinter dem Hype

Joel, Marius