#54 - Die Zukunft von LLMs: Retrieval Augmented Generation mit Tanja Nündel, Teil 2

Update: 2024-02-08

Description

In „Chatbots und KI“ diskutiert Thomas Bahn mit interessanten Gästen aus Wirtschaft und Wissenschaft über Nutzen, Anwendungen und Erfahrungen aus den Bereichen Chatbots und Künstliche Intelligenz.

Thema der heutigen Folge:
Wenn Unternehmen heute ein großes Sprachmodell wie ChatGPT produktiv einsetzen wollen, gibt es eine Reihe von Herausforderungen, die gelöst werden müssen, um zuverlässige, vertrauenswürdige, sichere und gesetzeskonforme Ergebnisse zu erzielen.
Ein großer Bereich, in dem derzeit geforscht und gearbeitet wird, ist die Richtigkeit und Sicherheit der Daten, insbesondere die folgenden drei Punkte: Halluzinationen, Datentrennung und Datenschutz.
Einer der vielversprechendsten Lösungsansätze ist die sogenannte Retrieval Augmented Generation (RAG), die verspricht, die aktuellen Probleme der LLMs kostengünstig und zuverlässig zu lösen.

Im zweiten Teil des Interviews mit Tanja Nündel geht es darum, wie Retrieval Augmented Generation die Probleme der Halluzination, der Datenkapselung und des Datenschutzes lösen kann, welche Voraussetzungen dafür z.B. in einem KMU erfüllt sein müssen und wie dies konkret in einem Chatbot-Projekt aussehen könnte.

Zeitstempel:
00:00 Intro
01:06 Wie wird das Problem der Datenrichtigkeit durch Retrieval Augmented Generation gelöst?
02:45 Datenkapselung in großen Sprachmodellen

06:23 Große Sprachmodelle selbst hosten

08:00 Datenschutz gewährleisten
10:21 Wissensmanagement als Voraussetzung für Retrieval Augmented Generation
12:10 Retrieval Augmented Generation mit einem Chatbot kombinieren
16:20 Ausblick: Retrieval Augmented Generation als Standardmethode
00:22:30 Outro

Weitere Informationen:

Oliver Schonschek, Aug 2023
"Lässt sich ChatGPT datenschutzgerecht nutzen?"
https://www.security-insider.de/laesst-sich-chatgpt-datenschutzgerecht-nutzen-a-8db9b6e37c1762d7135dd06c5e61b6bf/

Najeeb Nabwani, Sept 2023
"Full Fine-Tuning, PEFT, Prompt Engineering, and RAG: Which One Is Right for You?"
https://deci.ai/blog/fine-tuning-peft-prompt-engineering-and-rag-which-one-is-right-for-you/

Cobus Greyling, Jan 2024
"Large Language Model Hallucination Mitigation Techniques"
https://cobusgreyling.medium.com/large-language-model-hallucination-mitigation-techniques-a75b6f873318

Patrick Lewis et al.
"Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks"
https://arxiv.org/abs/2005.11401v4

Siqing Huo et al., 2023
"Retrieving Supporting Evidence for LLMs Generated Answers" (preprint)
https://arxiv.org/abs/2306.13781v1

Cobus Greyling, Oct 2023
"Emerging RAG & Prompt Engineering Architectures for LLMs"
https://cobusgreyling.medium.com/updated-emerging-rag-prompt-engineering-architectures-for-llms-17ee62e5cbd9

Oded Ovadia et al.
"Fine-Tuning or Retrieval? Comparing Knowledge Injection in LLMs" (preprint)
https://arxiv.org/abs/2312.05934

Heute zu Gast:
Tanja Nündel ist Expertin auf dem Gebiet der KI-gestützten Langtext- und Dokumentenanalyse sowie der KI-gestützten Suche und arbeitet seit über drei Jahren bei assono. Derzeit forscht sie zum Thema Retrieval Augmented Generation (RAG).
https://www.linkedin.com/in/tanja-nuendel/

Über Thomas Bahn:
Thomas Bahn ist Geschäftsführer, Mitgründer und Gesellschafter der assono GmbH. Seit mehr als 20 Jahren berät er deutschlandweit erfolgreich Unternehmen rund um die Themen Software und Digitalisierung. Als Host des Podcasts „Chatbots und KI“ diskutiert Thomas Bahn mit interessanten Gästen aus Wirtschaft und Wissenschaft über Nutzen, Anwendungen und Erfahrungen aus den Bereichen Chatbots und Künstliche Intelligenz.
https://www.linkedin.com/in/thomasbahn/

Produktion:
Johannes Göttsch ist Mediengestalter und Conversational Designer bei der assono GmbH.
https://www.linkedin.com/in/johannes-goettsch/

Bei Fragen oder Anmerkungen freuen wir uns auf Ihre Nachricht an podcast@assono.de

Der Podcast wird präsentiert von assono - Wir entwickeln Chatbots, mit denen sich Menschen gerne unterhalten.

Ein Chatbot ist genau das Richtige für Ihr Unternehmen und Sie wollen mehr darüber erfahren? Gerne beraten wir Sie in einem kostenlosen Erstgespräch zu Ihrem Anwendungsfall. Vereinbaren Sie dazu einen Termin auf unserer Webseite (assono.de/termin) oder rufen Sie uns an unter +49 4307 900 408. Alternativ können Sie auch einen Termin über unseren KI-Chatbot "asski" vereinbaren. Wir freuen uns auf Sie!

Comments

Top Podcasts

The Best New Comedy Podcast Right Now – June 2024 The Best News Podcast Right Now – June 2024 The Best New Business Podcast Right Now – June 2024 The Best New Sports Podcast Right Now – June 2024 The Best New True Crime Podcast Right Now – June 2024 The Best New Joe Rogan Experience Podcast Right Now – June 20 The Best New Dan Bongino Show Podcast Right Now – June 20 The Best New Mark Levin Podcast – June 2024

In Channel

#68 - KI-Sprachanalyse, Teil 2: Wie Krankheiten an der Stimme erkannt werden können mit Prof. Dagmar Schuller

2024-11-0735:31

#67 - KI-Sprachanalyse, Teil 1: Wie KI Emotionen in der Stimme erkennt mit Prof. Dagmar Schuller

2024-10-3139:56

Update in eigener Sache: Jetzt kostenlos anmelden zum assono KI-Forum in München bei IBM

2024-09-1204:41

#66 - Forschung trifft Praxis, Teil 2: Wie Chatbots im Kundenkontakt glänzen können

2024-08-2221:17

#65 - Forschung trifft Praxis, Teil 1: Wie Chatbots die Kaufabsicht von Kunden steigern können

2024-08-1528:23

#64 - Mit ChatGPT bessere Texte schreiben, Teil 2: Prompting und Feinschliff einfach erklärt

2024-07-1127:29

#63 - Mit ChatGPT bessere Texte schreiben, Teil 1: Diese Fehler sollte man vermeiden

2024-07-0428:54

#62 - KI-Governance: KI-Risiken, EU AI Act und was man deswegen tun sollte mit Georg Olowson (IBM)

2024-06-2039:11

#61 - Fehleinschätzung KI, Teil 2: Wenn Unternehmen falsche Schlüsse ziehen mit Prof. Dr. Annina Neumann

2024-06-0623:20

#60 - Fehleinschätzung KI, Teil 1: Eine irrationale Angst mit Prof. Dr. Annina Neumann

2024-05-3033:28

#59 - Wie KI hilft, Häfen, Seekabel und Pipelines besser zu schützen mit Prof. Dr.-Ing. Gerhard Schmidt

2024-05-1633:11

#58 - Chatbot-FAQ 2024, Teil 2: WhatsApp, interne Prozesse und Mehrsprachigkeit

2024-03-2816:51

#57 - Chatbot-FAQ 2024, Teil 1: LLMs, IT-Sicherheit, Projektdauer und Kosten

2024-03-2117:24

#56 - Zugängliche Zukunft: Wie Chatbots durch Leichte Sprache inklusiver werden mit Vanessa Theel

2024-03-0730:29

#55 - KI-Lernbots: Wie ChatGPT traditionelle Bildungseinrichtungen verändert mit Prof. Dr. Doris Weßels

2024-02-2244:32

#54 - Die Zukunft von LLMs: Retrieval Augmented Generation mit Tanja Nündel, Teil 2

2024-02-0822:47

#53 - Die Probleme der LLMs: Halluzinationen, Datentrennung und Datenschutz mit Tanja Nündel, Teil 1

2024-02-0124:19

#52 - Barrierefreies Design von Chatbots mit Jörg Morsbach

2024-01-1846:22

#51 - HCI, Teil 2: Besser mit Chatbots schreiben und was sich durch ChatGPT alles ändert mit Anna Greilich

2024-01-0424:23

#50 - HCI, Teil 1: Was ist Human Computer Interaction & wie sprechen wir mit Computern mit Anna Greilich

2023-12-2824:58

00:00

1.0x

#54 - Die Zukunft von LLMs: Retrieval Augmented Generation mit Tanja Nündel, Teil 2

assono GmbH - Thomas Bahn, Johannes Göttsch

#box-pro-ellipsis-173227128400547{-webkit-line-clamp:2;}#54 - Die Zukunft von LLMs: Retrieval Augmented Generation mit Tanja Nündel, Teil 2

#54 - Die Zukunft von LLMs: Retrieval Augmented Generation mit Tanja Nündel, Teil 2

assono GmbH - Thomas Bahn, Johannes Göttsch

#54 - Die Zukunft von LLMs: Retrieval Augmented Generation mit Tanja Nündel, Teil 2