Episódio 06 de 2025.1 — Dados Jurídicos em Ordem: Como Preparar uma Base Confiável para LLMs

Update: 2025-08-25

Description

Neste episódio, Tony e Diana conduzem um mergulho técnico e ético sobre a preparação e limpeza de dados para LLMs aplicados ao setor jurídico. A conversa percorre os desafios de inconsistência, ambiguidade semântica, variações regionais e “juridiquês”, além de destacar soluções como pipelines automatizados, bibliotecas de NLP (como spaCy e NLTK), validação estatística, aprendizado ativo e vetorização com embeddings. Um episódio essencial para quem quer entender como transformar um oceano de documentos jurídicos brutos em dados limpos, confiáveis e representativos para aplicações com IA generativa.

🧠 O episódio foi gerado com apoio de Inteligência Artificial a partir do debate coletivo entre professor, monitores e alunos, ocorrido na plataforma strateegia.digital, durante a disciplina IF1006 - TÓPICOS AVANÇADOS EM SISTEMAS DE INFORMAÇÃO 3 do curso de Bacharelado em Sistemas de Informação do Centro de Informática da UFPE no semestre 2025.1.

Comments

In Channel

Episódio 06 de 2025.2 — A Arte da Faxina: Limpeza, Ética e Automação de Dados Textuais Jurídicos

2025-10-1013:14

Episódio 05 de 2025.2 — Data-Driven Decision Making: IA, Cultura e o Futuro da Tomada de Decisão

2025-10-1015:14

Episódio 04 de 2025.2 — LLMs Fora de Contexto: Overfitting, Alucinação e Riscos Éticos

2025-10-1016:59

Episódio 03 de 2025.2 — Engenharia de Software para IA: A Ética na Arquitetura e o Futuro dos LLMs

2025-10-1014:38

Episódio 02 de 2025.2 — LLMs: Evolução Tecnológica e Governança Ética

2025-10-1017:27

Episódio 01 de 2025.2 — IA nas Empresas: Transformação, Desafios e a Reinvenção do Profissional de Tecnologia

2025-10-1015:44

Episódio 15 de 2025.1 — AIAD e a Nova Engenharia de Software: Entre Automação e Responsabilidade

2025-08-2514:15

Episódio 14 de 2025.1 — MLOps + LLMops: Arquitetando a Sustentabilidade da IA nos Negócios

2025-08-2533:35

Episódio 13 de 2025.1 — Agentes Inteligentes com MCP: Interoperabilidade, Supervisão Humana e Design Seguro

2025-08-2535:39

Episódio 12 de 2025.1 — Engenharia de Prompt e Dados Dinâmicos: O Novo Papel do Engenheiro de Software

2025-08-2524:53

Episódio 11 de 2025.1 — Ética, Privacidade e Governança em LLMs: Como Manter o Controle na Era da IA?

2025-08-2523:00

Episódio 10 de 2025.1 — Prompt Engineering, Storytelling e Governança de LLMs: Três Desafios, Uma Só Responsabilidade

2025-08-2515:25

Episódio 09 de 2025.1 — Atendimento ao Cliente com LLMs: Simbiose, Desafios e Ética

2025-08-2536:44

Episódio 08 de 2025.1 — Otimização de Processos com LLMs: Inovação com Responsabilidade

2025-08-2527:41

Episódio 07 de 2025.1 — IA Generativa nas Empresas: Do Potencial à Prática com Responsabilidade

2025-08-2516:41

Episódio 06 de 2025.1 — Dados Jurídicos em Ordem: Como Preparar uma Base Confiável para LLMs

2025-08-2517:29

Episódio 05 de 2025.1 — IA e Cultura Data-Driven: Muito Além da Tecnologia

2025-08-2515:03

Episódio 04 de 2025.1 — LLMs Fora do Nicho: Riscos de Generalização e o Papel da Governança Ética

2025-08-2511:39

Episódio 03 de 2025.1 — Engenharia de Software para IA: A Base da Confiabilidade

2025-08-2515:02

Episódio 02 de 2025.1 — A Jornada dos LLMs: Evolução, Potencial e Responsabilidade

2025-08-2519:16

00:00

Episódio 06 de 2025.1 — Dados Jurídicos em Ordem: Como Preparar uma Base Confiável para LLMs

#box-pro-ellipsis-17606873903855{-webkit-line-clamp:2;}Episódio 06 de 2025.1 — Dados Jurídicos em Ordem: Como Preparar uma Base Confiável para LLMs

Episódio 06 de 2025.1 — Dados Jurídicos em Ordem: Como Preparar uma Base Confiável para LLMs

Vinicius Cardoso Garcia

Episódio 06 de 2025.1 — Dados Jurídicos em Ordem: Como Preparar uma Base Confiável para LLMs