Episódio 06 de 2025.2 — A Arte da Faxina: Limpeza, Ética e Automação de Dados Textuais Jurídicos

Update: 2025-10-10

Description

Neste episódio, Tony e Diana exploram um dos temas mais fundamentais — e subestimados — no desenvolvimento de soluções com LLMs: a preparação e limpeza de dados textuais, com foco especial no domínio jurídico. A dupla mostra como esse processo é bem mais do que “tirar o lixo”; é garantir qualidade, ética e eficiência desde a origem dos dados.

Entre os tópicos discutidos:

Como lidar com ruído estrutural, inconsistência, viés, escala e privacidade;
A importância da preservação do contexto jurídico e do papel inegociável da validação humana;
Como construir pipelines modulares e automatizados usando ferramentas como spaCy, NLTK, Hugging Face, Scikit-learn, Apache Spark, Dask, Airflow, entre outras;
Estratégias para alcançar anonimização robusta, vetorização eficiente, paralelização e retraining contínuo.

Este episódio é um guia completo para profissionais que desejam transformar a “faxina de dados” em um processo vivo, sustentável e escalável — e não apenas em uma etapa pontual de projeto.

🧠 O episódio foi gerado com apoio de Inteligência Artificial a partir do debate coletivo entre professor, monitores e alunos, ocorrido na plataforma strateegia.digital, durante a disciplina IF1006 - TÓPICOS AVANÇADOS EM SISTEMAS DE INFORMAÇÃO 3 do curso de Bacharelado em Sistemas de Informação do Centro de Informática da UFPE no semestre 2025.2.

Comments

In Channel

Episódio 11 de 2025.2 - IA Generativa na Prática: Da Ideação à Produção com Valor Real

2025-11-1119:49

Episódio 10 de 2025.2 - Regulação de LLMs: Como Acompanhar a IA na Velocidade da Inovação?

2025-11-0416:15

Episódio 09 de 2025.2 - Prompt Engineering, Storytelling e Governança com LLMs: Do Superpoder à Alfabetização

2025-10-2719:38

Episódio 8 de 2025.2 - Atendimento ao Cliente com LLMs

2025-10-2026:12

Episódio 7 de 2025.2 - Aplicações de LLMs: Otimização de Processos

2025-10-2019:47

Episódio 06 de 2025.2 — A Arte da Faxina: Limpeza, Ética e Automação de Dados Textuais Jurídicos

2025-10-1013:14

Episódio 05 de 2025.2 — Data-Driven Decision Making: IA, Cultura e o Futuro da Tomada de Decisão

2025-10-1015:14

Episódio 04 de 2025.2 — LLMs Fora de Contexto: Overfitting, Alucinação e Riscos Éticos

2025-10-1016:59

Episódio 03 de 2025.2 — Engenharia de Software para IA: A Ética na Arquitetura e o Futuro dos LLMs

2025-10-1014:38

Episódio 02 de 2025.2 — LLMs: Evolução Tecnológica e Governança Ética

2025-10-1017:27

Episódio 01 de 2025.2 — IA nas Empresas: Transformação, Desafios e a Reinvenção do Profissional de Tecnologia

2025-10-1015:44

Episódio 15 de 2025.1 — AIAD e a Nova Engenharia de Software: Entre Automação e Responsabilidade

2025-08-2514:15

Episódio 14 de 2025.1 — MLOps + LLMops: Arquitetando a Sustentabilidade da IA nos Negócios

2025-08-2533:35

Episódio 13 de 2025.1 — Agentes Inteligentes com MCP: Interoperabilidade, Supervisão Humana e Design Seguro

2025-08-2535:39

Episódio 12 de 2025.1 — Engenharia de Prompt e Dados Dinâmicos: O Novo Papel do Engenheiro de Software

2025-08-2524:53

Episódio 11 de 2025.1 — Ética, Privacidade e Governança em LLMs: Como Manter o Controle na Era da IA?

2025-08-2523:00

Episódio 10 de 2025.1 — Prompt Engineering, Storytelling e Governança de LLMs: Três Desafios, Uma Só Responsabilidade

2025-08-2515:25

Episódio 09 de 2025.1 — Atendimento ao Cliente com LLMs: Simbiose, Desafios e Ética

2025-08-2536:44

Episódio 08 de 2025.1 — Otimização de Processos com LLMs: Inovação com Responsabilidade

2025-08-2527:41

Episódio 07 de 2025.1 — IA Generativa nas Empresas: Do Potencial à Prática com Responsabilidade

2025-08-2516:41

00:00

1.0x

Episódio 06 de 2025.2 — A Arte da Faxina: Limpeza, Ética e Automação de Dados Textuais Jurídicos

#box-pro-ellipsis-176306891153397{-webkit-line-clamp:2;}Episódio 06 de 2025.2 — A Arte da Faxina: Limpeza, Ética e Automação de Dados Textuais Jurídicos

Episódio 06 de 2025.2 — A Arte da Faxina: Limpeza, Ética e Automação de Dados Textuais Jurídicos

Vinicius Cardoso Garcia

Episódio 06 de 2025.2 — A Arte da Faxina: Limpeza, Ética e Automação de Dados Textuais Jurídicos