Proč větší AI modely reagují hůř na nepřesné zadání

Update: 2025-07-16

Description

Umělá inteligence nás občas překvapí paradoxními vlastnostmi. Výzkum odhaluje, proč větší a teoreticky pokročilejší jazykové modely mohou podávat horší výsledky než jejich menší sourozenci. Klíčem je rozdílný přístup k takzvanému "učení v kontextu" - schopnosti naučit se úkol z příkladů v zadání bez přetrénování. Vědci testovali modely Llama s velikostí od 3 do 70 miliard parametrů a zjistili, že menší modely se zaměřují hlavně na klíčové vzorce a ignorují šum nebo chyby. Naopak ty větší se snaží zpracovat veškeré nuance včetně nepodstatných informací a chyb. Když výzkumníci záměrně zanesli do testů nesprávné příklady nebo irrelevantní věty, výkon největších modelů klesal mnohem rychleji. Tento poznatek mění způsob, jakým bychom měli AI vybírat a používat - větší není vždy lepší a kvalita zadání je u velkých modelů naprosto zásadní.#konverzace

Comments

In Channel

Průlom: vědcům se podařilo zachytit, jak AI vnitřně přemýšlí

2025-08-1307:54

Štít, který zastaví AI v poskytování nebezpečných informací

2025-08-0607:29

Od AI, která neposlouchala, k asistentům jako ChatGPT

2025-07-3008:10

Ema mele maso aneb proč modely jen nepapouškují

2025-07-2306:21

Proč větší AI modely reagují hůř na nepřesné zadání

2025-07-1608:12

Jak oklamat umělou inteligenci při rozpoznávání obrazů

2025-07-0908:49

Jak nejpokročilejší AI systémy předstírají poslušnost

2025-07-0205:47

AI agenti: umělá mysl s vlastní iniciativou

2025-06-2609:46

Jsme v simulaci? Vědci navrhují, jak to zjistit

2025-06-2306:48

Proč umělá inteligence funguje lépe, když ji oslovíte jako experta

2025-06-2107:36

Eliza znovu mluví po půl století ticha

2025-06-1807:59

Jak AI vytváří falešná vysvětlení svých rozhodnutí

2025-06-1207:37

Apple prý odhalil, že AI vůbec neumí přemýšlet

2025-06-0907:06

Muskovo zrcadlo: Když AI označí vlastního tvůrce za dezinformátora

2025-06-0704:49

Od chaosu k obrazu: jak funguje generování obrázků

2025-06-0408:07

Za hranicí halucinací: Jak O3 předstírá kroky, které nikdy nepodnikl

2025-06-0107:22

Zrychlení práce s AI pomocí chytrých zkratek v prohlížeči

2025-05-2906:42

Když AI spojí čísla s biblickými verši, nastává katastrofa

2025-05-2611:16

Přichází éra modelů, které dokáží přemýšlet

2025-05-2407:49

Bitva překladačů: DeepL vs. LLM

2025-05-2107:41

00:00

Proč větší AI modely reagují hůř na nepřesné zadání

#box-pro-ellipsis-176122746627997{-webkit-line-clamp:2;}Proč větší AI modely reagují hůř na nepřesné zadání

Proč větší AI modely reagují hůř na nepřesné zadání

David Grudl

Proč větší AI modely reagují hůř na nepřesné zadání