DiscoverUměligenceProč větší AI modely reagují hůř na nepřesné zadání
Proč větší AI modely reagují hůř na nepřesné zadání

Proč větší AI modely reagují hůř na nepřesné zadání

Update: 2025-07-16
Share

Description

Umělá inteligence nás občas překvapí paradoxními vlastnostmi. Výzkum odhaluje, proč větší a teoreticky pokročilejší jazykové modely mohou podávat horší výsledky než jejich menší sourozenci. Klíčem je rozdílný přístup k takzvanému "učení v kontextu" - schopnosti naučit se úkol z příkladů v zadání bez přetrénování. Vědci testovali modely Llama s velikostí od 3 do 70 miliard parametrů a zjistili, že menší modely se zaměřují hlavně na klíčové vzorce a ignorují šum nebo chyby. Naopak ty větší se snaží zpracovat veškeré nuance včetně nepodstatných informací a chyb. Když výzkumníci záměrně zanesli do testů nesprávné příklady nebo irrelevantní věty, výkon největších modelů klesal mnohem rychleji. Tento poznatek mění způsob, jakým bychom měli AI vybírat a používat - větší není vždy lepší a kvalita zadání je u velkých modelů naprosto zásadní.#konverzace


Comments 
00:00
00:00
x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

Proč větší AI modely reagují hůř na nepřesné zadání

Proč větší AI modely reagují hůř na nepřesné zadání

David Grudl