Proč větší AI modely reagují hůř na nepřesné zadání
Description
Umělá inteligence nás občas překvapí paradoxními vlastnostmi. Výzkum odhaluje, proč větší a teoreticky pokročilejší jazykové modely mohou podávat horší výsledky než jejich menší sourozenci. Klíčem je rozdílný přístup k takzvanému "učení v kontextu" - schopnosti naučit se úkol z příkladů v zadání bez přetrénování. Vědci testovali modely Llama s velikostí od 3 do 70 miliard parametrů a zjistili, že menší modely se zaměřují hlavně na klíčové vzorce a ignorují šum nebo chyby. Naopak ty větší se snaží zpracovat veškeré nuance včetně nepodstatných informací a chyb. Když výzkumníci záměrně zanesli do testů nesprávné příklady nebo irrelevantní věty, výkon největších modelů klesal mnohem rychleji. Tento poznatek mění způsob, jakým bychom měli AI vybírat a používat - větší není vždy lepší a kvalita zadání je u velkých modelů naprosto zásadní.#konverzace