Od AI, která neposlouchala, k asistentům jako ChatGPT
Description
Před nástupem dnešních konverzačních asistentů existoval zásadní problém - umělá inteligence uměla generovat text, ale neuměla spolehlivě následovat pokyny. Podíváme se na klíčový průlom z roku 2022, kdy výzkumníci vyvinuli nový způsob učení, při kterém AI dostávala lidskou zpětnou vazbu. Nejprve jí ukázali vzorové odpovědi, pak naučili systém hodnotit kvalitu podle lidských preferencí, a nakonec umělou inteligenci trénovali pomocí "odměn" za dobré odpovědi. Výsledky byly ohromující - nový model byl preferován lidmi v 85% případů a dokonce i mnohem menší verze předčila původní obří systém. Tento výzkum ukázal, že cesta k užitečným asistentům nevede jen přes větší modely, ale hlavně přes jejich přizpůsobení lidským záměrům. Právě tato metoda umožnila vznik systémů jako ChatGPT, které dokážou vést dialog a plnit úkoly.#konverzace