#124: GAIA: a benchmark for General AI Assistants
Update: 2023-12-22
Share
Description
LLM に解かせる難問集と採点結果を向井が睨みました。ご意見感想などは Reddit やおたより投書箱にお寄せください。iTunes のレビューや星もよろしくね。
<figure class="wp-block-audio"></figure>
- [2311.12983] GAIA: a benchmark for General AI Assistants
- gaia-benchmark/GAIA · Datasets at Hugging Face
Comments
In Channel



