o3 d’Open AI atteint le niveau de l’intelligence humaine ?
Description
Le système O3 d’OpenAI, futur moteur de ChatGPT, a marqué un tournant majeur dans la recherche en intelligence artificielle. Il a récemment obtenu un score de 85 % au test ARC-AGI, un benchmark de référence conçu pour évaluer la capacité des systèmes d’IA à généraliser et s’adapter à de nouvelles situations. Ce résultat, égal à la moyenne humaine, surpasse nettement les 55 % obtenus par les IA précédentes. Une avancée qui alimente les espoirs d’approcher l’intelligence artificielle générale (AGI).
Le test ARC-AGI, développé par le chercheur français François Chollet, évalue l'efficacité d’échantillonnage : la capacité à résoudre des problèmes inédits à partir de quelques exemples. Concrètement, il s’agit pour l’IA d’analyser des transformations appliquées à des grilles carrées, à partir de trois exemples, avant de généraliser une règle pour résoudre un cas supplémentaire. O3 a impressionné en démontrant une aptitude à identifier des règles simples et généralisables. Selon certains experts, le système pourrait fonctionner par « chaînes de pensée », testant différentes étapes pour résoudre les problèmes avant de sélectionner la meilleure. Une méthode proche de celle d’AlphaGo, l’IA de Google qui a battu le champion du monde de Go.
Mais cet enthousiasme s’accompagne de prudence. OpenAI reste discrète sur les détails techniques et les capacités réelles d’O3, limitant ses communications à quelques tests préliminaires. Des experts craignent que cette performance soit le fruit d’une optimisation spécifique au test ARC-AGI, plutôt qu’une véritable capacité de généralisation applicable à d’autres contextes. Pour trancher, des évaluations plus vastes seront nécessaires. Si O3 démontre une adaptabilité humaine dans divers domaines, les répercussions pourraient être révolutionnaires, ouvrant la voie à des IA auto-améliorantes avec des impacts sociétaux majeurs. Reste à voir si cette promesse deviendra réalité.
Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.