L'Oriental — Actualités et regard complet sur l'Orient | Média & Journal FrancophoneL'oriental vous offre un regard complet sur l'Orient. Suivez l'actualité politique, économique et culturelle du Moyen-Orient, d'Afrique du Nord et d'Asie.

Nouveaux modèles Openai choquant des experts avec des taux d’hallucinations sans précédent

OpenAI a récemment lancé ses nouveaux modèles appelés O3 et O4-MinI, dans le cadre de ce qui est connu sous le nom de modèles d’inférence, qui ont été décrits comme un développement majeur dans ses capacités mathématiques, en particulier dans les domaines de la programmation et des mathématiques. Mais l’ironie est que ces modèles souffrent […]

Nouveaux modèles Openai choquant des experts avec des taux d’hallucinations sans précédent

OpenAI a récemment lancé ses nouveaux modèles appelés O3 et O4-MinI, dans le cadre de ce qui est connu sous le nom de modèles d'inférence, qui ont été décrits comme un développement majeur dans ses capacités mathématiques, en particulier dans les domaines de la programmation et des mathématiques. Mais l'ironie est que ces modèles souffrent d'un ancien problème qui s'exacerbe: les hallucinations.

Halosa en intelligence artificielle signifie que le modèle produit de mauvaises informations qui semblent convaincantes, et c'était un problème continu dans tous les modèles précédents, mais l'inquiétude dans les nouveaux modèles est qu'il montre des taux d'hallucinations plus élevés par rapport aux anciens modèles OpenAI comme O1 et GPT-4O.

Dans les tests internes, il a été constaté que le modèle de Jahlos O3 dans environ 33% des tests PersonQA, un critère interne pour mesurer la précision du modèle chez les personnes liés aux personnes, est un pourcentage de convergence de l'affaiblissement de ce que les O1 et O3-Mini ont enregistré. Quant à O4-Mini, ses résultats étaient pires, car le taux d'hallucinations a atteint 48%.

La chose la plus inquiétante est peut-être qu'Openai lui-même ne connaît pas encore la raison exacte de l'augmentation de ce problème, et a déclaré dans ses rapports qu'il a besoin de plus de recherches pour comprendre la relation entre l'élargissement de la portée des modèles et l'augmentation des hallucinations, selon "Tech Crawsh"

La Fondation de recherche transluciale a également noté que le modèle O3 n'est pas satisfait des informations erronées, mais plutôt "crée des scénarios", tels que son prédicateur, en exploitant un code logiciel sur MacBook Pro, bien qu'il n'ait pas la capacité de le faire, soulevant des questions sur les limites de la crédibilité du modèle.

Malgré ces problèmes, certains experts, tels que Kayan Katanforus de l'Université de Stanford, voient la haute performance d'O3 en fait un concurrent solide, mais il est toujours dans des erreurs telles que la fourniture de liens faux ou inefficaces.

Compte tenu de la dépendance des entreprises à l'égard des modèles d'intelligence artificielle, la précision des résultats devient une question fondamentale qui ne peut être tolérée, en particulier dans des domaines sensibles tels que le droit ou la médecine. De là, l'une des solutions possibles est présentée: la fusion de modèles avec les possibilités de recherche en direct en ligne, comme dans le modèle GPT-4O, qui a montré une résolution de 90% dans le test SimpleQA.

En fin de compte, l'inférence reste un outil prometteur, mais il porte de vrais défis, en plus des hallucinations. Il semble qu'Openai, avec la communauté de recherche, soit devant un carrefour: soit contrôler ce phénomène, soit faire face à un ralentissement de l'adoption de ces modèles dans des applications réelles.

J
WRITTEN BY

Joseph Levy

En tant que Responsable Société et Culture, Joseph Levy explore les histoires humaines, les phénomènes sociaux et la richesse culturelle de l'Orient. Son travail vise à donner une profondeur humaine et contextuelle à l'actualité traitée par L'oriental.

Responses (0 )



















Newsletter L'oriental

Restez informé sur l'Orient avec L'oriental. Analyses quotidiennes, reportages et décryptages de l'actualité du Moyen-Orient et d'Asie.

Related posts