Nouveaux modèles Openai choquant des experts avec des taux d’hallucinations sans précédent

OpenAI a récemment lancé ses nouveaux modèles appelés O3 et O4-MinI, dans le cadre de ce qui est connu sous le nom de modèles d’inférence, qui ont été décrits comme un développement majeur dans ses capacités mathématiques, en particulier dans les domaines de la programmation et des mathématiques. Mais l’ironie est que ces modèles souffrent […]

Joseph Levy

Apr 19, 2025·3 min read

OpenAI a récemment lancé ses nouveaux modèles appelés O3 et O4-MinI, dans le cadre de ce qui est connu sous le nom de modèles d'inférence, qui ont été décrits comme un développement majeur dans ses capacités mathématiques, en particulier dans les domaines de la programmation et des mathématiques. Mais l'ironie est que ces modèles souffrent d'un ancien problème qui s'exacerbe: les hallucinations.

Halosa en intelligence artificielle signifie que le modèle produit de mauvaises informations qui semblent convaincantes, et c'était un problème continu dans tous les modèles précédents, mais l'inquiétude dans les nouveaux modèles est qu'il montre des taux d'hallucinations plus élevés par rapport aux anciens modèles OpenAI comme O1 et GPT-4O.

Dans les tests internes, il a été constaté que le modèle de Jahlos O3 dans environ 33% des tests PersonQA, un critère interne pour mesurer la précision du modèle chez les personnes liés aux personnes, est un pourcentage de convergence de l'affaiblissement de ce que les O1 et O3-Mini ont enregistré. Quant à O4-Mini, ses résultats étaient pires, car le taux d'hallucinations a atteint 48%.

La chose la plus inquiétante est peut-être qu'Openai lui-même ne connaît pas encore la raison exacte de l'augmentation de ce problème, et a déclaré dans ses rapports qu'il a besoin de plus de recherches pour comprendre la relation entre l'élargissement de la portée des modèles et l'augmentation des hallucinations, selon "Tech Crawsh"

La Fondation de recherche transluciale a également noté que le modèle O3 n'est pas satisfait des informations erronées, mais plutôt "crée des scénarios", tels que son prédicateur, en exploitant un code logiciel sur MacBook Pro, bien qu'il n'ait pas la capacité de le faire, soulevant des questions sur les limites de la crédibilité du modèle.

Malgré ces problèmes, certains experts, tels que Kayan Katanforus de l'Université de Stanford, voient la haute performance d'O3 en fait un concurrent solide, mais il est toujours dans des erreurs telles que la fourniture de liens faux ou inefficaces.

Compte tenu de la dépendance des entreprises à l'égard des modèles d'intelligence artificielle, la précision des résultats devient une question fondamentale qui ne peut être tolérée, en particulier dans des domaines sensibles tels que le droit ou la médecine. De là, l'une des solutions possibles est présentée: la fusion de modèles avec les possibilités de recherche en direct en ligne, comme dans le modèle GPT-4O, qui a montré une résolution de 90% dans le test SimpleQA.

En fin de compte, l'inférence reste un outil prometteur, mais il porte de vrais défis, en plus des hallucinations. Il semble qu'Openai, avec la communauté de recherche, soit devant un carrefour: soit contrôler ce phénomène, soit faire face à un ralentissement de l'adoption de ces modèles dans des applications réelles.

Nouveaux modèles Openai choquant des experts avec des taux d’hallucinations sans précédent

Joseph Levy

Responses (0 )

Newsletter L'oriental

👋 We are on socials

✨ Top 10 categories

Affaires & Argent

Sport

Arabie saoudite

Divertissement

Moyen-Orient

Santé

Egypte

Émirats arabes unis

Liban

Maroc

Related posts

Prix d’or aujourd’hui, samedi 19-2025 .. selon les dernières mises à jour

Joseph Levy

Prix de l’or en Égypte après un grand bond au cours des derniers jours

Joseph Levy

Quand le monde perd confiance dans les nouvelles du dollar américain

Joseph Levy

Un message important de Banque Misr à ses clients. Vous avez cette procédure immédiatement

Joseph Levy

Dans le texte du prix. Un nouveau fer envahit le marché égyptien moins cher et plus fort que l’armement

Joseph Levy

Au revoir, mon amant. Toyota annonce officiellement d’arrêter la production de cette voiture à vie

Joseph Levy

Les voitures les plus luxueuses de Toyota .. le Toyota Center 2024, découvrez ses spécifications et fonctionnalités qui dépassent l’imagination et leurs prix

Joseph Levy

Un tiers des entreprises en Allemagne prévoient de supprimer des emplois cette année

Joseph Levy

Les marchés mondiaux assistent à une légère amélioration avant le week-end

Joseph Levy

Les politiques de Trump donnent une préférence à la Chine dans la course d’énergie mondiale

Joseph Levy