ChatGPT peut dominer le marché des chatbots d'IA, mais un nouveau rapport suggère que la popularité n'est pas synonyme de fiabilité. A…ChatGPT peut dominer le marché des chatbots d'IA, mais un nouveau rapport suggère que la popularité n'est pas synonyme de fiabilité. A…

ChatGPT nommé le chatbot de travail le moins fiable dans un nouveau rapport de fiabilité de l'IA

2025/12/11 02:38

ChatGPT peut dominer le marché des chatbots d'IA, mais un nouveau rapport suggère que la popularité n'est pas synonyme de fiabilité. Une étude de décembre 2025 examinant comment les principaux chatbots d'IA performent dans les scénarios de travail quotidiens a classé ChatGPT comme l'option la moins fiable pour les tâches professionnelles. Ces résultats soulèvent de nouvelles préoccupations pour les entreprises qui dépendent de plus en plus des outils d'IA pour leurs opérations quotidiennes.

L'étude, menée par Relum, ne s'est pas contentée d'examiner les spécifications sur papier ; ils ont soumis dix chatbots d'IA majeurs à des tests de résistance dans des scénarios professionnels réels. Les résultats ? Un décalage massif entre le battage médiatique et la réalité.

L'étude a évalué chaque chatbot selon quatre critères clés. Il s'agissait du taux d'hallucination, des évaluations des produits par les clients, de la cohérence des réponses entre les tâches et de la fréquence des temps d'arrêt. Chaque facteur a contribué à un score de risque de fiabilité composite, les scores plus élevés indiquant des problèmes potentiels plus importants sur le lieu de travail.

Voici la statistique qui devrait empêcher les dirigeants d'entreprise de dormir : Malgré le contrôle de 81% du marché et des évaluations utilisateurs élevées, ChatGPT a enregistré un taux d'hallucination de 35%.

En termes simples, cela signifie que plus d'une réponse sur trois qu'il donne contient des informations fabriquées ou incorrectes. Si vous l'utilisez pour rédiger un roman fantastique, c'est bien, mais si vous l'utilisez pour des rapports de conformité ou des prises de décision financière, c'est une recette pour le désastre. Par conséquent, l'étude a attribué à ChatGPT un score de risque de fiabilité de 99 sur 99, le pire du groupe.

ChatGPT named least reliable work chatbot in new AI reliability reportChatGPT

Google ne s'en est pas mieux tiré. Bien que Gemini ait eu un meilleur temps de fonctionnement, il a en fait obtenu de moins bons résultats en termes de précision pure, enregistrant le taux d'hallucination le plus élevé de tout le groupe à 38%. Cela met en évidence un paradoxe étrange sur le marché actuel de l'IA : les outils que nous utilisons le plus sont souvent ceux qui ont le plus de mal à garder leurs faits exacts.

Claude et Meta AI occupent un terrain intermédiaire trouble. Claude, malgré sa popularité pour son style d'écriture, a été classé comme le deuxième moins fiable en raison de temps d'arrêt fréquents et d'un taux d'hallucination de 17%. Meta AI était plus précis (15% d'hallucination), mais les utilisateurs semblent ne pas apprécier l'expérience, lui donnant la note de satisfaction la plus basse du groupe (3,4 sur 5).

Les "outsiders" – Grok et DeepSeek volent la vedette à ChatGPT

Si les grands noms laissent tomber la balle, qui fait réellement le travail ? Étonnamment, l'étude désigne Grok et DeepSeek comme les outils les plus fiables pour un usage professionnel. Ils n'ont pas les budgets marketing massifs ou la reconnaissance de marque d'OpenAI, mais ils fonctionnaient simplement mieux. DeepSeek n'a enregistré aucune panne de service et a maintenu les hallucinations au minimum.

Kimi a également obtenu de bons résultats, trouvant un juste équilibre entre cohérence et temps de fonctionnement. Pendant ce temps, les options payantes comme Perplexity AI étaient solides mais ont soulevé des questions quant à savoir si le coût d'abonnement en vaut la peine lorsque des alternatives moins connues et moins chères les surpassent.

ChatGPT named least reliable work chatbot in new AI reliability report

Le directeur des produits de Relum, Razvan-Lucian Haiduc, a averti que la fiabilité devrait être un facteur central dans les décisions d'adoption de l'IA. Il a noté qu'environ 65% des entreprises américaines utilisent désormais des chatbots d'IA dans leurs flux de travail quotidiens. Près de 45% des employés admettent partager des informations sensibles de l'entreprise avec ces outils.

À mesure que l'IA s'intègre davantage dans le travail de routine, les risques de désinformation se multiplient. Haiduc a souligné que le chatbot le plus largement utilisé n'est pas toujours le mieux adapté à chaque industrie. La précision, le temps de fonctionnement et les performances spécifiques aux tâches devraient l'emporter sur la familiarité de la marque.

Le rapport sert de rappel à la réalité pour l'industrie. La confiance ne devrait pas être accordée simplement parce qu'un chatbot est célèbre ; elle devrait être gagnée par une vérité cohérente et vérifiable. À l'heure actuelle, il semble que les leaders du marché aient un sérieux retard à rattraper.

Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter [email protected] pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.

Vous aimerez peut-être aussi

La volatilité du Bitcoin augmente alors que le FOMC confirme une réduction de taux de 25 points de base pour septembre

La volatilité du Bitcoin augmente alors que le FOMC confirme une réduction de taux de 25 points de base pour septembre

La publication "La volatilité du Bitcoin augmente alors que le FOMC confirme une baisse de taux de 25 points de base pour septembre" est apparue sur BitcoinEthereumNews.com. Le Bitcoin (BTC) a connu de fortes fluctuations le 17 septembre après que la Réserve fédérale a confirmé une baisse des taux d'intérêt de 25 points de base, abaissant sa fourchette cible pour le taux des fonds fédéraux à 4% à 4,25%. La décision a également réduit le taux d'intérêt versé sur les soldes de réserve à 4,15% et abaissé le taux de crédit primaire à 4,25%, les deux entrant en vigueur le 18 septembre. La Fed a déclaré que le Bureau du marché ouvert de la Fed de New York mènera des opérations de marché ouvert pour maintenir la nouvelle fourchette, incluant jusqu'à 500 milliards de dollars en accords de rachat au jour le jour et une limite quotidienne de 160 milliards de dollars par contrepartie sur les prises en pension inversées. Selon les données de CryptoSlate, le Bitcoin a atteint un sommet intrajournalier de 116 318 $ avant l'annonce, avant de chuter brusquement à 114 820 $ lorsque les traders ont "vendu la nouvelle". La baisse a été violente mais de courte durée, le Bitcoin se rétablissant à 115 639 $ au moment de la publication. Ces fluctuations rapides soulignent à quel point les actifs numériques restent très sensibles aux changements de liquidité du dollar et à la politique de la Fed. La baisse des taux était largement anticipée mais a marqué le premier ajustement de politique de la Fed depuis des mois après avoir maintenu des coûts d'emprunt élevés. Les marchés avaient intégré cette décision, bien que la rapidité de la réaction du Bitcoin ait mis en évidence comment les traders se positionnent autour des changements de conditions monétaires. Les investisseurs attendent maintenant la conférence de presse du président Jerome Powell pour obtenir des indications supplémentaires sur la possibilité que la banque centrale puisse procéder à des réductions supplémentaires avant la fin de l'année. Les actions ont également connu de la volatilité après l'annonce, tandis que les rendements du Trésor ont légèrement baissé alors que les marchés obligataires intégraient des conditions financières plus souples. Les mouvements exagérés du Bitcoin reflétaient le sentiment de risque plus large, mais avec des fluctuations intrajournalières plus prononcées. Données de marché du Bitcoin Au moment de la publication à 19h38 UTC le 17 septembre 2025, le Bitcoin est classé n°1 par capitalisation boursière et son prix est en baisse de 0,8% au cours des dernières 24 heures. Le Bitcoin a une capitalisation boursière de 2,3 billions de dollars avec un volume d'échanges sur 24h de 52,5 milliards de dollars...
Partager
BitcoinEthereumNews2025/09/18 03:16