O ChatGPT pode dominar o mercado de chatbots de IA, mas um novo relatório sugere que popularidade não é igual a confiabilidade. A...O ChatGPT pode dominar o mercado de chatbots de IA, mas um novo relatório sugere que popularidade não é igual a confiabilidade. A...

ChatGPT nomeado como o chatbot de trabalho menos fiável em novo relatório de fiabilidade de IA

2025/12/11 02:38

O ChatGPT pode dominar o mercado de chatbots de IA, mas um novo relatório sugere que popularidade não é igual a confiabilidade. Um estudo de dezembro de 2025 que examina como os principais chatbots de IA se comportam em cenários de trabalho cotidianos classificou o ChatGPT como a opção menos confiável para tarefas profissionais. As descobertas levantam novas preocupações para empresas que dependem cada vez mais de ferramentas de IA para operações diárias.

O estudo, conduzido pela Relum, não apenas analisou especificações no papel; eles testaram rigorosamente dez grandes chatbots de IA em cenários profissionais do mundo real. Os resultados? Uma enorme desconexão entre a publicidade e a realidade.

O estudo avaliou cada chatbot em quatro critérios principais. Estes foram taxa de alucinação, avaliações de produtos pelos clientes, consistência de resposta entre tarefas e frequência de inatividade. Cada fator contribuiu para uma pontuação composta de risco de confiabilidade, com pontuações mais altas indicando maiores problemas potenciais no local de trabalho.

Aqui está a estatística que deveria manter os líderes empresariais acordados à noite: Apesar de controlar impressionantes 81% do mercado e ostentar altas avaliações de usuários, o ChatGPT registrou uma taxa de alucinação de 35%.

Em termos simples, isso significa que mais de uma em cada três respostas que ele dá contém informações fabricadas ou incorretas. Se você o está usando para escrever um romance de fantasia, tudo bem, mas se o está usando para relatórios de conformidade ou tomada de decisões financeiras, isso é uma receita para o desastre. Consequentemente, o estudo atribuiu ao ChatGPT uma pontuação de risco de confiabilidade de 99 em 99, a pior do grupo.

ChatGPT named least reliable work chatbot in new AI reliability reportChatGPT

O Google não se saiu melhor. Enquanto o Gemini teve melhor tempo de atividade, na verdade teve pior desempenho em precisão pura, registrando a maior taxa de alucinação de todo o grupo em 38%. Isso destaca um paradoxo estranho no mercado atual de IA: as ferramentas que mais usamos são frequentemente aquelas que mais lutam para manter seus fatos corretos.

Claude e Meta AI ocupam um terreno intermediário nebuloso. Claude, apesar de ser um favorito pelo seu estilo de escrita, foi classificado como o segundo menos confiável devido a frequentes períodos de inatividade e uma taxa de alucinação de 17%. O Meta AI foi mais preciso (15% de alucinação), mas os usuários parecem não gostar da experiência, dando-lhe a classificação de satisfação mais baixa do grupo (3,4 de 5).

Os "azarões" – Grok e DeepSeek roubam a cena do ChatGPT

Se os grandes nomes estão deixando a desejar, quem está realmente fazendo o trabalho? Surpreendentemente, o estudo aponta para Grok e DeepSeek como as ferramentas mais confiáveis para uso profissional. Eles não têm os enormes orçamentos de marketing ou reconhecimento de marca da OpenAI, mas simplesmente funcionaram melhor. O DeepSeek não registrou interrupções de serviço e manteve as alucinações ao mínimo.

Kimi também pontuou bem, encontrando um ponto ideal entre consistência e tempo de atividade. Enquanto isso, opções pagas como Perplexity AI foram sólidas, mas levantaram questões sobre se o custo da assinatura vale a pena quando alternativas mais baratas e menos conhecidas estão superando-as.

ChatGPT named least reliable work chatbot in new AI reliability report

O Diretor de Produto da Relum, Razvan-Lucian Haiduc, alertou que a confiabilidade deve ser um fator central nas decisões de adoção de IA. Ele observou que cerca de 65% das empresas dos EUA agora usam chatbots de IA em fluxos de trabalho diários. Quase 45% dos funcionários admitem compartilhar informações sensíveis da empresa com essas ferramentas.

À medida que a IA se torna mais incorporada no trabalho rotineiro, os riscos de desinformação se multiplicam. Haiduc enfatizou que o chatbot mais amplamente utilizado nem sempre é o mais adequado para cada indústria. Precisão, tempo de atividade e desempenho específico para tarefas devem superar a familiaridade com a marca.

O relatório serve como um teste de realidade para a indústria. A confiança não deve ser dada apenas porque um chatbot é famoso; deve ser conquistada através de verdade consistente e verificável. Neste momento, parece que os líderes de mercado têm muito trabalho pela frente.

Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail [email protected] para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.