PANews reported on September 26th that OpenAI launched a new evaluation tool, GDPval , which focuses on measuring AI performance on real-world economic value tasks. GDPval covers 44 occupations across the nine industries that contribute most to US GDP . The tasks were designed by industry experts with an average of 14 years of experience. Evaluation results show that nearly half of the outputs of the Claude Opus 4.1 model are comparable to or better than expert performance. OpenAI stated that it will continue to expand the scope and details of GDPval's evaluations in the future.
Sorumluluk Reddi: Bu sitede yeniden yayınlanan makaleler, halka açık platformlardan alınmıştır ve yalnızca bilgilendirme amaçlıdır. MEXC'nin görüşlerini yansıtmayabilir. Tüm hakları telif sahiplerine aittir. Herhangi bir içeriğin üçüncü taraf haklarını ihlal ettiğini düşünüyorsanız, kaldırılması için lütfen
[email protected] ile iletişime geçin. MEXC, içeriğin doğruluğu, eksiksizliği veya güncelliği konusunda hiçbir garanti vermez ve sağlanan bilgilere dayalı olarak alınan herhangi bir eylemden sorumlu değildir. İçerik, finansal, yasal veya diğer profesyonel tavsiye niteliğinde değildir ve MEXC tarafından bir tavsiye veya onay olarak değerlendirilmemelidir.