NVIDIA Blackwell розбиває фінансовий ШІ-бенчмарк з 3,2-кратним приростом швидкості

Iris Coleman 18:17, 5 березня 2026

NVIDIA GB200 NVL72 встановлює новий рекорд STAC-AI для LLM-інференсу у фінансовій торгівлі, забезпечуючи до 3,2-кратної продуктивності порівняно з архітектурою Hopper.

NVIDIA Blackwell розбиває фінансовий ШІ-бенчмарк з 3,2-кратним приростом швидкості

Архітектура Blackwell від NVIDIA щойно опублікувала найшвидші результати на бенчмарку STAC-AI для фінансового LLM-інференсу, при цьому GB200 NVL72 забезпечує до 3,2-кратного покращення продуктивності одного GPU порівняно з попереднім поколінням Hopper. Результати від 5 березня 2026 року мають значення для торгових компаній, які прагнуть отримати альфу з технічного аналізу неструктурованих даних.

Центр стратегічного технічного аналізу, який проводить бенчмаркінг робочих навантажень фінансових технологій понад 15 років, протестував Blackwell на реальних сценаріях, використовуючи файли EDGAR 10-K — детальні річні звіти, які кількісні фонди аналізують для інвестиційних сигналів. Запускаючи моделі Llama 3.1 від Meta, GB200 NVL72 досяг 37 480 слів за секунду на фінансових запитах середньої довжини, порівняно з 8 237 WPS для подвійних систем GH200.

Чисті цифри розповідають історію

На моделі Llama 3.1 8B з даними EDGAR4 Blackwell обробив 224 запити за секунду проти 51,5 RPS для Hopper — 4,3-кратне покращення на рівні системи. Розрив збільшився на обчислювально важчих завданнях: модель з параметрами 70B на довгоконтекстних файлах EDGAR5 показала стрибок пропускної здатності з 41,4 WPS до 150 WPS.

Що робить ці досягнення можливими? Новий формат квантування NVFP4 від NVIDIA, ексклюзивний для Blackwell, стискає моделі до менших обсягів пам'яті без втрати точності. Hopper використовував квантування FP8; архітектурний стрибок до чотирибітної точності на Blackwell розблокував дельту пропускної здатності.

Інтерактивна продуктивність має значення для трейдингу

Пакетна обробка — це одне. Торгові рішення в режимі реального часу вимагають швидких відповідей. Тут Blackwell підтримував нижчий час реакції (аналогічний часу до першого токена) та кращу затримку між словами навіть при максимальній пропускній здатності. При однакових рівнях використання GB200 NVL72 постійно перевершував GH200 за метриками швидкості відповіді в більшості тестових сценаріїв.

Для торгових столів, які проводять аналіз настроїв під час дзвінків про прибутки або аналізують термінові новини, ця перевага в затримці безпосередньо трансформується в швидше прийняття рішень. Бенчмарк явно тестував повний конвеєр інференсу, включаючи токенізацію — роботу, яку реальні розгортання не можуть пропустити.

Ринковий контекст

Акції NVIDIA торгувалися за $181,41 5 березня, зростаючи на 1,1% за день, при цьому ринкова капіталізація компанії становила $4,42 трильйона. Архітектура Blackwell, оголошена на GTC 2024, була розроблена спеціально для генеративних робочих навантажень ШІ. Генеральний директор Jensen Huang позиціонував її як таку, що живить "нову промислову революцію", і ці результати бенчмарку надають конкретні докази цієї заяви у фінансовому секторі.

Суперчіп GB200 Grace Blackwell поєднує два GPU B200 з CPU Grace, включаючи перероблені ШІ Tensor Cores та NVLink п'ятого покоління для масштабування до 576 GPU. Попередні результати MLPerf показали 2,2-кратний приріст навчання на Llama 3.1 405B; ці цифри STAC-AI підтверджують, що подібні переваги поширюються на інференс.

Hopper все ще актуальний

Варто зазначити: трирічна архітектура Hopper показала гідні цифри. Торгові компанії з існуючими розгортаннями GH200 не стають застарілими за ніч. Але для нових збірок або компаній, де швидкість інференсу безпосередньо впливає на прибутки, економіка Blackwell виглядає привабливо — NVIDIA заявляє про до 25-кратне зниження операційних витрат LLM-інференсу порівняно з попередніми поколіннями.

Повні звіти STAC, включаючи детальні метрики інтерактивного режиму для різних швидкостей надходження, доступні через офіційні канали STAC. Фінансові установи, які оцінюють оновлення ШІ-інфраструктури, тепер мають перевірені дані сторонніх платформ для інформування рішень щодо закупівель.

Джерело зображення: Shutterstock

nvidia
blackwell
ai inference
financial trading
llm

NVIDIA Blackwell розбиває фінансовий AI-бенчмарк із зростанням швидкості в 3,2 рази

NVIDIA Blackwell розбиває фінансовий ШІ-бенчмарк з 3,2-кратним приростом швидкості

Чисті цифри розповідають історію

Інтерактивна продуктивність має значення для трейдингу

Ринковий контекст

Hopper все ще актуальний

Вам також може сподобатися

Український стартап Superapp залучив $1,6 млн на AI no-code розробку під iOS та Mac. У найближчу добу ним можна скористатися безплатно

Продаж авто в Польщі: хто і в якому випадку повинен платити податки

Популярні новини

Український стартап Superapp залучив $1,6 млн на AI no-code розробку під iOS та Mac. У найближчу добу ним можна скористатися безплатно

Продаж авто в Польщі: хто і в якому випадку повинен платити податки

Китай наказав заводам припинити експорт палива — Bloomberg

Ripple надав своїм інституційним клієнтам доступ до регульованих криптовалютних деривативів цілодобово

Ціни на криптовалюту