GB200 NVL72 від NVIDIA встановлює новий рекорд STAC-AI для LLM-інференсу у фінансовому трейдингу, забезпечуючи продуктивність до 3,2x порівняно з архітектурою Hopper. (Докладніше)GB200 NVL72 від NVIDIA встановлює новий рекорд STAC-AI для LLM-інференсу у фінансовому трейдингу, забезпечуючи продуктивність до 3,2x порівняно з архітектурою Hopper. (Докладніше)

NVIDIA Blackwell розбиває фінансовий AI-бенчмарк із зростанням швидкості в 3,2 рази

2026/03/06 02:17
3 хв читання
Якщо у вас є відгуки або зауваження щодо цього контенту, будь ласка, зв’яжіться з нами за адресою [email protected]

NVIDIA Blackwell розбиває фінансовий ШІ-бенчмарк з 3,2-кратним приростом швидкості

Iris Coleman 18:17, 5 березня 2026

NVIDIA GB200 NVL72 встановлює новий рекорд STAC-AI для LLM-інференсу у фінансовій торгівлі, забезпечуючи до 3,2-кратної продуктивності порівняно з архітектурою Hopper.

NVIDIA Blackwell розбиває фінансовий ШІ-бенчмарк з 3,2-кратним приростом швидкості

Архітектура Blackwell від NVIDIA щойно опублікувала найшвидші результати на бенчмарку STAC-AI для фінансового LLM-інференсу, при цьому GB200 NVL72 забезпечує до 3,2-кратного покращення продуктивності одного GPU порівняно з попереднім поколінням Hopper. Результати від 5 березня 2026 року мають значення для торгових компаній, які прагнуть отримати альфу з технічного аналізу неструктурованих даних.

Центр стратегічного технічного аналізу, який проводить бенчмаркінг робочих навантажень фінансових технологій понад 15 років, протестував Blackwell на реальних сценаріях, використовуючи файли EDGAR 10-K — детальні річні звіти, які кількісні фонди аналізують для інвестиційних сигналів. Запускаючи моделі Llama 3.1 від Meta, GB200 NVL72 досяг 37 480 слів за секунду на фінансових запитах середньої довжини, порівняно з 8 237 WPS для подвійних систем GH200.

Чисті цифри розповідають історію

На моделі Llama 3.1 8B з даними EDGAR4 Blackwell обробив 224 запити за секунду проти 51,5 RPS для Hopper — 4,3-кратне покращення на рівні системи. Розрив збільшився на обчислювально важчих завданнях: модель з параметрами 70B на довгоконтекстних файлах EDGAR5 показала стрибок пропускної здатності з 41,4 WPS до 150 WPS.

Що робить ці досягнення можливими? Новий формат квантування NVFP4 від NVIDIA, ексклюзивний для Blackwell, стискає моделі до менших обсягів пам'яті без втрати точності. Hopper використовував квантування FP8; архітектурний стрибок до чотирибітної точності на Blackwell розблокував дельту пропускної здатності.

Інтерактивна продуктивність має значення для трейдингу

Пакетна обробка — це одне. Торгові рішення в режимі реального часу вимагають швидких відповідей. Тут Blackwell підтримував нижчий час реакції (аналогічний часу до першого токена) та кращу затримку між словами навіть при максимальній пропускній здатності. При однакових рівнях використання GB200 NVL72 постійно перевершував GH200 за метриками швидкості відповіді в більшості тестових сценаріїв.

Для торгових столів, які проводять аналіз настроїв під час дзвінків про прибутки або аналізують термінові новини, ця перевага в затримці безпосередньо трансформується в швидше прийняття рішень. Бенчмарк явно тестував повний конвеєр інференсу, включаючи токенізацію — роботу, яку реальні розгортання не можуть пропустити.

Ринковий контекст

Акції NVIDIA торгувалися за $181,41 5 березня, зростаючи на 1,1% за день, при цьому ринкова капіталізація компанії становила $4,42 трильйона. Архітектура Blackwell, оголошена на GTC 2024, була розроблена спеціально для генеративних робочих навантажень ШІ. Генеральний директор Jensen Huang позиціонував її як таку, що живить "нову промислову революцію", і ці результати бенчмарку надають конкретні докази цієї заяви у фінансовому секторі.

Суперчіп GB200 Grace Blackwell поєднує два GPU B200 з CPU Grace, включаючи перероблені ШІ Tensor Cores та NVLink п'ятого покоління для масштабування до 576 GPU. Попередні результати MLPerf показали 2,2-кратний приріст навчання на Llama 3.1 405B; ці цифри STAC-AI підтверджують, що подібні переваги поширюються на інференс.

Hopper все ще актуальний

Варто зазначити: трирічна архітектура Hopper показала гідні цифри. Торгові компанії з існуючими розгортаннями GH200 не стають застарілими за ніч. Але для нових збірок або компаній, де швидкість інференсу безпосередньо впливає на прибутки, економіка Blackwell виглядає привабливо — NVIDIA заявляє про до 25-кратне зниження операційних витрат LLM-інференсу порівняно з попередніми поколіннями.

Повні звіти STAC, включаючи детальні метрики інтерактивного режиму для різних швидкостей надходження, доступні через офіційні канали STAC. Фінансові установи, які оцінюють оновлення ШІ-інфраструктури, тепер мають перевірені дані сторонніх платформ для інформування рішень щодо закупівель.

Джерело зображення: Shutterstock
  • nvidia
  • blackwell
  • ai inference
  • financial trading
  • llm
Відмова від відповідальності: статті, опубліковані на цьому сайті, взяті з відкритих джерел і надаються виключно для інформаційних цілей. Вони не обов'язково відображають погляди MEXC. Всі права залишаються за авторами оригінальних статей. Якщо ви вважаєте, що будь-який контент порушує права третіх осіб, будь ласка, зверніться за адресою [email protected] для його видалення. MEXC не дає жодних гарантій щодо точності, повноти або своєчасності вмісту і не несе відповідальності за будь-які дії, вчинені на основі наданої інформації. Вміст не є фінансовою, юридичною або іншою професійною порадою і не повинен розглядатися як рекомендація або схвалення з боку MEXC.

Вам також може сподобатися

Новини про ціну Bitcoin: BlackRock підживлює зростання ETF на $225M, а ARK купує на спаді, тоді як DeepSnitch AI готується до запуску з потенціалом зростання в 1000 разів та вогняним функціоналом для ринку 2026 року

Новини про ціну Bitcoin: BlackRock підживлює зростання ETF на $225M, а ARK купує на спаді, тоді як DeepSnitch AI готується до запуску з потенціалом зростання в 1000 разів та вогняним функціоналом для ринку 2026 року

Насолоджуйтесь улюбленими відео та музикою, завантажуйте оригінальний контент і діліться всім цим з друзями, родиною та світом на YouTube.
Поділитись
Blockchainreporter2026/03/06 03:10
Український стартап Superapp залучив $1,6 млн на AI no-code розробку під iOS та Mac. У найближчу добу ним можна скористатися безплатно

Український стартап Superapp залучив $1,6 млн на AI no-code розробку під iOS та Mac. У найближчу добу ним можна скористатися безплатно

ШІ-стартап Superapp, який дозволяє генерувати застосунки для екосистеми Apple, закрив pre-seed раунд на $1,6 млн.
Поділитись
Dev2026/03/06 03:17
Продаж авто в Польщі: хто і в якому випадку повинен платити податки

Продаж авто в Польщі: хто і в якому випадку повинен платити податки

Продаж автомобіля передбачає не лише укладення договору купівлі-продажу, а й виконання податкових зобов’язань. У разі невиконання вимог законодавства продавець
Поділитись
Finance2026/03/06 03:01