На інженерному зразку мікропроцесора ельбрус 16с вичавили 1 tflops

32

як стало відомо з телеграм-каналу, присвяченого мікропроцесору ельбрус, інженерний зразок нового мікропроцесора ельбрус 16с показав на бенчмарку mp mflops продуктивність більше 1 tflops на обчисленнях з плаваючою точкою в режимі одинарної точності. Заміри робив широко відомий у вузьких колах експерт entityfx.

Виміри швидкості обчислень проводилися на тестовій материнській платі панель 1е16с-ua, на якій розміщений один мікропроцесор ельбрус 16с, що працює на частоті 2 ггц. Даний процесор серверний, і його використання планується в стандартній конфігурації материнської плати на чотири процесори, як це зроблено у вітчизняних серверах з чотирма ельбрус 8с (застаріла модель розробки 2014 року, яку напередодні 2022 року тестував сбербанк) і ельбрус 8св (поточна модель).

Результати виміру наступні:

16 cpus available

##############################################

64 bit mp sse mflops benchmark 1, 16 threads,

Thu jan 20 22:34:05 2022

Test 4 byte ops/ repeat seconds mflops first

Words word passes results

Data in&out 102400 2 40000 0.02239 365868 0.48145

Data in&out 1024000 2 4000 0.01897 431731 0.89130

Data in&out 10240000 2 400 0.83380 9825 0.98812

Data in&out 102400 8 40000 0.05206 629394 0.63532

Data in&out 1024000 8 4000 0.04923 665577 0.93332

Data in&out 10240000 8 400 0.88938 36843 0.99285

Data in&out 102400 32 40000 0.13484 972042 0.38510

Data in&out 1024000 32 4000 0.12981 1009723 0.83345

Data in&out 10240000 32 400 0.85865 152649 0.98103

End of test thu jan 20 22:34:08 2022

Слід розуміти, що тест mp mflops – це універсальний тест обчислень з плаваючою точкою, не заточений на конкретну архітектуру процесора. Саме тому в даному тесті відбувається тестування в різних режимах: з різним розміщенням вихідних даних, з різною кількістю ітерацій. Різні процесори показують різну продуктивність при різних умовах, і даний тест показує, який режим обчислень самий “зручний” для конкретної моделі процесора.

Якщо подивитися на характеристики ельбрус 16с, то можна побачити заявлену продуктивність в 1,5 tflops:

Може виникнути питання: чому ж тест mp mflops показав 1 tflops замість заявлених 1,5 tflops? справа в тому, що 1,5 tflops – це продуктивність при обчисленнях, повністю завантажують все широке командне слово ельбрусу, за умови використання всіх 6 арифметично-логічних пристроїв (алу) кожного ядра. Щоб організувати такі обчислення, необхідно спеціально підготувати завдання під даний процесор, причому необхідно враховувати, що не всі обчислювальні завдання можна “утрамбувати” в рамки, задані залізом процесора. Але якщо завдання укладається в вищевказані умови, тоді темп обчислень і вийде рівним 1,5 tflops. Очевидно, що універсальний тест не може створити такі умови обчислень, тому в ньому получется заміряти продуктивність обчислень “середньої” завдання з плаваючою точкою. У будь – якому випадку, 1 tflops на універсальному тесті-це дуже хороший результат.

Для розуміння, ось невелика таблиця cpu і gpu із зазначенням їх пікової продуктивності:

Intel core 2 duo (2006) — 0.019 тфлопс;

Intel core i7-4930k (2013) — 0.163 тфлопс;

Amd ryzen 7 3700x (2019) — 0.460 тфлопс;

Sony playstation 4 (2013) — 1,84 тфлопс;

Geforce rtx 2080 ti (2018) — 13,5 тфлопс (одинарна точність);

І дивлячись на цю таблицю, може виникнути ще одне питання: а чому тоді при таких видатних показниках, сбербанк забракував сервери з ельбрусом всередині, заявивши, що вони відстають від процесорів intel в 3-4 рази? відповідь в тому, що архітектура ельбрус – це сучасний розвиток “числодробилок”, які заточуються саме на обчислення з плаваючою точкою (що і показав тест продуктивності). Однак в банківських завданнях, як не пародоксально, обчислення з плаваючою точкою займають дуже незначне місце. Набагато важливіше забезпечення роботи операційної системи, баз даних, віртуальних машин java, веб-серверів, скриптових мов і т.д., а в цих задачах обчислення з плаваючою точкою практично не використовуються. Ці завдання мають на увазі швидке виконання безлічі дрібних команд процесора, з якими природним чином добре справляються risc-based процесори за рахунок високої тактової частоти і динамічного провісника переходів. Мікропроцесори з vliw-архітектурою теж без проблем виконують дані завдання, але не так ефективно, так як мають інший внутрішній пристрій. Крім того, сбербанк тестував процесор ельбрус 8с розробки 2014 року, побудований на застарілих технологіях – один тільки ddr3 чого вартий, і дивно було б очікувати хороший результат за мірками кінця 2021 року (чому на тестування віддали застарілу модель – це окреме питання).

У будь-якому випадку, адміністрація webhamster.ru вітає розробників мцст з черговим важливим досягненням. Чекаємо появи суперкомп’ютера з ельбрусами на борту в перших рядках рейтингу top 500!