Intel представила процесорне ядро golden cove — на 42% швидше skylake

16

На що відбувся сьогодні заході architecture day компанія intel представила нову розробку — продуктивне ядро для майбутніх процесорів, відоме раніше під кодовим ім’ям golden cove (p-ядро). Воно стане складовою частиною клієнтських і серверних процесорів alder lake і sapphire rapids, і забезпечить приріст ipc (числа виконуваних за такт інструкцій) на 19% в порівнянні з ядрами минулого покоління sunny cove (з ice lake) і cypress cove (з rocket lake).

Як випливає з доповіді intel, ядро golden cove створювалося з прицілом на високу продуктивність і малі затримки в малопоточних навантаженнях, тому при його створенні увагу було приділено збільшенню числа одночасно оброблюваних інструкцій і підвищенню ефективності роботи з даними. Як стверджують розробники, переваги golden cove в повній мірі проявляться в додатках, заснованих на складному розгалуженому коді.

Середня перевага в швидкодії, яке забезпечує ядро golden cove в порівнянні з ядром cypress cove (з процесорів rocket lake), на однаковій тактовій частоті оцінюється в 19 %. Варто нагадати, що cypress cove продуктивніше skylake ще на 19 %, і це означає сумарну перевагу golden cove перед skylake в розмірі 42% за питомою продуктивністю.

Для досягнення таких результатів в golden cove проведено цілий набір мікроархітектурних поліпшень. Ядро отримало шість декодерів (замість п’яти в skylake і cypress cove), збільшений до 4 тис. Записів кеш мікрооперацій (замість 1,5 і 2,25 тис.у skylake і cypress cove відповідно) і 12 виконавчих портів (замість 8 і 10 у skylake і cypress cove). Крім того, в golden cove виріс розмір фізичного реєстрового файлу і майже в півтора рази в порівнянні з cypress cove збільшився розмір буфера переупорядкування інструкцій.

У числі важливих удосконалень розробники виділяють також кращу точність роботи блоку передбачення переходів, зменшену латентність l1-кеша і засновані на попередній вибірці даних оптимізації пропускної здатності l2-кеша. У ядрі golden cove передбачено три порти для завантажень даних і два — для вивантажень, проти схеми 2+1 або 2+2 в skylake і cypress cove відповідно. Разом з цим мікроархітектура golden cove передбачає істотне збільшення обсягу l2-кеша до 1,25 мбайт на ядро в клієнтських процесорах або до 2 мбайт на ядро в серверних (раніше було 256 або 512 кбайт). Обсяг кеш-пам’яті даних першого рівня при цьому залишиться незмінним і складе 48 кбайт.

Golden cove

Важливим нововведенням у продуктивних ядрах golden cove стане введення нового набору інструкцій intel advanced matrix extensions (amx), спрямованого на прискорення тензорних обчислень, використовуваних при машинному навчанні. Фактично мова йде про операції з матрицями: набір amx включає команди для обробки 2 тис.цілочисельних або 1 тис. Речових операндів за такт. Інструкції amx дозволяють досягти прискорення виконання алгоритмів ші в порівнянні з реалізаціями, заснованими на avx-512-коді, в 7-8 разів. На першому етапі розширення amx будуть доступні тільки в серверних процесорах з ядрами golden cove.

Мікроархітектура ядер golden cove знайде застосування в клієнтських процесорах alder lake, які будуть проводитися за технологічним процесом intel 7 (раніше — 10 нм enhanced superfin) і вийдуть в четвертому кварталі 2021 року. Згодом ці ядра потраплять в серверні процесори sapphire rapids – їх поява на ринку очікується в другому кварталі 2022 року.