Už je to rok a pol Amazon vydali svoje procesorové jadro Graviton Arm prvej generácie, ktoré je verejne dostupné v AWS EC2 ako takzvané prípady A1. Aj keď procesor na jeho výkon príliš nezaujal, bol to signál a prvý krok toho, čo má prísť v najbližších rokoch.
Tento rok, Amazon zdvojnásobuje svoje úsilie v oblasti kremíka, keď ohlásil nový procesor Graviton2 v decembri minulého roku a plánuje dostupnosť EC2 verejnosti v najbližších mesiacoch. Najnovšia generácia zaviedla novú mikroarchitektúru Neoverse N1 CPU a sieťové prepojenie, kombinovanú platformu orientovanú na infraštruktúru, ktorú sme podrobne uviedli pred viac ako rokom. Táto platforma je obrovským skokom v porovnaní s predchádzajúcimi pokusmi o server Arm Amazon sa nezameriava iba na vedúce konkurenčné postavenie.
AmazonÚsilie v oblasti navrhovania vlastných SoC pre cloudové služby sa začalo v roku 2015, keď spoločnosť získala laboratórium Annapurna Labs založené na Isareli. Annapurna predtým pracovala na Arm SoC zameraných na vytváranie sietí, ktoré sa väčšinou používajú v produktoch, ako sú zariadenia NAS. pod Amazon, tím bol poverený vytvorením vlastného čipu triedy servera Arm a nový Graviton2 je prvým vážnym pokusom o narušenie priestoru.
Čo je to Graviton2? Jedná sa o 64-jadrový monolitický serverový čip, ktorý využíva nové jadrá Arm Neoverse N1 od Arm (mikroarchitektúrne deriváty mobilných jadier Cortex-A76), ako aj sieťové prepojenie Arm CMN-600. Je to celkom jednoduchý návrh, ktorý je v podstate takmer totožný so 64-jadrovou referenčnou platformou N1 spoločnosti Arm, ktorú spoločnosť predstavila pred rokom. Amazon trochu sa odklonilo, napríklad procesorové jadrá Graviton2 sú taktované o niečo nižšie 20,5 GHz a zahrnutie iba 32 MB namiesto 64 MB vyrovnávacej pamäte L3 do prepojenia siete. Systém je podporovaný 8-Kanálové pamäťové radiče DDR-3200 a SoC podporuje 64 PCIe4 dráh pre I / O. Je to implementácia dizajnu relatívne učebnice pre platformu N1, ktorá sa vyrába v procesnom uzle 7nm TSMC.
Potenciál Graviton2 je samozrejme umožnený novými jadrami N1. Už sme videli skvelý výkon Cortex-A76 v minuloročných mobilných SoC a očakáva sa, že mikroarchitektúra N1 prinesie ešte lepší výkon a funkcie na úrovni servera, a to všetko pri zachovaní energetickej účinnosti, vďaka ktorej je Arm v mobilnom priestore tak úspešný. Jadrá N1 zostávajú pri projektovaní veľmi chudé a efektívne10,4 mm² pre implementáciu vyrovnávacej pamäte 1MB L2, ako je to na zariadení Graviton2, a vynikajúca energetická účinnosť približne ~ 1 W na jadro na 2Frekvencia .5 GHz, pri ktorej AmazonPríde nový čip.
Celková spotreba energie SoC je niečo také Amazon nebol príliš ochotný to zverejniť v kontexte nášho článku – spoločnosť stále drží niektoré aspekty dizajnu blízko hrude, aj keď sme dokázali vyskúšať novú čipovú sadu v cloude. Vzhľadom na konzervatívnejšiu taktovaciu frekvenciu čipu sa Armova predpokladaná hodnota okolo 105 W pre 64-jadro 2Implementácia 0,6 GHz a nedávne odhalenie ich 80-jadrového čipového servera 3GHz N1 spoločnosti Ampere prichádzajúceho na 210 W, odhadujeme, že Graviton2 musí prísť okolo kdekoľvek medzi 80 W ako nízky odhad na približne 110 W pre pesimistickú projekciu.
Testovanie v cloude s EC2
Vzhľadom na to AmazonGraviton2 je vertikálne integrovaný produkt špeciálne navrhnutý pre AmazonMá zmysel, že novú čipovú sadu testujeme v jej určenom prostredí (okrem toho, že nie je k dispozícii iným spôsobom!). Za posledných pár týždňov sme mali prístup k ukážkam Amazon Webové služby (AWS) Elastic Compute Cloud (EC2) nové inštancie „m6g“ založené na Graviton2.
Pre čitateľov, ktorí nie sú oboznámení s cloud computingom, to v podstate znamená, že sme nasadili virtuálne stroje AmazonDatacentrá, služba, pre ktorú Amazon sa stala slávnou a teraz predstavuje hlavný podiel na výnosoch spoločnosti, ktorá poháňa niektoré z najväčších internetových služieb na trhu.
Dôležitým ukazovateľom určujúcim schopnosti takýchto inštancií je ich typ (v podstate diktujúci architektúru CPU a mikroarchitektúru, ktorá poháňa základný hardvér) a možný podtyp; v AmazonTo sa týka variácií platforiem, ktoré sú navrhnuté pre špeciálne prípady použitia, napríklad s lepšou výpočtovou schopnosťou alebo s väčšou kapacitou pamäte.
Na dnešné testovanie sme mali prístup k inštanciám „m6g“, ktoré sú určené na všeobecné pracovné zaťaženie. „6“V označení nomenklatúry AmazonHardvér šiestej generácie v EC2, pričom Graviton2 je v súčasnosti jedinou platformou, ktorá drží toto označenie.
Priepustnosť inštancie je definovaná v vCPU
Okrem typu inštancie je najdôležitejšou ďalšou metrikou, ktorá definovala možnosti inštancie, jej počet vCPU. „Virtuálne procesory“ v podstate znamenajú logické jadrá CPU dostupné virtuálnemu stroju. Amazon ponúka prípady od 1 vCPU až 128, pričom najbežnejšie spomedzi najpopulárnejších platforiem prichádzajú vo veľkostiach 2, 4, 8, 16, 32, 48, 64 a 96.
Graviton2 ako 64-jadrová platforma s jedným socketom bez SMT znamená, že maximálna dostupná veľkosť inštancie vCPU je 64.
Čo to však tiež znamená, je to, že keď hovoríme o platformách, ktoré prichádzajú so SMT, sme celkom v kúte porovnávača jabĺk a pomarančov. Keď hovoríme o 64 inštanciách vCPU („16-násobok“ v EC2 lingu), znamená to, že pre inštanciu Graviton2 dostávame 64 fyzických jadier, zatiaľ čo pre systémy AMD alebo Intel dostaneme iba 32 fyzických jadier so SMT. Som si istý, že budú existovať čitatelia, ktorí budú považovať takéto porovnanie za „nespravodlivé“, je to však aj pozícia, Amazon sa snaží, pokiaľ ide o dodanú priepustnosť, a čo je najdôležitejšie, urobiť rovnocenné ceny medzi rôznymi typmi inštancií.
Dnešná súťaž
Dnešný článok sa zameria na dvoch hlavných konkurentov Graviton2: inštancie m5a poháňané AMD EPYC 7571 (Zen1) a m5n na procesoroch Intel Xeon Platinum 8259CL (Cascade Lake). V súčasnosti sú to najsilnejšie príklady, ktoré sú k dispozícii od dvoch etablovaných spoločností x86, a mali by poskytovať najzaujímavejšie porovnávacie údaje.
Je potrebné poznamenať, že by sme boli radi, keby sme do tohto porovnania mohli zahrnúť prípady AMD EPYC2 v Ríme (c5a / c5ad); Amazon oznámila, že na takýchto nasadeniach pracovali minulý november, ale bohužiaľ, spoločnosť s nami nechcela zdieľať prístup k náhľadu. (Jedným z uvedených dôvodov boli prípady typu R v Ríme nie sú dobré v porovnaní s inštanciou typu M Graviton2. , hoci to naozaj nedáva žiadny technický zmysel). Keďže sa tieto prípady blížia k dostupnosti ukážky, budeme pracovať na samostatnom článku, ktorý pridá túto dôležitú časť hádanky konkurenčnej krajiny.
Testované 16-násobné prípady EC2 | |||
M6G | m5a | M5N | |
Platforma CPU | Graviton2 | EPYC 7571 | Xeon Platinum 8259CL |
vCPUs | 64 | ||
Cores per Socket | 64 | 32 | 24 (16 okamžitých) |
SMT | – | 2smerného | 2smerného |
Sokety CPU | 1 | 1 | 2 |
frekvencia | 2.5GHz | 2,5-2.9GHz | 2,9-3.2GHz |
architektúra | Rameno v8.2 | x86-64 + AVX2 | x86-64 + AVX512 |
μarchitecture | Neoverse N1 | Zen | Cascade Lake |
L1I Cache | 64 KB | 64 KB | 32 KB |
L1D Cache | 64 KB | 32 KB | 32 KB |
L2 Cache | 1 MB. | 512 KB | 1 MB. |
L3 Cache | 32 MB zdieľané | 8 MB zdieľané za 4-core CCX | Zdieľa sa 35,75 MB na soket |
Pamäťové kanály | 8x DDR4-3200 | 8x DDR-2666 (2x na NUMA uzol) | 6x DDR4-2933 na soket |
Uzly NUMA | 1 | 4 | 2 |
DRAM | 256GB. | ||
TDP | odhaduje 80-110W? | 180W | 210W na soket |
cena | $20,644 / hodinu | $20,752 za hodinu | $30,808 / hod |
Pri porovnaní inštancií Graviton2 m6g s inštanciami AMD m5a a Intel m5n sme zaznamenali niekoľko rozdielov v hardvérových možnostiach, ktoré poháňajú VM. Najznámejší rozdiel je opäť v tom, že Graviton2 prichádza s počty fyzických jadier, ktoré sa zhodujú s nasadeným číslom vCPU, zatiaľ čo konkurencia počíta logické jadrá SMT ako vCPU.
Ďalšími aspektmi, keď hovoríme o prípadoch s vyšším počtom vCPU, je skutočnosť, že môžete získať virtuálny počítač, ktorý pokrýva niekoľko soketov. Prostredie m5a.16xlarge AMD je stále schopné nasadiť VM do jediného soketu vďaka 32 jadrám EPYC 7571, avšak systém Xeon od spoločnosti Intel tu využíva dve zásuvky, pretože v súčasnosti v systéme EC2 nie je nasadený žiadny hardvér Intel, ktorý by mohol ponúknuť požadovaný počet vCPU v jeden konektor.
EPYC 7571 aj Xeon Platinum 8259CL sú časti, ktoré nie sú verejne dostupné alebo dokonca uvedené na zozname SKU ktorejkoľvek spoločnosti, takže ide o vlastné diely pre obľúbené Amazon pre nasadenie dátového centra.
Časť AMD je 32-jadrové riešenie založené na jednotnom sokete Zen1 (aspoň pre 16-násobné prípady v našich testoch) 2,5 GHz všetky jadrá až do 20,9 GHz v scenároch s ľahkými vláknami. Zvláštnosťou tohto systému je to, že je do istej miery obmedzené štvorpásmovým MCM systémom AMD, ktorý má štyri uzly NUMA (jeden na jeden čip a 2(radič kanálovej pamäte), charakteristika, ktorá bola eliminovaná v novších systémoch založených na EPYC2 Zen2. Nemáme konkrétne potvrdenie údajov, ale máme podozrenie, že ide o 180W časť na základe čísla SKU.
Procesor Intel Xeon Platinum 8259CL je založený na novších jadrách CPU Cascade Lake. Táto konkrétna časť je tiež špecifická pre Amazona pozostáva z 24 jadier povolených na soket. Na dosiahnutie počtu 16xlarge 64 vCPU nám EC2 poskytuje systém s dvoma zásuvkami so 16 z 24 jadier vytvorených na každej sokete. Opäť nemáme v tejto veci žiadne potvrdenie, ale tieto časti by mali byť ohodnotené na 210 W na soket alebo celkom 420 W. Musíme si pripomenúť, že v našom prípade používame iba 66% jadier systému, hoci máme prístup k celej šírke pásma pamäte a vyrovnávacej pamäte systému.
Zaujímavá je tu predovšetkým konfigurácia vyrovnávacej pamäte, pretože medzi platformami sa veci dosť líšia. Súkromné vyrovnávacie pamäte samotných CPU sú relatívne samovysvetľujúce a Graviton2 tu poskytuje najvyššiu kapacitu vyrovnávacej pamäte z tria, ale inak sa rovná platforme Xeon. Keby sme mali rozdeliť dostupnú vyrovnávaciu pamäť na vlákno, vlákno Graviton2 vedie súbor na 1.5 MB, pred EPYC 10,25 MB a Xeon 10,05MB Systémy Graviton2 a Xeon majú výraznú výhodu v tom, že ich medzipamäte poslednej úrovne sú zdieľané v celom sokete, zatiaľ čo AMD L3 je zdieľaná iba medzi 4-core CCX moduly.
Rozdiely medzi NUMA medzi systémami nie sú také dôležité v paralelnom pracovnom zaťažení pri spracovaní so skutočnými viacerými procesmi, ale bude to mať vplyv na výkon s viacerými vláknami, ako aj na procesy s jedným vláknom a architektúra zjednotenej pamäte Graviton2 bude mať dôležitú výhodu v niekoľko scenárov.
Nakoniec je medzi jednotlivými inštanciami pomerne rozdiel v cenách. O $20,46 za hodinu, systém Graviton2 vyniká cenou systému AMD a je výrazne lacnejší ako $3Náklady na inštanciu založenú na Xeone 0,80 za hodinu. Aj keď hovoríme o cenách, musíme pamätať na to, že skutočná dodaná hodnota bude tiež veľmi závisieť od výkonu a priepustnosti systémov, ktoré podrobnejšie rozoberieme neskôr v článku.
Ďakujeme Amazon za poskytnutie náhľadu prístupu k inštanciám m6g Graviton2. Okrem sprístupnenia nám Amazon ani žiadna z uvedených spoločností nemala vplyv na našu metodiku testovania a my sme zaplatili za čas testovania inštancie EC2 sami.