ARM pristato Lumex — gamybai paruoštą 3 nm skaičiavimo posistemį

ARM pristato Lumex — gamybai paruoštą 3 nm skaičiavimo posistemį

0 Komentarai Austėja Kavaliauskaitė

6 Minutės

ARM šiandien pristatė Lumex — gamybai paruoštą skaičiavimo posistemį (CSS), skirtą 3 nm proceso mazgams ir sukurtą pagreitinti partnerių, gaminančių silicio lustus, darbą kuriant aukštos spartos ir energiją taupančius mobiliuosius SoC. Užuot tapusi lustų tiekėja, ARM per Lumex siūlo pilnai paruoštus, gamykloms pritaikytus sprendimus, kuriuos gamintojai gali naudoti kaip lanksčius statybinius blokus — leidžiant partneriams sutelkti inžinerinius išteklius į klasterių lygyje vykdomą CPU ir GPU diferenciaciją.

Kas yra Lumex CSS?

Lumex yra modulinė lustų schema, skirta šiuolaikiniams išmaniesiems telefonams, dėvimiesiems įrenginiams ir kitiems edge įrenginiams. Ji apjungia ARM naujos kartos CPU branduolius, Mali-G1 GPU šeimą, skalę keičiančią sistemos tarpusavio jungtį ir saugumui skirtas atminties posistemas — visa tai optimizuota keliems 3 nm gamyklų procesams. Tikslas yra sutrumpinti vystymo ciklus, užtikrinti nuoseklų našumą skirtingose fabrikuose ir padaryti pažangias funkcijas, tokias kaip saugi virtualizacija ir aukšto efektyvumo sistemos talpykla, plačiai prieinamas gamintojams.

Pagrindiniai aparatinės įrangos komponentai

  • Skalė keičiami CPU klasteriai per naują C1-DSU (Design System Unit): palaiko dizainus nuo 1 iki 14 CPU branduolių ir iki trijų branduolių tipų, parenkamų iš keturių C1 variantų.
  • Mali-G1 GPU šeima: skaluojasi nuo 1 iki 24 šešėlių branduolių, įskaitant aukštos klasės Mali-G1 Ultra variantą.
  • Sistemos tarpusavio jungtis L1 ir SLC: sisteminės lygio talpyklos įgyvendinimas, sumažinantis nuotėkį maždaug 71 % palyginti su standartiniais RAM sprendimais, mažinantis tuščiosios eigos energijos sąnaudas.
  • MMU L1: atminties valdymo vienetas, pritaikytas saugiai ir ekonomiškai virtualizacijai, leidžiantis paleisti kelias OS ar skyriuje tvarkyti darbo krūvius viename SoC.

CPU asortimentas ir našumo lygiai

ARM C1 serijos branduoliai skirti aprėpti viską — nuo flagmanų maksimalaus našumo iki itin mažos galios dėvimųjų įrenginių. Asortimentas ir tipiniai naudojimo atvejai apima:

  • C1-Ultra — flagmanams skirta vienos gijos sparta su maždaug +25 % vienos gijos prieaugio ir dviženkliais IPC pagerinimais metai‑per‑metus. Idealu didelių modelių inferencijai, kompiuterinei fotografijai, turinio kūrimui ir generatyvinėms AI užduotims.
  • C1-Premium — artimas C1-Ultra piko spartos lygiui, tačiau pasižymi geresniu ploto efektyvumu (apie 35 % mažesnis lusto plotas). Tinka aukštesnės vidutinės klasės įrenginiams, daugelio užduočių vykdymui ir visada įjungtiems balso asistentams.
  • C1-Pro — sukoncentruotas į pastovų efektyvumą su +16 % pastoviosios spartos; skirtas ilgam vaizdo atkūrimui, srautinei inferencijai ir ilgalaikiams fono darbams.
  • C1-Nano — itin mažos galios, kompaktiškas branduolys, suteikiantis iki +26 % efektyvumo mažiausiuose formatuose, tokiuose kaip dėvimi įrenginiai ir maži IoT prietaisai.

GPU, AI ir matricų akceleracija

Mali-G1 GPU šeima plačiai skalėmis pritaikoma skirtingiems rinkos segmentams. ARM teigia, kad Mali-G1 Ultra siūlo apie 20 % geresnį rastravimo našumą ir iki 2x spartesnį spindulių trasavimą (ray tracing) lyginant su ankstesniu Immortalis-G925. Inferencijos užduotyse G1 GPU nurodoma esantis maždaug 20 % spartesnis nei ankstesnė karta.

ARM dirbtinio intelekto pastangų centre yra Scalable Matrix Extension 2 (SME2). SME2 pagreitina matricų skaičiavimus, kurie yra kertiniai šiuolaikiniams neuroniniams tinklams; ARM praneša, kad CPU pusės ML darbo krūviai gali pasiekti iki 5x didesnį pralaidumą ir net iki 3x geresnį efektyvumą, palyginti su ankstesniais dizainais, leidžiant įrenginiams paleisti pajėgesnius modelius vietoje.

Platformos lygio efektyvumas ir sauga

Lumex pabrėžia energiją taupančią posistemės architektūrą. Sisteminė tarpusavio jungtis L1 ir jos sisteminės lygio talpykla (SLC) žymiai sumažina nuotėkį, mažindama tuščiosios eigos energijos sąnaudas — svarbus laimėjimas baterijos veikimo laikui. MMU L1 suteikia aparatinės įrangos lygyje pagrindus saugiai virtualizacijai, leidžiant tiekėjams skirti aparatūrą kelioms OS arba atskirti jautrius darbo krūvius su mažesnėmis sąnaudomis nei programinės įrangos sprendimai.

Testai, palyginimai ir teiginiai

ARM praneša, kad C1 CPU skaičiavimo klasteris vidutiniškai lenkia ankstesnius branduolius apie 30 % pagal šešis pramonės standartinius testus. Realūs prieaugiai skiriasi priklausomai nuo užduoties: žaidimuose ir srautinėse platformose matomas maždaug 15 % padidėjimas, o kasdienėse užduotyse, kaip vaizdo atkūrimas, naršymas ir socialinės programėlės, efektyvumas padidėja apie 12 % vidutiniškai. Palyginti su Cortex-X925, C1-Ultra siūlo dviženklius IPC patobulinimus, stiprindamas ARM kryptį link geresnės vienos gijos ir AI spartos.

Naudojimo atvejai ir rinkos svarba

Lumex sukurtas plačiam įrenginių spektrui: flagmanų telefonams, kuriems reikalingas maksimalus našumas ir pažangi vietinė AI; aukštesnės vidutinės klasės telefonams, kurie gauna naudą iš ploto efektyvių premium branduolių; energijai jautrioms planšetėms ir srautiniams įrenginiams; bei mažiems dėvimiems įrenginiams, kuriems būtinas itin aukštas efektyvumas. OEM ir silicio partneriams Lumex žada greitesnį patekimą į rinką, nuoseklias 3 nm diegiamos versijas keliuose fabrikuose ir aiškų kelią integruoti galingesnę vietinę AI išlaikant baterijos veikimo laiką ir šiluminį rezervą.

Pramonės reakcija

Keletas ARM partnerių pasveikino Lumex kaip strateginį pagreitintoją. Pagrindiniai OEM ir silicio komandos pabrėžė, kad paruoštas ir pritaikomas skaičiavimo posistemis pašalina daug žemo lygio integracijos naštos ir leidžia jiems susitelkti į produkto lygiu diferenciaciją — ar tai būtų kameros apdorojimas, AI funkcijos ar sistemos energijos valdymo optimizavimas. Didieji platformų tiekėjai taip pat pažymėjo, kad SME2 padės pritaikyti pažangesnius modelius platesniam įrenginių ratui, sumažinant delsą ir gerinant privatumą leidžiant lokalią inferenciją.

Išvados

Lumex žymi reikšmingą ARM IP pakavimo poslinkį 3 nm eroje: ne tapdamas lustų gamintoju, o tiekiantis visapusišką, pritaikomą ir gamybai paruoštą pagrindą, kuris pagreitina dizaino ciklus ir standartizuoja aukštos klasės funkcijas, tokias kaip saugi virtualizacija ir matricų akceleracija. Įrenginių gamintojams, orientuotiems į vietinę AI, grafiką ir baterijai palankų našumą, Lumex siekia būti pragmatišku trumpuoju keliu į kitos kartos mobiliąją skaičiavimo platformą.

Šaltinis: gsmarena

„Technologijos visada mane žavėjo – nuo išmaniųjų telefonų iki dirbtinio intelekto proveržių. Džiaugiuosi galėdama dalintis naujienomis su jumis kiekvieną dieną.“

Komentarai

Palikite komentarą