Samsung parodys spartesnį HBM4: pralaidumas iki 3.3 TB/s

Samsung parodys spartesnį HBM4: pralaidumas iki 3.3 TB/s

Viltė Petrauskaitė Viltė Petrauskaitė . 2 Komentarai

6 Minutės

Samsung jau ruošiasi toliau didinti atminties našumą: po pirmojo HBM4 debiuto SEDEX 2025 renginyje bendrovė ketina pristatyti žymiai spartesnę HBM4 versiją konferencijoje ISSCC 2026. Žemiau apžvelgiame, ką žinome apie šį pralaidumo padidėjimą, inžinerinius pakeitimus ir kodėl tai svarbu dirbtiniam intelektui (AI) bei aukštos spartos skaičiavimams.

Didelis pralaidumo šuolis: nuo 2.4TB/s iki 3.3TB/s

Praėjusį mėnesį SEDEX renginyje Samsung pristatė savo pirmąjį šeštos kartos aukštos pralaidumo atminties (HBM4) lustą, kuris pasižymėjo 2.4 TB/s pralaidumu. Pagal pramonės pranešimus, naujoji HBM4 versija, kurią Samsung planuoja demonstruoti International Solid-State Circuits Conference (ISSCC) — numatyta 2026 m. vasario 15–19 d. San Franciske, — padidina piko pralaidumą iki maždaug 3.3 TB/s. Tai reiškia maždaug 37,5% didesnį pralaidumą lyginant su ankstesniu modeliu, kas yra reikšmingas žingsnis tiek architektūrine, tiek praktine prasme.

Toks pralaidumo didėjimas ne tik pagerina gryną duomenų srautą tarp atminties ir procesorių, bet ir keičia išlaidų bei efektyvumo pusiausvyrą duomenų centrų ir AI spartintuvų projektavime. Didelis piko pralaidumas ypač svarbus didelės apimties modelių treniravimui, realaus laiko inferencijai, taip pat daugįtėklių GPU diegimams, kur reikia sumažinti atminties blokavimus (memory stalls) ir išlaikyti aukštą veiklos nuoseklumą.

Kas pasikeitė po gaubtu?

Šaltiniai teigia, kad našumo prieaugis daugiausia kyla iš perdarytos sluoksniuotos konstrukcijos ir atnaujinto interfeiso, kurie kartu didina pralaidumą ir gerina energijos efektyvumą. Konkrečiai, Samsung pakeitimai apima optimizuotą sluoksniavimą (stacked structure), geresnę signalo integralumo valdymo strategiją ir modifikuotą sąsają tarp logikos lustų ir DRAM sluoksnių. Tai gali reikšti patobulintas TSV (through-silicon via) konfigūracijas, platesnius pojūčio laidai (bus widths) arba aukštesnio dažnio I/O jungtis, kurios leidžia pasiekti didesnį duomenų pralaidumą be proporcingo energijos sąnaudų augimo.

Pranešimuose taip pat nurodoma, kad Samsung savo HBM4 paketuose naudojo 1c DRAM proceso variantus, o konkurentai, pavyzdžiui, Micron ir SK Hynix, pasirinko 1b DRAM sprendimus. Skirtumas tarp 1c ir 1b procesų variantų paprastai siejamas su mikrolitūro optimizavimu, galimybėmis palaikyti aukštesnius I/O dažnius, energijos sąnaudų profiliu ir galutinėmis išgavomumo (yield) charakteristikomis. 1c varianto pasirinkimas gali suteikti Samsung lankstumo siekiant didesnio pralaidumo vienam vate (bandwidth per watt) arba leidžia eksperimentuoti su agresyvesne signalo komandų konfigūracija, bet tuo pačiu gali reikalauti griežtesnės terminės valdymo strategijos gamybos metu.

Kai kuriais atvejais architektūriniai pakeitimai apima ne tik DRAM sluoksnių mazgų optimizavimą, bet ir tarpinių elementų, tokių kaip interposer arba aktyvių jungčių sprendimų (active interposer), diegimą. Toks požiūris gali sumažinti triukšmo ir signalo nuostolius, pagerinti signalo laiką (timing) ir leisti geriau išnaudoti didesnius signalo dažnius. Be to, atnaujintas protokolas ar interfeisas tarp HBM4 paketų ir pagrindinių valdiklių gali turėti efektyvesnę komandų eiliškumo valdymą, paieškos strategijas (prefetching) ir geresnį lygiagretų duomenų srautų balansavimą, kas svarbu didelio pralaidumo scenarijams.

Pagrindinės specifikacijos apžvalga

  • Ankstesnio HBM4 pralaidumas: 2.4 TB/s
  • Ateinančio HBM4 pralaidumas: iki 3.3 TB/s
  • Pagerėjimas: ~37,5%
  • Dizaino pakeitimai: atnaujinta sluoksniuota struktūra ir interfeisas
  • DRAM variantas: Samsung naudoja 1c DRAM, konkurentai renkasi 1b

Kodėl tai svarbu AI ir serveriams

Aukštos pralaidumo atmintis (HBM) yra vienas iš kertinių elementų AI spartintuvuose ir duomenų centro GPU architektūroje. Dauguma modernių neuroninių tinklų ir didelių kalbos modelių reikalauja greito prieigos prie masyvių kiekių parametrijos ir laikinųjų duomenų; jeigu atminties pralaidumas tampa siaura kaklelis, GPU arba spartintuvas praranda efektyvumą, laikinai laukiant duomenų. Didesnis pralaidumas sumažina atminties užstrigimus (memory stalls), leidžia tolygiau maitinti skaičiavimo vienetus ir pagreitina tiek treniravimo, tiek inferencijos etapus.

Be greičio, svarbu ir energijos vartojimo efektyvumas (power efficiency). Didinant pralaidumą be proporcingo energijos suvartojimo padidėjimo, galima sumažinti pradinę kainą už operaciją (joules per operation), o tai ypač aktualu debesijos paslaugų tiekėjams ir HPC (high-performance computing) centrams, kuriems energijos ir aušinimo kaštai sudaro didelę bendrų eksploatacijos išlaidų dalį. Samsung sprendimas siekti aukštesnio pralaidumo per architektūrinius pakeitimus ir DRAM proceso variantų parinktis orientuojasi būtent į šią pralaidumo ir energijos efektyvumo pusiausvyrą.

Anksčiau HBM produktų vystymosi keliuose matėme terminio (heat-related) pobūdžio iššūkius — pernelyg didelė šiluma gali paveikti tiek ilgalaikį patikimumą, tiek gamybos išeigas. Po tokių patirties epizodų Samsung, regis, įdiegė dizaino pataisas ir gamybos kokybės patobulinimus siekdama atsigauti konkurencinėje kovoje. Įmonė tikisi, kad HBM4 taps reikšmingu pajamų šaltiniu atminties rinkai vėl stiprėjant, kadangi dirbtinio intelekto ir didelio tankio skaičiavimo poreikiai ir toliau auga.

ISSCC Korea pristatyme SK Hynix ekspertas Kim Dong-gyun pažymėjo, kad DRAM raida yra varoma dvipusių poreikių — didesnio pralaidumo ir geresnio energijos efektyvumo. Samsung sprendimas demonstruoti aukštesnės spartos HBM4 ISSCC 2026 leidžia manyti, kad gamintojas siekia ne tik techninio laimėjimo, bet ir rinkos persiorientavimo: spartesnė atmintis gali atverti naujas galimybes AI serverių architektūroms, o tiek aparatinės įrangos kūrėjams, tiek debesijos paslaugų tiekėjams suteikia daugiau pasirinkimo galimybių optimizuojant kaštus ir našumą.

Tikėtina, kad ISSCC pristatymas pateiks daugiau techninių detalių ir realaus pasaulio našumo matų (benchmarkų): nuo piko pralaidumo iki realių darbo krūvių (real-world workloads) efektyvumo, pralaidumo/watt rodiklių ir terminių charakteristikų. Tai taps būtina stebėti akimirka aparatūros dizaineriams, serverių tiekėjams ir debesijos operatoriams, kurie siekia didesnio pralaidumo AI krūviams be neadekvačiai didelių energijos sąnaudų.

Šaltinis: sammobile

Sveiki! Esu Viltė, kasdien sekanti technologijų naujienas iš viso pasaulio. Mano darbas – pateikti jums svarbiausius ir įdomiausius IT pasaulio įvykius aiškiai ir glaustai.

Palikite komentarą

Komentarai

Marius

Ar tikrai 1c DRAM verta rizikuoti? Skamba kaip tech pažanga, bet lauksiu realių pralaidumo/watt duomenų — ir yield'ai baugina, hmm

duomax

Wow, 3.3 TB/s? Nustebau. Jei realu, AI treniruotės smarkiai paspartės, bet termika ir kaina vis tiek kelia klausimų... įdomu, lauksiu testų