Samsung HBM4, zHBM ir PIM: atminties evoliucija 2027

Samsung HBM4, zHBM ir PIM: atminties evoliucija 2027

Austėja Kavaliauskaitė Austėja Kavaliauskaitė . Komentarai

8 Minutės

Įvadas

Megadomenai debesų paslaugų rinkoje perka atmintį tarsi brangenybes. Hiperskalerių užsakymai išaugo tiek, kad kainos kyla, o tiekimo grandinės ieško sprendimų.

Song Jai-hyuk, „Samsung“ Device Solutions padalinio technologijų vadovas (CTO), Semicon Korea renginyje pristatė šią realybę ir apibūdino, ką įmonė mato ateityje: didelės spartos atminties paklausa išliks aukšta ne tik šiais metais, bet ir 2027 m. Trumpa frazė — didelė reikšmė.

Samsung orientacija: HBM4 ir masiniai siuntimai

„Samsung“ artimiausias prioritetas yra HBM4 — naujos kartos aukštos pralaidumo atmintis, sukurta ekstremalioms skaičiavimo apkrovoms, kurių reikalauja šiuolaikiniai dirbtinio intelekto (AI) modeliai. Po sėkmingo HBM3E pardavimo periodo per trečią ir ketvirtą ketvirtį, tiekėjas teigia, kad pereis prie HBM4 masinių siuntimų pirmajame ketvirtyje. Pasak CTO, ankstyvieji korporaciniai klientai, gavę pirmąsias HBM4 partijas, apibūdino našumą kaip labai patenkinamą.

HBM4 vaidmuo duomenų centruose

HBM4 skirtas spręsti didžiausias pralaidumo ir vėlavimo problemas, kurios kyla AI modelių treniravimo ir inferencijos metu. Aukštos pralaidumo atmintis (HBM) padeda sumažinti duomenų judėjimą tarp atminties ir skaičiavimo elementų, kas savo ruožtu mažina energijos sąnaudas ir leidžia padidinti skaičiavimo tankį GPU ir specializuotuose akceleratoriuose. Hiperskaleriai, plečiantys AI infrastruktūrą, vertina tiek pralaidumą, tiek energijos efektyvumą — tai pagrindiniai HBM4 pardavimo varikliai.

Pakavimo ir terminės chemijos pažanga

Įmonė neapsiriboja tik didesne talpa. Ji stumia į priekį pakavimą (packaging) ir terminę chemiją. Vienas žymus pasiekimas yra hibridinis sujungimas (hybrid bonding) HBM sluoksniuose. Keisdama būdą, kaip derinami plokštės (dies), „Samsung“ praneša apie maždaug 20 % sumažėjimą terminėje varžoje 12-lapių ir 16-lapių komplektacijoms, taip pat apie ~11 % bazinio lusto temperatūros sumažėjimą laboratorijos bandymuose. Kai lustai veikia žemesnėje temperatūroje, gerėja tiek našumas, tiek patikimumas.

Hibridinio sujungimo techninės detalės

Hibridinis sujungimas optimizuoja laidų, jungčių ir tarpinių medžiagų geometriją bei chemines sąsajas tarp atminties plokščių. Tai sumažina termines kliūtis šilumos išsklaidymui ir pagerina elektrinius parametrus — trumpesni tarpai reiškia mažesnę pasipriešinimo ir induktyvumo įtaką signalams. Praktiniai laimėjimai, apie kuriuos praneša „Samsung“, rodo, kad tokios metodikos diegimas gali reikšmingai padidinti serverio lygio įrenginių stabilumą ir ilgaamžiškumą.

zHBM: vertikalios pertvarkos idėja

Dar vienas projektas, esantis brėžiniuose, vadinamas zHBM — jis pertvarko atminties plokštes palei Z ašį. Koncepcija drąsi: iki keturgubos pralaidumo padidėjimas kartu su maždaug 25 % galios suvartojimo sumažėjimu. Tai architektūrinis sprendimas, galintis pakeisti, kaip duomenų centrai suderina pervedimo spartą ir energijos biudžetą.

Kaip zHBM keičia pralaidumo ir energijos pusiausvyrą

Vertikalus plokščių išdėstymas gali sumažinti atstumus tarp buferių ir lygiagrečių kanalų, todėl signalo kelias trumpėja ir galima padidinti lygiagretų kanalų skaičių. Dėl to auga efektyvus duomenų srautas (bandwidth). Tuo pačiu, optimizuojant jungtis ir pašalinant nereikalingus perėjimus tarp sluoksnių, sumažėja energijos praradimai, leidžiant pajusti santykinį taupymą. Tačiau šios idėjos pritaikymas gamyboje reikalauja naujų surinkimo procesų ir termoreguliacijos sprendimų, kad būtų užtikrintas šiluminis patikimumas ir pakankamos išeigos (yield).

Apdorojimas atmintyje (PIM) ir integracija

Apdorojimas atmintyje (Processing-in-Memory, PIM) taip pat yra svarbi istorijos dalis. „Samsung“ eksperimentavo su pritaikytais HBM išdėstymais, kur skaičiavimo elementai yra talpinami atminties bloke. „Samsung“ teigia, kad toks artimas atminties ir logikos integravimas suteikia maždaug 2,8 karto našumo augimą nei tradicinės konfigūracijos, neprarandant galios efektyvumo.

HBM-PIM bandymai ir praktiniai pavyzdžiai

Vienas įrodymo taškų — HBM-PIM testas specialioje AMD Instinct MI100 konfigūracijoje. Tokie bandymai demonstruoja, kaip siauras atminties ir skaičiavimo elementų sujungimas gali paspartinti konkrečias darbo krūvis, ypač tas, kurios intensyviai naudoja matricas ir vektorių operacijas (pvz., ML/AI ir HPC uždaviniai). PIM koncepcija taip pat padeda sumažinti duomenų judėjimo poreikį, kuris dažnai yra našumo ir energijos vartojimo smailė didelio masto skaičiavimuose.

Rinkos ir tiekimo grandinės pasekmės

Trumpai: hiperskalerių apetitas HBM srityje yra precedento neturintis, o „Samsung“ atsako su HBM4, hybrid bonding, zHBM ir PIM — kiekviena technologija skirta didinti pralaidumą ir mažinti terminio valdymo arba energijos problemas.

Produkto leidimo datos hibridiniam sujungimui ar zHBM išlieka neaiškios. Tai yra ta istorijos dalis, kurią verta stebėti: ar šios technologijos pereis nuo laboratorijos stalų prie serverių lentynų tokiu tempu, kokio reikalauja paklausa. Ateinantys metai parodys, kurios inovacijos įgaus mastą, o kurios liks eksperimentinės.

Kainodara, tiekimas ir hiperskalerių poveikis

Hiperskalerių užsakymai tradiciškai turi dvi pasekmes: jie spartina technologijų diegimą ir kelia kainas dėl staigaus paklausos šuolio. Didėjanti HBM paklausa gali sukelti trumpalaikes tiekimo spragas, kurios verčia tiekėjus (ir jų tiekimo grandines) perskirstyti gamybos pajėgumus, optimizuoti išeigas ir spręsti medžiagų prieinamumo problemas. Tuo pačiu metu paklausos augimas skatina investicijas į naujas gamybos linijas, pakavimo įrangą ir aplinkos (šildymo, vėsinimo) infrastruktūros atnaujinimus duomenų centruose.

Technologiniai ir gamybiniai iššūkiai

Perėjimas nuo laboratorinių prototipų prie masinės gamybos apima keletą kritinių etapų: procesų stabilizavimą, išeigos (yield) gerinimą, patikimumo testavimą ilguose cikluose ir suderinamumo su esama serverių architektūra užtikrinimą. Kiekvienas naujas sluoksnis arba integracija (pvz., PIM) reikalauja naujų testavimo prietaisų bei atitikties protokolų, kad būtų išvengta masinių atšaukimų ar gedimų lauke.

Gamybos pajėgumų ir logistikos valdymas

Tam, kad HBM4 ir kiti pažangūs produktai patektų laiku, gamintojams reikia koordinuoti gamybos pajėgumus tarp wafer gamybos, pažangių pakavimo linijų ir aukštos klasės testavimo įrangos. Logistika taip pat apima specializuotų medžiagų (pvz., naujų jungčių, klijų ir šilumos laidininkų) tiekimą ir kvalifikuotus tiekėjus, galinčius užtikrinti kokybę ir stabilų tiekimą.

Energetika, aušinimas ir serverių dizainas

Didinant atminties pralaidumą ir tankį, kyla ir šiluminiai reikalavimai. Efektyvūs aušinimo sprendimai — nuo optimizuotų šiluminių tarpininkų, per „liquid cooling“ sistemas iki pažangių ventiliacijos konfigūracijų — taps svarbesni. Hibridinis sujungimas ir zHBM gali sumažinti kai kurias šiluminio valdymo kliūtis, tačiau diegiant didesnės talpos HBM4 ar PIM sprendimus reikės peržiūrėti serverių lygio terminius sprendimus.

Praktinės aušinimo strategijos

  • Pasirinkti skysčių aušinimo sprendimus didelio tankio serveriams;
  • Įdiegti pažangius terminius terpinius sluoksnius ir medžiagas su geresne šilumine laidumu;
  • Naudoti dinaminį veikimo dažnio ir įtampos reguliavimą energijos taupymui ir šilumos valdymui;
  • Optimizuoti duomenų centro fizinę architektūrą siekiant efektyvaus oro arba skysčio cirkuliavimo.

Kas laimės šiame pasikeitime?

Atminties rinka greičiausiai pereis į nuolatinį sprintą. Klausimas — kas sugebės išlaikyti tempą: pažangios gamybos pajėgos, gilios investicijos į R&D, ar greitos pritaikymo galimybės duomenų centrų infrastruktūroje. Dideli tiekėjai, turintys švarias gamybos linijas ir plėtrai pritaikytą tiekimo grandinę, turi aiškų pranašumą, tačiau startuoliai su novatoriškais pakavimo arba architektūriniais sprendimais taip pat gali iššauti į priekį.

Strateginės pasekmės klientams

Hiperskaleriams ir rimtiems debesų paslaugų tiekėjams teks planuoti ilgalaikę strategiją: derinti investicijas į naujus akceleratorius, atnaujinti serverių aušinimą, sutarti išankstiniuose tiekimo susitarimuose (pre-buy contracts) ir vertinti energetinį poveikį duomenų centruose. Mažesniems paslaugų teikėjams gali tekti lanksčiau pasirinkti tarp tradicinių DRAM ir HBM sprendimų, atsižvelgiant į kainą, prieinamumą ir našumo poreikius.

Išvados ir perspektyvos

Nesvarbu, ar HBM4, hibridinis sujungimas, zHBM ar PIM technologijos taps dominuojančiomis — aišku viena: atminties rinka pasiruošusi ilgalaikiam augimo periodui. Įmonės, kurios sugebės laiku pervesti laboratorinius pasiekimus į patikimą masinę gamybą ir pasiūlyti visapusiškus serverių sprendimus (įskaitant aušinimą ir energijos valdymą), laimės konkurencinį pranašumą. Kitų metų stebėjimo taškai yra leidimų laikotarpiai, išeigos (yield) gerinimas ir tai, kaip sparčiai hiperskalerių poreikiai pavers eksperimentus pramoniniais sprendimais.

Vis dėlto vienas dalykas aiškus: atminties rinka ruošiasi ilgai trunkančiam sprintui. Kas susigaudys ir kas lieka užnugaryje — pamatysime greitai.

Šaltinis: gsmarena

„Technologijos visada mane žavėjo – nuo išmaniųjų telefonų iki dirbtinio intelekto proveržių. Džiaugiuosi galėdama dalintis naujienomis su jumis kiekvieną dieną.“

Palikite komentarą

Komentarai