Microsoft didina vidinių dirbtinio intelekto modelių mokymą

Microsoft didina vidinių dirbtinio intelekto modelių mokymą

0 Komentarai Jokūbas Žilinskas

3 Minutės

Microsoft didina vidinių dirbtinio intelekto modelių mokymą

Microsoft žengė aiškų žingsnį link savo pačios pažangių DI modelių kūrimo, paskelbusi dideles investicijas į skaičiavimo pajėgumus, reikalingus modelių mokymo mastui plėsti. Microsoft AI pirmieji vidiniai modeliai buvo neseniai pristatyti, tačiau vadovybė teigia, kad šie pradiniai bandymai yra tik pradžia, kai įmonė ruošiasi plėsti savo vietinius ir debesijos mokymo klasterius.

Vadovybės kryptis ir strategija

Microsoft AI vadovas Mustafa Suleyman darbuotojams sakė, kad įmonė ketina valdyti gebėjimą mokyti pasaulinio lygio modelius įvairaus dydžio, pragmatiškai pasinaudodama išoriniais modeliais, kai tai tinka. Jis pažymėjo, kad MAI-1-preview buvo apmokytas maždaug 15 000 H100 GPU, santykinai mažame klasteryje, palyginti su tolesnėmis ambicijomis. Suleyman pridūrė, kad Microsoft siekia sukurti klasterius šešis–dešimt kartų didesnius, kad konkuruotų su didžiausiais Meta, Google ir xAI pastangų lygmenimis.

Microsoft generalinis direktorius Satya Nadella sustiprino vidinių modelių gebėjimo siekį, pabrėždamas tikslą kurti produktus, orientuotus į modelius. Jis taip pat išryškino daugelio modelių požiūrį produkto integracijai ir pateikė GitHub Copilot kaip pavyzdį, kai kelių šaltinių modelių derinys suteikia gerą kūrėjų patirtį.

Produkto funkcijos ir integracijos

Įmonė planuoja įtraukti savo pagrindinius ir pažangius modelius į produktų linijas, taip pat integruoti partnerių modelius, kai jie suteikia pranašumų. Pranešama, kad Microsoft 365 Copilot netrukus bus iš dalies varomas Anthropic modelių, nes vidiniai etalonai nustatė, kad Anthropic gerai atliko Excel ir PowerPoint užduotis. Šis hibridinis požiūris siekia pagerinti produktyvumo funkcijas, kontekstą atitinkančią pagalbą ir įmonių saugumą.

Palyginimas ir privalumai

Didesni vidiniai mokymo klasteriai suteikia Microsoft geresnę kontrolę modelių architektūros, smulkiosios derinimo, duomenų valdymo ir delsos klausimais verslo klientams. Palyginti su visišku pasikliovimu trečiųjų šalių modeliais, nuosava mokymo infrastruktūra gali sumažinti priklausomybės riziką ir optimizuoti Microsoft konkretiems produktų darbo srautams.

Pritaikymo atvejai ir rinkos reikšmė

Išplėstas mokymo pajėgumas palaiko pažangius pritaikymo atvejus, tokius kaip didelio masto dokumentų supratimas, realaus laiko programavimo pagalba, verslo lygio Copilot funkcijos ir pritaikyti modeliai vertikalioms pramonėms. Konkurencingoje rinkoje, kur svarbus skaičiavimo mastas ir modelių įvairovė, Microsoft investicijos signalizuoja strateginį statymą į vidinių modelių, partnerių modelių, tokių kaip Anthropic ir OpenAI, bei hibridinio diegimo derinį, siekiant pasiūlyti išskirtines DI patirtis.

Šaltinis: theverge

Esu Jokūbas – aistringas dirbtinio intelekto ir žaidimų pasaulio tyrinėtojas. Digin.lt dalinuosi naujienomis ir analizėmis, kurios padeda suprasti technologijų ateitį.

Komentarai

Palikite komentarą