DeepSeek-V4 Preview: 1 mln žetonų ir nauji modeliai

DeepSeek-V4 Preview: 1 mln žetonų ir nauji modeliai

Jokūbas Žilinskas Jokūbas Žilinskas . Komentarai

3 Minutės

„DeepSeek“ pristatė „DeepSeek-V4 Preview“, o skaičiai sunkiai palieka abejingų. Kinijos dirbtinio intelekto bendrovė dabar siūlo du naujus modelius - V4 Pro ir V4 Flash, abu sukurti 1 milijono žetonų konteksto langams, o tai yra rodiklis, išryškinantis ilgų dokumentų apdorojimą, kodo analizę ir sudėtingą samprotavimą.

Šiuos modelius jau galima naudoti per „DeepSeek“ svetainę „Instant Mode“ ir „Expert Mode“ režimuose, o API taip pat atnaujinta ir šiandien veikia. Rinkoje, kur konteksto ilgis tapo viena aršiausių DI kovos aikštelių, „DeepSeek“ daro labai tiesioginį ėjimą: siūlo rimtas galimybes be premium kainos etiketės.

Du modeliai, vienas labai didelis pažadas

Popieriuje skirtumas tarp šių dviejų variantų yra akivaizdus. „DeepSeek-V4 Pro“ turi 1,6 trilijono bendrų parametrų ir 49 milijardus aktyvių parametrų, o V4 Flash yra lengvesnis - 284 milijardai bendrų parametrų ir 13 milijardų aktyvių parametrų. Abu palaiko tą patį milžinišką 1M konteksto ilgį, tačiau akivaizdu, kad jie skirti skirtingiems naudotojams ir biudžetams.

„DeepSeek“ teigia, kad Pro modelis yra sunkiasvoris šios šeimos narys. Jis sukurtas su stipresnėmis agentinėmis galimybėmis, platesnėmis pasaulio žiniomis ir pažangiu samprotavimu, kuris, bendrovės teigimu, lenkia dabartinius atvirojo kodo modelius matematikos, STEM ir programavimo srityse. „DeepSeek“ taip pat teigia, kad Pro yra konkurencingas su geriausiomis uždaromis sistemomis, nors ir pažymi, kad kai kuriose srityse jis vis dar atsilieka nuo „Gemini 3.1 Pro“.

Tuo tarpu Flash yra labiau orientuotas į vertę. „DeepSeek“ jį apibūdina kaip modelį, kurio samprotavimas beveik prilygsta Pro, o atliekant paprastesnes agentines užduotis jis pasiekia tokį pat rezultatą kaip Pro. Tikrasis pranašumas yra kaina. Flash pozicionuojamas kaip prieinamesnis pasirinkimas kūrėjams, kurie nori ilgo konteksto DI, bet nenori greitai išnaudoti biudžeto.

Kainodara atspindi šią strategiją. Flash įvesties kainos prasideda nuo 0,028 USD su talpyklos hitu ir 0,14 USD su talpyklos praleidimu, o išvestis kainuoja 0,28 USD. Pro yra gerokai brangesnis: įvestis kainuoja 0,145 USD arba 1,74 USD, priklausomai nuo talpyklos būsenos, o išvestis kainuoja 3,48 USD.

Naudotojams, kurie nori išbandyti modelius iš karto, „DeepSeek“ suteikė prieigą adresu chat.deepseek.com. Bendrovė taip pat teigia, kad prieinami ir atvirojo svorio modeliai, kartu su technine ataskaita visiems, kurie nori gilintis į architektūrą, testų rezultatus ir mokymo detales.

Tai drąsus pristatymas, kuris vėl pastūmėja ilgo konteksto temą į priekį. „DeepSeek“ ne tik siekia antraštes kuriančių skaičių. Ji bando įrodyti, kad milžiniški DI modeliai vis dar gali būti praktiški, prieinami ir įperkami.

Esu Jokūbas – aistringas dirbtinio intelekto ir žaidimų pasaulio tyrinėtojas. Digin.lt dalinuosi naujienomis ir analizėmis, kurios padeda suprasti technologijų ateitį.

Palikite komentarą

Komentarai