2 Minutės
DeepSeek pristato DeepSeek-R1-0528 su patobulintais loginiais gebėjimais
Pirmaujanti Kinijos dirbtinio intelekto (DI) bendrovė DeepSeek paskelbė apie reikšmingą atvirųjų šaltinių didžiųjų kalbos modelių (LLM) plėtros etapą – pristatytas naujasis DeepSeek-R1-0528 modelis. Šis DI modelis demonstruoja gerokai išaugusį našumą matematinio mąstymo, mokslinių užduočių sprendimo ir programavimo srityse, todėl aiškiai artėja prie tokių rinkos lyderių kaip OpenAI o3 ir Google Gemini 2.5 Pro.
Pagrindinės savybės ir techniniai patobulinimai
Remiantis Hugging Face platformoje pateiktais duomenimis, DeepSeek-R1-0528 pasiekė geresnių rezultatų pasinaudojus didesniais skaičiavimo resursais ir pažangesniais post-mokymo algoritmais. Tai lėmė išskirtinius rezultatus pagrindinėse testavimo srityse: • AIME 2025 matematikos testas: Modelio tikslumas išaugo nuo 70% iki net 87,5%. • LiveCodeBench programavimo testas: DeepSeek-R1-0528 savo rezultatus pagerino nuo 63,5% iki 73,3%. • Humanity’s Last Exam: Tikslumas išaugo nuo 8,5% iki 17,7% šiame sudėtingame vertinime.
Našumo palyginimas: iššūkis OpenAI o3 ir Gemini 2.5 Pro
Šie testų rezultatai patvirtina, kad DeepSeek-R1-0528 yra rimtas konkurentas pagrindiniams rinkos žaidėjams OpenAI o3 ir Gemini 2.5 Pro – ypač srityse, kur reikalingas gilus loginis mąstymas ir pažangios AI galimybės. Surinkdamas beveik aukščiausius rezultatus matematikoje ir programavime, DeepSeek tampa matomu žaidėju pasaulinėje dirbtinio intelekto rinkoje.

Kompaktiška modelio versija lankstiems diegimams
Kartu su pagrindiniu modeliu, DeepSeek pristatė ir lengvesnę DeepSeek-R1-0528-Qwen3-8B versiją. Šis 8 milijardų parametrų AI modelis specialiai kurtas mažiau galingai aparatūrai ir, pasak kūrėjų, lenkia Qwen3-8B bei prilygsta Qwen3-235B-thinking galimybėms, reikalaujant tik 16 GB GPU atminties FP16 režimu. Tai daro pažangias DI technologijas prieinamas kūrėjams ir organizacijoms su ribotais resursais.
Atvirojo kodo įsipareigojimas ir prieinamumas kūrėjams
Tęsdama atviros inovacijos politiką, DeepSeek abi naujas DI modelio versijas išleido su MIT licencija, skirtą tiek tyrimams, tiek komerciniam panaudojimui. Pilni modeliai pasiekiami Hugging Face platformoje, o papildoma dokumentacija susiekiama per GitHub ir DeepSeek API, todėl dirbtinio intelekto kūrėjams integracija ir plėtra tampa sklandi. Esami DeepSeek API naudotojai bus automatiškai atnaujinti į naujausią versiją.
Bendruomenės atsiliepimai ir rinkos poveikis
DeepSeek-R1-0528 pristatymas sukėlė daug teigiamo susidomėjimo technologijų bendruomenėje ir socialiniuose tinkluose. Programuotojų bendruomenės nuomonės lyderiai ypač išskyrė šio modelio programavimo pajėgumus ir įvardijo jį kaip rimtą iššūkį OpenAI o3. Augant AI modelių diegimo prieinamumui, DeepSeek inovacijos tempas ir atvirų šaltinių filosofija keičia konkurencinį peizažą.
Panaudojimo atvejai ir svarba pramonei
Su išplėtotomis loginėmis gebėjimais matematikoje, moksle ir kodo generavime DeepSeek-R1-0528 puikiai tinka švietimo technologijų sektoriui, pažangiems tyrimams, duomenų mokslui ir įmonių automatizavimui. Aukšti rezultatai įvairiuose testuose daro šį modelį patraukliu pasirinkimu organizacijoms, siekiančioms pažangių DI sprendimų ir didelio lankstumo.

Komentarai