Kova dėl įkūnyto intelekto: Wall-OSS ir Quanta X2 atveria naują robotikos etapą

Kova dėl įkūnyto intelekto: Wall-OSS ir Quanta X2 atveria naują robotikos etapą

0 Komentarai Viltė Petrauskaitė

4 Minutės

Kova dėl įkūnyto intelekto

Įkūnytas intelektas — robotai, kurie derina fizinius veiksmus su pažangiu suvokimu, samprotavimu ir sprendimų priėmimu — juda iš laboratorinių demonstracijų į intensyvų komercinį lauką. Kol tokios įmonės kaip Tesla, Boston Dynamics ir NVIDIA renkasi uždarus, nuosavybės sprendimus, naujas Kinijos pretendentas X Square Robot siūlo atviro kodo fondinį modelį Wall-OSS, siekiantį padaryti robotus patikimai prisitaikančius prie nenuspėjamų realaus pasaulio sąlygų.

Pramonės padėtis

Teslos humanoidinė platforma Optimus žada masinę gamybą ir vartotojams skirtas taikymas, o Elon Muskas iškėlė ambicingus gamybos tikslus. Boston Dynamics Atlas demonstruoja dinamišką lokomociją ir manipuliavimą parengtuose scenarijuose. NVIDIA robotiką traktuoja per programinės įrangos prizmę — Isaac ir GR00T siūlo simuliacijas ir fondinius modelius, kurie veikia kaip robotinių platformų „smegenys“. Vis dėlto išlieka akivaizdi spraga tarp efektingų demonstracijų ir patikimos kasdienės veiklos.

Pristatomas Wall-OSS ir Quanta X2

X Square Robot pristato Wall-OSS kaip pirmą Kinijos fondinį modelį įkūnytam intelektui, atvirai paskelbtą GitHub ir Hugging Face platformose. Norėdama parodyti modelio veikimą, kompanija atskleidė Quanta X2: ratinį aptarnavimo robotą su 7 laisvių laipsnių ranka, vikria ranka, gebančia imituoti gyvus gestus, iki 62 laisvių laipsnių natūraliam judesiui ir sukimosi apkabomis, skirtomis 360° valymui. Kartu jie demonstruoja atviro kodo programinės įrangos rinkinį, suderintą su praktiška įranga.

Pagrindinės produkto savybės

  • Bendrintas dėmesio mechanizmas: selektyviai susitelkia į svarbius jutiminius signalus, pagreitindamas sprendimų priėmimą ir mažindamas klaidas.
  • Užduotimis maršrutuojami priekinio sklidimo tinklai (FFN): atskiros apdorojimo grandinės regai, kalbai ir judesiui, kad būtų išvengta vienos grandies architektūros sukeltų perkrovų.
  • Minčių grandinės (CoT) samprotavimas: vidinis daugiapakopis planavimas prieš vykdymą, mažinantis reaktyvias klaidas sudėtingose užduotyse.
  • Didelio masto multimodalinė mokymo bazė: milijardai regos‑kalbos‑veiksmų pavyzdžių, gautų iš robotų žurnalų, generuojamo vaizdo ir sintetinių aplinkų.

Kaip Wall-OSS skiriasi techniškai

Skirtingai nei tradicinės sistemos, kurios sutelkia visus įėjimus per vieną sluoksnį, Wall-OSS nukreipia multimodalius duomenis į specializuotus kanalus. Vizualinės įvestys naudojasi optimizuotais kanalais objektų atpažinimui ir erdviniam žemėlapiui; lingvistinės komandos yra analizuojamos atskirai; judesių planavimas atsižvelgia į fizinius apribojimus ir realaus laiko grįžtamąją informaciją. Kartu su CoT samprotavimu tai leidžia atlikti kontekstinius veiksmus — pavyzdžiui, vykdyti daugiapakopę „nuvalyk stalą“ rutiną vietoje atskirų užduočių traktavimo.

Palyginimas ir privalumai

Palyginti su Tesla Optimus ir Boston Dynamics Atlas, Wall-OSS teikia prioritetą prisitaikymui, o ne efektingiems pasirodymams. NVIDIA Isaac ir GR00T suteikia galingus kūrėjų įrankius ir simuliacines ekosistemas, tačiau Wall-OSS pozicionuojamas kaip atviras, diegiamas fondinis modelis, kurį aparatūros gamintojai ir startuoliai gali integruoti iš karto. Privalumai apima greitesnį reakcijos laiką, mažiau neteisingai prioritetizuotų komandų, geresnį veikimą užgrūstose ar naujose aplinkose ir bendruomenės pranašumus, kuriuos suteikia atvirasis kodas.

Praktiniai naudojimo atvejai

  • Aptarnavimas ir svetingumas: stalų tvarkymas, tiekimo pristatymas, automatizuotas valymas.
  • Sandėliavimas ir logistika: dinaminis krovinių sudėliojimas, paketų tvarkymas, maršrutų prisitaikymas.
  • Sveikatos priežiūros palaikymas: instrumentų paruošimas, nekritiniai priežiūros darbai, sterilių procedūrų valdymas.
  • Vartotojų ir namų robotika: prisitaikantys namų asistentai, kurie toleruoja įvairias namų išdėstymo ir objektų ypatybes.

Rinkos reikšmė ir perspektyvos

Turėdama maždaug 100 mln. JAV dolerių finansavimą, X Square Robot tiki, kad atviro kodo fondinis modelis gali užpildyti spragą tarp choreografuotų demonstracijų ir patikimos, praktiškos robotikos. Jei Wall-OSS sulauks priėmimo GitHub ir Hugging Face bendruomenėse, jis galėtų pakeisti konkurencinį kraštovaizdį, suteikdamas generalizuojamą intelekto sluoksnį įvairioms aparatūros platformoms ir pagreitindamas produktų kūrimą tiek startuoliams, tiek užtikrintiems gamintojams.

Rizikos ir tolesni žingsniai

Atviro kodo išleidimas skatina greitą iteraciją, bet taip pat kelia iššūkių dėl saugos, kokybės kontrolės ir standartų. Realus diegimas reikalauja griežto patikrinimo, reglamentų suderinimo ir nuolatinio tobulinimo įkūnytame intelekte, multimodaliniame samprotavime ir patikimame suvokime. Vis dėlto Wall-OSS ir Quanta X2 žymi reikšmingą poslinkį: varžybos vis labiau sukasi apie praktinį patikimumą, mastelinius fondinius modelius ir bendradarbiavimo inovacijas robotikoje.

Šaltinis: gizmochina

Sveiki! Esu Viltė, kasdien sekanti technologijų naujienas iš viso pasaulio. Mano darbas – pateikti jums svarbiausius ir įdomiausius IT pasaulio įvykius aiškiai ir glaustai.

Komentarai

Palikite komentarą