Memories.ai: Vytváření vizuální paměti pro AI v Wearables a robotice

13

Memories.ai je průkopníkem ve vývoji „vrstvy vizuální paměti“ pro umělou inteligenci se zaměřením na schopnost systémů umělé inteligence pamatovat si a vyvolávat vizuální data – což je schopnost, kterou většina aplikací v reálném světě v současnosti postrádá. Společnost, kterou založili Sean Shen a Ben Zhou, řeší zásadní problém ve vývoji umělé inteligence: schopnost strojů učit se z minulých vizuálních zkušeností a jednat podle nich.

Požadavek na vizuální paměť

Umělá inteligence v současné době vyniká v digitální sféře, ale má problém aplikovat své poznatky na scénáře reálného světa. Důvodem je to, že většina pokroků v AI upřednostňuje textovou paměť, která se snadněji strukturuje a indexuje než vizuální data. Fyzický svět funguje prostřednictvím vidění a umělá inteligence pracující v této oblasti vyžaduje způsob, jak ukládat a reprodukovat vizuální informace. Zde vstupuje do hry Memories.ai.

Zakladatelé tuto potřebu rozpoznali při práci na chytrých brýlích Ray-Ban společnosti Meta. Zjistili, že pokud uživatelé nemohou spolehlivě reprodukovat zaznamenaná vizuální data, je užitečnost brýlí omezená. To je přimělo opustit Meta a v roce 2024 založili Memories.ai, čímž k dnešnímu dni získali počáteční financování ve výši 16 milionů $.

Partnerství se společností Nvidia

Memories.ai spolupracuje se společností Nvidia a využívá nástroje jako Cosmos-Reason 2 (model počítačového vidění a jazyka) a Nvidia Metropolis (aplikace pro vyhledávání videa) k urychlení technologie vizuální paměti. Toto partnerství zdůrazňuje rostoucí zájem odvětví o umělou inteligenci, která dokáže „vidět“ a pamatovat si. Rozhodnutí spojit svou práci s infrastrukturou Nvidie naznačuje přesvědčení, že budoucnost umělé inteligence bude do značné míry záviset na vysoce výkonném vizuálním zpracování.

Sběr dat a vývoj modelů

Klíčovou výzvou při vytváření vizuální paměti je efektivní vkládání a indexování video dat pro ukládání a přehrávání. Memories.ai v červenci 2025 vyvinul svůj vlastní Large Visual Memory Model (LVMM), srovnatelný s Google Gemini Embedding 2, ale přizpůsobený pro vizuální informace. K trénování tohoto modelu společnost vytvořila LUCI, proprietární hardwarové zařízení, které nosí sběrači dat k záznamu tréninkových snímků. Rozhodnutí postavit vlastní hardware demonstruje omezení současných technologií nahrávání videa při plnění potřeb školení AI.

Vyhlídky do budoucna

Memories.ai již spolupracuje s velkými nositelnými společnostmi (jejichž identita zůstává nezveřejněna) a uzavřela partnerství s Qualcomm na uvedení svých modelů s procesory Snapdragon. Společnost zůstává zaměřena spíše na svůj základní model a infrastrukturu, než aby se stala OEM.

„Zaměřujeme se více na model a infrastrukturu, protože si myslíme, že nakonec přijde trh s nositelnými zařízeními a robotikou, ale pravděpodobně se tak nestane nyní,“ říká Shen.

To naznačuje dlouhodobou vizi, ve které se vizuální paměť stane základem pro širší aplikace umělé inteligence v robotice a rozšířené realitě. Přístup společnosti není o produktech pro okamžité spotřebitele, ale o vytvoření základní technologie, která bude pohánět další generaci chytrých zařízení.

Vývoj vizuální paměti AI je v raných fázích, ale práce Memories.ai je kritickým krokem směrem ke strojům, které skutečně „vidí“ a učí se z fyzického světa.