Memories.ai jest pionierem w opracowywaniu „warstwy pamięci wizualnej” dla sztucznej inteligencji, koncentrując się na zdolności systemów sztucznej inteligencji do zapamiętywania i przywoływania danych wizualnych – czyli zdolności, której obecnie brakuje większości aplikacji w świecie rzeczywistym. Firma założona przez Seana Shena i Bena Zhou rozwiązuje kluczowy problem w rozwoju sztucznej inteligencji: zdolność maszyn do uczenia się i działania na podstawie przeszłych doświadczeń wizualnych.
Wymóg pamięci wzrokowej
Sztuczna inteligencja obecnie przoduje w dziedzinie cyfrowej, ale ma trudności z zastosowaniem zdobytej wiedzy w rzeczywistych scenariuszach. Dzieje się tak dlatego, że większość postępów w sztucznej inteligencji nadaje priorytet pamięci tekstowej, którą łatwiej jest uporządkować i indeksować niż dane wizualne. Świat fizyczny funkcjonuje poprzez widzenie, a sztuczna inteligencja działająca w tej dziedzinie wymaga sposobu przechowywania i odtwarzania informacji wizualnych. Tutaj w grę wchodzi Memories.ai.
Założyciele dostrzegli tę potrzebę podczas pracy nad inteligentnymi okularami Ray-Ban firmy Meta. Zaobserwowali, że jeśli użytkownicy nie mogą wiarygodnie odtworzyć zarejestrowanych danych wizualnych, użyteczność okularów jest ograniczona. To skłoniło ich do opuszczenia Meta i założenia Memories.ai w 2024 r., gromadząc do tej pory 16 milionów dolarów w postaci funduszy zalążkowych.
Partnerstwo z Nvidią
Memories.ai współpracuje z firmą Nvidia, korzystając z narzędzi takich jak Cosmos-Reason 2 (model obrazu komputerowego i języka) oraz Nvidia Metropolis (aplikacja do wyszukiwania wideo), aby przyspieszyć technologię pamięci wizualnej. To partnerstwo podkreśla rosnące zainteresowanie branży sztuczną inteligencją, która potrafi „widzieć” i zapamiętywać. Decyzja o połączeniu jej pracy z infrastrukturą Nvidii wskazuje na przekonanie, że przyszłość sztucznej inteligencji będzie w dużej mierze zależeć od wysokowydajnego przetwarzania wizualnego.
Gromadzenie danych i rozwój modelu
Kluczowym wyzwaniem w tworzeniu pamięci wizualnej jest wydajne osadzanie i indeksowanie danych wideo w celu ich przechowywania i odtwarzania. W lipcu 2025 r. firma Memories.ai opracowała własny model dużej pamięci wizualnej (LVMM), porównywalny z Google Gemini Embedding 2, ale dostosowany pod kątem informacji wizualnych. Aby trenować ten model, firma stworzyła LUCI, autorskie urządzenie sprzętowe noszone przez osoby zbierające dane w celu rejestrowania ramek szkoleniowych. Decyzja o budowie niestandardowego sprzętu pokazuje ograniczenia obecnych technologii nagrywania wideo w zaspokajaniu potrzeb szkoleń AI.
Perspektywy na przyszłość
Memories.ai współpracuje już z głównymi producentami urządzeń do noszenia (których tożsamość pozostaje nieujawniona) i nawiązała współpracę z Qualcomm przy wprowadzaniu na rynek swoich modeli z procesorami Snapdragon. Firma w dalszym ciągu koncentruje się na swoim podstawowym modelu i infrastrukturze, zamiast stać się producentem OEM.
„Bardziej skupiamy się na modelu i infrastrukturze, ponieważ uważamy, że ostatecznie pojawi się rynek urządzeń do noszenia i robotyki, ale prawdopodobnie nie stanie się to teraz” – mówi Shen.
Sugeruje to długoterminową wizję, w której pamięć wzrokowa stanie się podstawą szerszych zastosowań sztucznej inteligencji w robotyce i rzeczywistości rozszerzonej. Podejście firmy nie dotyczy bezpośrednich produktów konsumenckich, ale stworzenia podstawowej technologii, która będzie zasilać następną generację inteligentnych urządzeń.
Rozwój pamięci wizualnej AI jest na wczesnym etapie, ale prace Memories.ai to krytyczny krok w kierunku maszyn, które naprawdę potrafią „widzieć” świat fizyczny i uczyć się na jego podstawie.
