Memories.ai є піонером у розробці «візуального шару пам’яті» для штучного інтелекту, приділяючи особливу увагу можливості ІІ-систем запам’ятовувати та відтворювати візуальні дані – здатність, якої нині не вистачає більшості додатків у реальному світі. Компанія, заснована Шоном Шеном та Беном Чжоу, вирішує критичну проблему у розвитку ІІ: здатність машин навчатися на минулому візуальному досвіді та діяти на його основі.
Необхідність візуальної пам’яті
В даний час ІІ процвітає в цифровій сфері, але насилу застосовує отриманий досвід до реальних сценаріїв. Це пов’язано з тим, що більшість досягнень в області ІІ віддають пріоритет текстової пам’яті, яку легше структурувати та індексувати, ніж візуальні дані. Фізичний світ функціонує за рахунок зору, і ІІ, що працює в цій галузі, вимагає способу збереження та відтворення візуальної інформації. Саме тут набуває чинності Memories.ai.
Засновники усвідомили цю потребу, працюючи над розумними окулярами Ray-Ban від Meta. Вони помітили, що якщо користувачі не можуть надійно відтворювати записані візуальні дані, корисність окулярів обмежена. Це спонукало їх залишити Meta і заснувати Memories.ai у 2024 році, зібравши на сьогоднішній день 16 мільйонів доларів посівного фінансування.
Партнерство з Nvidia
Memories.ai співпрацює з Nvidia, використовуючи такі інструменти, як Cosmos-Reason 2 (модель комп’ютерного зору та мови) та Nvidia Metropolis (додаток для пошуку відео), щоб прискорити свою технологію візуальної пам’яті. Це партнерство підкреслює зростаючий інтерес галузі до ІІ, який може «бачити» та запам’ятовувати. Рішення об’єднати свою роботу з інфраструктурою Nvidia вказує на переконання, що майбутнє ІІ значною мірою залежатиме від високопродуктивної візуальної обробки.
Збір даних та розробка моделі
Ключовим завданням при створенні візуальної пам’яті є ефективне впровадження та індексування відео для зберігання та відтворення. Memories.ai розробила свою власну велику модель візуальної пам’яті (LVMM) у липні 2025 року, порівнянну з Google Gemini Embedding 2, але адаптовану для візуальної інформації. Для навчання цієї моделі компанія створила LUCI, запатентований апаратний пристрій, який носить збірники даних для запису навчальних кадрів. Рішення про створення власного обладнання демонструє обмеження існуючих технологій запису відео в задоволенні потреб навчання ІІ.
Майбутні перспективи
Memories.ai вже працює з великими компаніями, що виробляють пристрої (особистості яких залишаються нерозкритими), і уклала партнерство з Qualcomm для запуску своїх моделей на процесорах Snapdragon. Компанія, як і раніше, зосереджена на основній моделі та інфраструктурі, а не на тому, щоб стати виробником обладнання.
«Ми більше зосереджені на моделі та інфраструктурі, тому що в кінцевому підсумку ми думаємо, що ринок пристроїв, що носяться, і робототехніки прийде, але, ймовірно, зараз цього не станеться», — каже Шен.
Це передбачає довгострокове бачення, в якому візуальна пам’ять стане основою для ширших додатків ІІ у робототехніці та доповненій реальності. Підхід компанії полягає не в негайних споживчих продуктах, а у створенні основної технології, яка матиме наступне покоління інтелектуальних пристроїв.
Розробка ІІ-візуальної пам’яті знаходиться на ранній стадії, але робота Memories.ai є критичним кроком до машин, які можуть справді «бачити» та навчатися на фізичному світі.
