Memories.ai: Creación de memoria visual de IA para dispositivos portátiles y robótica

11

Memories.ai es pionero en el desarrollo de una “capa de memoria visual” para la inteligencia artificial, centrándose en permitir que los sistemas de inteligencia artificial recuerden y recuperen datos visuales, una capacidad que actualmente falta en la mayoría de las aplicaciones del mundo físico. La empresa, fundada por Shawn Shen y Ben Zhou, aborda una brecha crítica en el desarrollo de la IA: la capacidad de las máquinas de aprender de experiencias visuales pasadas y actuar sobre ellas.

La necesidad de la memoria visual

Actualmente, la IA sobresale en el ámbito digital, pero tiene dificultades para aplicar las experiencias aprendidas a escenarios del mundo real. Esto se debe a que la mayoría de los avances de la IA dan prioridad a la memoria basada en texto, que es más fácil de estructurar e indexar que los datos visuales. El mundo físico funciona según la vista, y la IA que opera en este dominio requiere una forma de retener y recordar información visual. Aquí es donde interviene Memories.ai.

Los fundadores reconocieron esta necesidad mientras trabajaban en las gafas inteligentes Ray-Ban de Meta. Observaron que si los usuarios no podían recordar de manera confiable los datos visuales registrados, la utilidad de las gafas era limitada. Esto los llevó a dejar Meta y establecer Memories.ai en 2024, recaudando 16 millones de dólares en financiación inicial hasta la fecha.

Asociación con Nvidia

Memories.ai está colaborando con Nvidia, aprovechando herramientas como Cosmos-Reason 2 (un modelo de lenguaje de visión) y Nvidia Metropolis (una aplicación de búsqueda de videos) para acelerar su tecnología de memoria visual. Esta asociación destaca el creciente interés de la industria en la IA que puede “ver” y recordar. La decisión de combinar su trabajo con la infraestructura de Nvidia sugiere la creencia de que el futuro de la IA dependerá en gran medida del procesamiento visual de alto rendimiento.

Recopilación de datos y desarrollo de modelos

Un desafío clave en la construcción de la memoria visual es incrustar e indexar de manera efectiva datos de video para su almacenamiento y recuperación. Memories.ai desarrolló su propio modelo de memoria visual grande (LVMM) en julio de 2025, comparable al Gemini Embedding 2 de Google pero diseñado para información visual. Para entrenar este modelo, la compañía creó LUCI, un dispositivo de hardware patentado que usan los recolectores de datos para capturar imágenes de entrenamiento. La decisión de crear hardware personalizado demuestra las limitaciones de la tecnología de grabación de video existente para satisfacer las necesidades de capacitación en IA.

Perspectivas futuras

Memories.ai ya está trabajando con importantes empresas de dispositivos portátiles (aunque las identidades siguen sin revelarse) y se ha asociado con Qualcomm para ejecutar sus modelos en procesadores Snapdragon. La empresa sigue centrada en el modelo y la infraestructura subyacentes en lugar de convertirse en un fabricante de hardware.

“Estamos más centrados en el modelo y la infraestructura, porque en última instancia creemos que el mercado de los wearables y la robótica llegará, pero probablemente no será ahora”, dice Shen.

Esto sugiere una visión a largo plazo en la que la memoria visual se convierte en una capa fundamental para aplicaciones más amplias de IA en robótica y realidad aumentada. El enfoque de la empresa se centra menos en productos de consumo inmediato y más en desarrollar la tecnología central que impulsará la próxima generación de dispositivos inteligentes.

El desarrollo de la memoria visual de la IA aún se encuentra en sus primeras etapas, pero el trabajo de Memories.ai marca un paso fundamental hacia máquinas que realmente puedan “ver” y aprender del mundo físico.