Meta lanza SAM 3: el nuevo modelo capaz de encontrar y seguir “casi cualquier cosa” en imágenes y vídeo

Meta ha anunciado el lanzamiento en abierto de SAM 3 (Segment Anything Model 3), la evolución más avanzada de su familia de modelos de segmentación.

Este modelo redefine la forma de identificar y rastrear objetos en imágenes y vídeo: ahora basta un simple prompt de texto o una imagen de ejemplo para que el sistema localice todas las instancias que encajan con esa descripción.

A diferencia de las versiones anteriores, que necesitaban clics o cajas para delimitar objetos, SAM 3 entiende lenguaje natural, lo que permite instrucciones como “personas con mochila”, “coches rojos” o “bicicletas a la derecha”.

El modelo mantiene además una coherencia temporal estable, permitiendo seguir objetos en movimiento aunque cambie el plano o la iluminación.

SAM 3

Qué hace diferente a SAM 3

🔹 Segmentación guiada por texto o imágenes

Puedes describir qué quieres encontrar o subir una imagen de referencia. SAM 3 identifica todas las coincidencias automáticamente.

🔹 Seguimiento en vídeo

Genera máscaras consistentes entre fotogramas, algo esencial en entornos dinámicos.

🔹 Detección + Tracking en un único sistema

Un solo modelo realiza ambas tareas, simplificando pipelines de visión artificial.

🔹 Open source completo

Meta liberó el código y los pesos, facilitando investigación, despliegues e integraciones empresariales.

SAM 3

Casos de uso o aplicaciones reales de SAM 3

  1. Conteo de personas en colas o eventos

Permite identificar y contabilizar individuos sin modelos custom.

  1. Seguimiento de vehículos en movimiento

Muy útil para movilidad, acceso a recintos, análisis de tráfico o parking inteligente.

  1. Difuminado automático de caras (blur faces)

Privacidad garantizada en vídeos corporativos, grabaciones públicas o datasets.

  1. Difuminado automático de matrículas (blur plates)

Cumplimiento normativo sin trabajo manual.

  1. Edición y postproducción inteligente

Manipular objetos con prompts del estilo “silla azul” sin recortes manuales.

  1. Retail y e-commerce

Detección de productos, análisis de estanterías y experiencias interactivas.

  1. Ciencia, deporte y análisis técnico

Seguimiento preciso de animales, partículas, deportistas o maquinaria.

Disponibilidad: SAM 3 ya está en Azure Microsoft Foundry

Microsoft ha incorporado facebook-sam3 al catálogo oficial de modelos de Microsoft Foundry, accesible desde el registro de Hugging Face.

SAM 3

Esto significa que las empresas pueden usar SAM 3 directamente en Azure, sin necesidad de desplegarlo manualmente en contenedores o GPU propias.

Recursos oficiales

En Bravent ya estamos integrando SAM 3 en Azure

La llegada de SAM 3 a Azure abre la puerta a soluciones avanzadas de análisis de vídeo, automatización, anonimización y visión por computador, totalmente integradas con la infraestructura cloud.

En Bravent estamos ya probando su potencial en casos reales como conteo de personas, tracking de vehículos y privacidad inteligente.

María Soto Castro

María Soto Castro

Head of Innovation - Bravent

Si quieres explorar cómo SAM 3 puede aplicarse en tu organización, podemos ayudarte con una PoC o integración completa.

Contáctanos en info@bravent.net y descubre cómo llevar esta innovación a tu empresa.