Facebook renueva su proceso automatizado de texto alternativo para identificar más objetos dentro de las imágenes publicadas

Facebook renueva su proceso automatizado de texto alternativo para identificar más objetos dentro de las imágenes publicadas

Facebook ha anunciado una actualización significativa de su proceso de texto alternativo automático – o AAT – , que garantizará que más imágenes en la plataforma son legibles por los lectores de pantalla, lo que permite a los usuarios con problemas de visión obtener una mejor experiencia dentro de las aplicaciones de Facebook.
Facebook lanzó por primera vez su proceso AAT en 2016, permitiendo la identificación automatizada de objetos dentro de imágenes publicadas a través del proceso de aprendizaje automático, siempre que no se proporcionaran descripciones manuales de texto alternativo. Pero en su iteración inicial, el proceso era bastante limitado, que Facebook ha estado trabajando para actualizar desde entonces.
Como explica Facebook:
«En primer lugar, hemos ampliado el número de conceptos que AAT puede detectar e identificar de forma fiable en una foto en más de 10 veces, lo que a su vez significa menos fotos sin una descripción. Las descripciones también son más detalladas, con la capacidad de identificar actividades, lugares de interés, tipos de animales, etc., por ejemplo, «Puede ser un selfie de 2 personas, al aire libre, la Torre Inclinada de Pisa».
Esto proporciona más capacidad para que Facebook proporcione descripciones detalladas de los objetos dentro de las imágenes, incluyendo no solo lo que son, sino dónde se colocan dentro del marco.
«Así que en lugar de describir el contenido de una foto como «Puede ser una imagen de 5 personas», podemos especificar que hay dos personas en el centro de la foto y otras tres dispersas hacia los flecos, lo que implica que los dos en el centro son el foco. O, en lugar de describir simplemente un hermoso paisaje con «Puede ser una casa y una montaña», podemos destacar que la montaña es el objeto principal en una escena basada en lo grande que aparece en comparación con la casa en su base».
Como se ha señalado, Facebook ha estado trabajando para evolucionar sus herramientas de reconocimiento visual durante años, que incluye tanto imágenes fijas como contenido de video. De hecho, en 2017, Facebook compartió una visión general de sus herramientas de ID de video,que aún no están disponibles, pero aumentará aún más la capacidad de la plataforma para atender a los usuarios con problemas de visión, y recopilar más información sobre lo que hay en el contenido publicado, lo que los usuarios están viendo, lo que están interactuando con, y mucho más.
Para su última actualización de AAT, Facebook realmente utilizó imágenes y hashtags de Instagram para mapear contenido, lo que subraya aún más el potencial del proceso para la recopilación de datos.
Eso podría tener implicaciones más allá de ayudar a los usuarios con capacidades diferentes. Por ejemplo, Facebook podría buscar ayudar a los anunciantes a llegar a los usuarios que están interesados en el café dirigiéndose a aquellos que han publicado imágenes de tazas de café o cafés con regularidad. Eso también podría ayudar a amplificar aún más sus mensajes porque es probable que esos usuarios publiquen su oferta también – por lo que podría llegar a estos usuarios con una oferta de descuento, con una mayor probabilidad de que también compartan eso con sus seguidores y amigos.
Para ser claros, Facebook aún no ofrece estas nuevas estadísticas de reconocimiento de imágenes como opciones de segmentación de anuncios. Pero la capacidad está ahí, y podría facilitar nuevas opciones de búsqueda e investigación para maximizar la respuesta de su audiencia en el futuro.
Facebook dice que el nuevo sistema también es más cultural y demográficamente inclusivo, debido a Facebook utilizando un conjunto de datos más amplio de contenido, a través de la traducción de hashtags en muchos idiomas:
«Por ejemplo, puede identificar bodas en todo el mundo basadas (en parte) en ropa tradicional en lugar de etiquetar solo fotos con vestidos de novia blancos».
El nuevo sistema también puede proporcionar más detalles para aquellos que lo deseen. Por ejemplo, a los usuarios se les presentará inicialmente una descripción básica de cada imagen, pero tendrán la opción de elegir información más específica, utilizando los listados de datos ampliados.
Una vez más, las implicaciones ampliadas aquí son significativas – y aunque el enfoque principal es proporcionar más acceso a las plataformas de Facebook para todos los usuarios, las opciones de datos extendidas también podrían ser enormemente valiosas en una variedad de maneras.
El nuevo sistema AAT ya está en funcionamiento, y los usuarios con lectores de pantalla pueden acceder a los nuevos datos dentro de las aplicaciones de Facebook.