Tercer Milenio

En colaboración con ITA

Etiqmedia. Encontrar la aguja en el contenido audiovisual

Tecnologías de análisis de audio, vídeo y texto se integran en una plataforma de catalogación supervisada de contenidos audiovisuales que permite localizar, por ejemplo, un logo o un gol en muchas horas de vídeo. Acaba de nacer la empresa Etiqmedia, que ofrece este servicio.

¿Cuándo nombraron a Aragón en el pleno parlamentario? Diversas tecnologías integradas en la plataforma Etiqmedia dan respuesta a esta pregunta.
¿Cuándo nombraron a Aragón en el pleno parlamentario? Diversas tecnologías integradas en la plataforma Etiqmedia dan respuesta a esta pregunta.
Carlos Muñoz

En las Cortes de Aragón va a debatirse un punto del orden del día sobre un tema que me interesa, como una nueva ley que afecta a mi sector o a mi pueblo. Pero una sesión de las Cortes puede durar muchas horas, cuando ese tema se aborda solo durante 10 minutos. ¿Cómo buscar esa aguja en el pajar? La plataforma de catalogación supervisada de contenido audiovisual Etiqmedia facilita las cosas. «Podrías ir al punto exacto donde se habla del tema que te interesa, evitando ver el resto del vídeo», señala Antonio León, director general de Etiqmedia. En este ejemplo, lo que se cataloga es contenido institucional, pero esta tecnología se aplica, por supuesto, al ámbito televisivo. «Esto mismo lo aplicamos para mejorar la oferta de televisión a la carta de las cadenas, donde tendrás un buscador que te permita acceder al punto exacto de todos los vídeos de informativos o programas donde se nombre lo que te interesa».


El concepto de catalogación supervisada se gestó en Itainnova, donde se llevó a cabo el desarrollo inicial del sistema. De hecho, parte del personal de Etiqmedia proviene del equipo que desarrolló la primera versión de la plataforma desde Itainnova. Ambas partes han firmado un acuerdo para la explotación y evolución del sistema desde Etiqmedia con el apoyo tecnológico del instituto.


Ángel Fernández Cuello, director de Itainnova, valora muy positivamente que «un egresado del Instituto haya iniciado ese camino arriesgado pero apasionante que es la emprendeduría, creando una empresa que va a explotar un resultado de Itainnova». Así, «se ponen en valor los resultados del trabajo de investigación y desarrollo del propio instituto». Y añade que «la creación de empresas de base tecnológica forma parte de la estrategia del Gobierno de Aragón para la creación de empleo altamente cualificado».


Este es el resultado de dos años de trabajo del área de Explotación de Resultados y Propiedad Industrial de Itainnova. Concretamente, se licencia «el uso e instalación de nuestro categorizador de textos en vídeo, que es una parte de nuestro bien conocido activo Moriarty; y se transfiere el código fuente del precatalogador de contenidos multimedia –precisa Fernández–. Juntos, hacen una solución de lo más competitivo en este nuevo y emergente mercado».La jugada exacta

Etiqmedia Indexing tiene cuatro productos en función de las peculiaridades del contenido y las necesidades del usuario final. Además de los dirigidos a televisión e instituciones, Academics «está orientado al sector académico; permite al alumno acceder a los puntos exactos de las clases ‘online’, por ejemplo para resolver dudas», explica León. En el caso de Sports, «en un partido de fútbol somos capaces de cortar automáticamente las jugadas y decir si se trata de un gol, un córner o una falta».


El flujo de trabajo se divide en tres fases: automatización, supervisión y explotación.


Al no ser ya necesario introducir toda la información de forma manual, con este sistema de catalogación supervisada «se reduce hasta diez veces el tiempo que debe pasar un documentalista con un contenido para catalogarlo».


«Etiqmedia surge precisamente de nuestro trabajo con documentalistas, no pretende sustituirles, sino hacer su trabajo más eficiente», destaca. De ahí que haya espacio para la supervisión. Algunas tareas «son tediosas y repetitivas, nuestra labor es automatizarlas para que el documentalista pueda centrarse en introducir información de mayor valor añadido». En definitiva, «lejos de sustituir al documentalista, hacemos su trabajo más valioso y creativo a partir de la información generada en la fase automática». Además, Etiqmedia ofrece una plataforma de explotación de los contenidos multimedia y su información asociada que permite a las empresas monetizar sus vídeos.


Actualmente, esta joven empresa, ubicada en el Ciem de Zaragoza, está cerrando un acuerdo con el mayor distribuidor del mercado audiovisual, «que nos va ayudar en la comercialización y especialmente en la internacionalización del producto».

Segmentación automática del vídeo en momentos, planos y escenas
El audio es la principal fuente de información a la hora de catalogar un vídeo. Por eso su análisis es la primera tarea que aborda la plataforma de Etiqmedia. «Podemos trabajar con subtítulos previos, que en caso de que estén desincronizados, como sucede en la TDT, Etiqmedia es capaz de resincronizarlos o de transcribir directamente el audio con reconocimiento del habla», explica Antonio León, director general de Etiqmedia. Sobre el texto obtenido, «se aplica procesamiento del lenguaje natural para categorizar el contenido y extraer las palabras clave: protagonistas, lugares o instituciones». Finalmente, «se integra toda esta información con la obtenida del vídeo: reconocimiento de caras, rótulos, corte de planos,etc.».


Una funcionalidad singular, de la que están especialmente orgullosos, es «nuestra segmentación automática del vídeo en momentos, planos y escenas». Esta capacidad permite realizar búsquedas muy precisas. Por ejemplo, «en un informativo, podrías buscar el momento exacto en el que se dice una palabra, el plano completo en el que se ha nombrado o ver toda la noticia a la que pertenece».


Pero, al hablar de retos tecnológicos, aunque León reconoce que «probablemente lo primero en que debería pensar sería en el algoritmo de reconocimiento de caras o las tecnologías de voz», el mayor desafío superado por esta plataforma fue «ser capaces de integrar todas las tecnologías en una misma arquitectura y conseguir que el tiempo que tardaba el sistema en realizar el análisis fuese el menor posible». Para los clientes de este tipo de servicios «es crítico tener los resultados cuanto antes». Para reducir al máximo ese tiempo sin perder la potencia de agrupar la información de todos los algoritmos, trabajaron con arquitecturas modulares, paralelización y computación gráfica GPU, «como hacen los videojuegos de última generación».


¿Cuáles son todas esas tecnologías integradas? La plataforma Etiqmedia trabaja con tecnologías de análisis de audio, vídeo y texto; «esta multimodalidad es uno de los factores diferenciadores de nuestro sistema». León destaca que «toda nuestra tecnología es propia o surge de una alianza estrecha con nuestros socios tecnológicos: Itainnova y el grupo Vivo Lab del Instituto de Investigación en Ingeniería de Aragón (I3A) de la Universidad de Zaragoza, un referente europeo en el ámbito de las tecnologías del habla, con amplia experiencia en el sector audiovisual».

Comentarios
Debes estar registrado para poder visualizar los comentarios Regístrate gratis Iniciar sesión