Inteligencia de datos generativa

Nielsen Sports observa una reducción de costos del 75 % en el análisis de video con puntos finales multimodelo de Amazon SageMaker | Servicios web de Amazon

Fecha:

Esta es una publicación invitada coescrita con Tamir Rubinsky y Aviad Aranias de Nielsen Sports..

Deportes Nielsen da forma a los medios y contenidos del mundo como líder global en conocimientos, datos y análisis de audiencia. A través de nuestra comprensión de las personas y sus comportamientos en todos los canales y plataformas, brindamos a nuestros clientes inteligencia independiente y procesable para que puedan conectarse e interactuar con sus audiencias, ahora y en el futuro.

En Nielsen Sports, nuestra misión es brindar a nuestros clientes (marcas y titulares de derechos) la capacidad de medir el retorno de la inversión (ROI) y la efectividad de una campaña publicitaria de patrocinio deportivo en todos los canales, incluidos TV, Internet, redes sociales y incluso periódicos, y proporcionar una orientación precisa a nivel local, nacional e internacional.

En esta publicación, describimos cómo Nielsen Sports modernizó un sistema que ejecuta miles de modelos diferentes de aprendizaje automático (ML) en producción mediante el uso Amazon SageMaker terminales multimodelo (MME) y redujeron los costos operativos y financieros en un 75 %.

Desafíos con la segmentación de videos de canales

Nuestra tecnología se basa en inteligencia artificial (IA) y específicamente en visión por computadora (CV), lo que nos permite rastrear la exposición de la marca e identificar su ubicación con precisión. Por ejemplo, identificamos si la marca está en un banner o en una camiseta. Además, identificamos la ubicación de la marca en el artículo, como la esquina superior de un cartel o la funda. La siguiente figura muestra un ejemplo de nuestro sistema de etiquetado.

ejemplo de sistema de etiquetado Nielsen

Para comprender nuestros desafíos de escala y costos, veamos algunos números representativos. Cada mes, identificamos más de 120 millones de impresiones de marca en diferentes canales y el sistema debe admitir la identificación de más de 100,000 6 marcas y variaciones de diferentes marcas. Hemos creado una de las bases de datos de impresiones de marca más grandes del mundo con más de XNUMX mil millones de puntos de datos.

Nuestro proceso de evaluación de medios incluye varios pasos, como se ilustra en la siguiente figura:

  1. Primero, grabamos miles de canales en todo el mundo utilizando un sistema de grabación internacional.
  2. Transmitimos el contenido en combinación con el cronograma de transmisión (Guía de programación electrónica) a la siguiente etapa, que es la segmentación y separación entre las transmisiones del juego en sí y otros contenidos o anuncios.
  3. Realizamos monitoreo de medios, donde agregamos metadatos adicionales a cada segmento, como puntajes de liga, equipos relevantes y jugadores.
  4. Realizamos un análisis de exposición de la visibilidad de las marcas y luego combinamos la información de la audiencia para calcular la valoración de la campaña.
  5. La información se entrega al cliente mediante un panel o informes de analistas. El analista tiene acceso directo a los datos sin procesar o a través de nuestro almacén de datos.

pasos de evaluación de medios

Debido a que operamos a una escala de más de mil canales y decenas de miles de horas de video al año, debemos tener un sistema de automatización escalable para el proceso de análisis. Nuestra solución segmenta automáticamente la emisión y sabe aislar los videoclips relevantes del resto del contenido.

Hacemos esto utilizando algoritmos y modelos dedicados desarrollados por nosotros para analizar las características específicas de los canales.

En total, estamos ejecutando miles de modelos diferentes en producción para respaldar esta misión, que es costosa, genera gastos operativos y es lenta y propensa a errores. Se necesitaron meses para llevar a producción modelos con nueva arquitectura.

Aquí es donde queríamos innovar y rediseñar nuestro sistema.

Escalado rentable para modelos CV utilizando SageMaker MME

Nuestro sistema heredado de segmentación de video era difícil de probar, cambiar y mantener. Algunos de los desafíos incluyen trabajar con un marco de aprendizaje automático antiguo, interdependencias entre componentes y un flujo de trabajo difícil de optimizar. Esto se debe a que nos basamos en RabbitMQ para la canalización, que era una solución con estado. Para depurar un componente, como la extracción de funciones, tuvimos que probar todo el proceso.

El siguiente diagrama ilustra la arquitectura anterior.

arquitectura anterior

Como parte de nuestro análisis, identificamos cuellos de botella en el rendimiento, como ejecutar un solo modelo en una máquina, que mostró una baja utilización de GPU del 30% al 40%. También descubrimos ejecuciones de tuberías y algoritmos de programación ineficientes para los modelos.

Por lo tanto, decidimos construir una nueva arquitectura multiinquilino basada en SageMaker, que implementaría mejoras de optimización del rendimiento, admitiría tamaños de lotes dinámicos y ejecutaría múltiples modelos simultáneamente.

Cada ejecución del flujo de trabajo se dirige a un grupo de vídeos. Cada vídeo dura entre 30 y 90 minutos y cada grupo tiene más de cinco modelos para ejecutar.

Examinemos un ejemplo: un vídeo puede durar 60 minutos y constar de 3,600 imágenes, y cada imagen debe inferirse mediante tres modelos de ML diferentes durante la primera etapa. Con SageMaker MME, podemos ejecutar lotes de 12 imágenes en paralelo y el lote completo se completa en menos de 2 segundos. En un día normal tenemos más de 20 grupos de vídeos y en un día de fin de semana lleno podemos tener más de 100 grupos de vídeos.

El siguiente diagrama muestra nuestra nueva arquitectura simplificada utilizando un MME de SageMaker.

arquitectura simplificada usando un SageMaker MME

Resultados

Con la nueva arquitectura, logramos muchos de los resultados deseados y algunas ventajas invisibles sobre la arquitectura anterior:

  • Mejor tiempo de ejecución – Al aumentar el tamaño de los lotes (12 vídeos en paralelo) y ejecutar varios modelos simultáneamente (cinco modelos en paralelo), hemos reducido el tiempo de ejecución general de nuestro proceso en un 33 %, de 1 hora a 40 minutos.
  • Infraestructura mejorada – Con SageMaker, actualizamos nuestra infraestructura existente y ahora utilizamos instancias de AWS más nuevas con GPU más nuevas, como g5.xlarge. Uno de los mayores beneficios del cambio es la mejora inmediata del rendimiento mediante el uso de optimizaciones de TorchScript y CUDA.
  • Uso optimizado de la infraestructura – Al tener un único punto final que puede albergar varios modelos, podemos reducir tanto la cantidad de puntos finales como la cantidad de máquinas que necesitamos mantener, y también aumentar la utilización de una sola máquina y su GPU. Para una tarea específica con cinco videos, ahora utilizamos solo cinco máquinas de instancias g5, lo que nos brinda un beneficio de costos del 75 % con respecto a la solución anterior. Para una carga de trabajo típica durante el día, utilizamos un único punto final con una sola máquina de g5.xlarge con una utilización de GPU de más del 80 %. En comparación, la solución anterior tenía menos del 40% de utilización.
  • Mayor agilidad y productividad – El uso de SageMaker nos permitió dedicar menos tiempo a migrar modelos y más tiempo a mejorar nuestros algoritmos y modelos principales. Esto ha aumentado la productividad de nuestros equipos de ingeniería y ciencia de datos. Ahora podemos investigar e implementar un nuevo modelo de aprendizaje automático en menos de 7 días, en lugar del mes anterior. Esta es una mejora del 1% en velocidad y planificación.
  • Mejor calidad y confianza – Con las capacidades de prueba A/B de SageMaker, podemos implementar nuestros modelos de forma gradual y poder retroceder de forma segura. El ciclo de vida más rápido hasta la producción también aumentó la precisión y los resultados de nuestros modelos ML.

La siguiente figura muestra nuestra utilización de GPU con la arquitectura anterior (3040% de utilización de GPU).

Utilización de GPU con la arquitectura anterior.

La siguiente figura muestra nuestra utilización de GPU con la nueva arquitectura simplificada (90% de utilización de GPU).

Utilización de GPU con la nueva arquitectura simplificada

Conclusión

En esta publicación, compartimos cómo Nielsen Sports modernizó un sistema que ejecuta miles de modelos diferentes en producción mediante el uso de SageMaker MME y redujo su costo operativo y financiero en un 75 %.

Para leer más, consulte lo siguiente:


Acerca de los autores

Eitan SelaEitan Sela es un arquitecto de soluciones especializado en inteligencia artificial generativa y aprendizaje automático en Amazon Web Services. Trabaja con clientes de AWS para brindarles orientación y asistencia técnica, ayudándolos a crear y operar soluciones de inteligencia artificial generativa y aprendizaje automático en AWS. En su tiempo libre, a Eitan le gusta correr y leer los últimos artículos sobre aprendizaje automático.

chica goldmanchica goldman es ingeniero de software sénior y arquitecto de soluciones empresariales sénior en AWS y le apasionan las soluciones de vanguardia. Se especializa y ha desarrollado muchos servicios y soluciones distribuidos de Machine Learning. Gal también se centra en ayudar a los clientes de AWS a acelerar y superar sus desafíos de ingeniería e IA generativa.

tal panchektal panchek es gerente senior de desarrollo comercial para inteligencia artificial y aprendizaje automático en Amazon Web Services. Como especialista en BD, es responsable de aumentar la adopción, la utilización y los ingresos de los servicios de AWS. Reúne las necesidades de los clientes y de la industria y se asocia con equipos de productos de AWS para innovar, desarrollar y ofrecer soluciones de AWS.

Tamir RubinskiTamir Rubinski dirige Ingeniería Global de Investigación y Desarrollo en Nielsen Sports, aportando una amplia experiencia en la creación de productos innovadores y la gestión de equipos de alto rendimiento. Su trabajo transformó la evaluación de medios de patrocinio deportivo a través de soluciones innovadoras impulsadas por inteligencia artificial.

Aviad AraniasAviad Aranias es líder del equipo MLOps y arquitecto de análisis deportivo de Nielsen que se especializa en la creación de canales complejos para analizar videos de eventos deportivos en numerosos canales. Se destaca en la construcción e implementación de modelos de aprendizaje profundo para manejar datos a gran escala de manera eficiente. En su tiempo libre le gusta hornear deliciosas pizzas napolitanas.

punto_img

Información más reciente

punto_img

Habla con nosotros!

¡Hola! ¿Le puedo ayudar en algo?