Edge Browser AI mejorará todas las imágenes web


Microsoft Bing anunció una nueva tecnología de inteligencia artificial que brindará una experiencia de imagen 4K a los sitios web a través de Microsoft Edge, mejorando automáticamente las imágenes del sitio web. La tecnología, llamada Turing Image Super-Resolution, hace que las imágenes se muestren en alta resolución, sin importar cuán pobre sea la imagen original.

La nueva tecnología fue desarrollada por Microsoft Equipo de desarrollo de IA del Proyecto Turing.

Ya utilizado en Bing Maps

La nueva tecnología ya está en uso en Bing Maps para mejorar la calidad de sus imágenes aéreas satelitales.

A continuación se muestra una comparación de imágenes aéreas de la sede de Google en Mountain View, CA.

La captura de pantalla de Bing Maps está a la izquierda y la imagen correspondiente de Google Maps está a la derecha:

Mapas de Bing frente a mapas de Google

Comparación lado a lado de imágenes aéreas de Bing Maps versus Google Maps

Cómo Microsoft construyó la tecnología

Hubo cuatro ideas importantes que llevaron al éxito del modelo.

  1. Calificadores humanos
  2. Modelado de ruido
  3. Pérdida perceptual y GAN
  4. Transformadores para la visión: mejora y zoom

Calificadores humanos

Microsoft se dio cuenta de que las métricas utilizadas para medir el éxito de los modelos relacionados con imágenes no se alineaban con la percepción visual humana. Así que crearon una herramienta de comparación visual lado a lado que utilizó evaluadores humanos para ayudar a evaluar el éxito del modelo.

Modelado de ruido

Microsoft tomó el enfoque de comenzar con imágenes de alta calidad y luego degradarlas añadiéndoles ruido y luego enseñando al modelo a devolver la imagen al estado original de alta calidad de la imagen.

Pérdida perceptual y GAN

Esto fue parte del esfuerzo por alinear los resultados con la visión humana.

El anuncio de Microsoft decía:

“… descubrimos que optimizar nuestros modelos utilizando únicamente la pérdida de píxeles entre las imágenes de salida y las imágenes reales no era suficiente para producir la salida óptima que se alineaba con la percepción del ojo humano.

En respuesta, también introdujimos la pérdida perceptual y GAN y ajustamos una combinación ponderada óptima de las tres pérdidas como una función objetiva”.

Transformadores para la visión

Microsoft aprovechó el poder de los Transformers que se usaron en modelos de lenguaje, centrándose en mejorar y hacer zoom.

Lo que eso significa es mejorar la imagen y también enfocarse en ampliar la imagen, lo cual es algo complicado de hacer.

Por lo general, es fácil reducir una imagen. Pero tomar una imagen pequeña y escalarla generalmente termina magnificando los artefactos de baja resolución de la imagen original.

Entonces, lo que hicieron los investigadores fue crear un sistema que puede calcular y «recuperar» los datos de imagen faltantes de la imagen de menor resolución y llevarlos a una resolución más alta.

Microsoft llama al proceso de escalar una imagen, DeepZoom.

Edge: 4K TV de navegadores web

Microsoft visualiza esta nueva función de IA como una forma de brindar una experiencia visual 4K para navegar por la web, así como mejorar las videoconferencias y las fotos familiares cargadas en la web.

La tecnología ya está disponible en la versión experimental de Edge llamada borde canario.

La nueva función se implementará en la versión principal del navegador Edge en los próximos meses.

Citación

Lea el anuncio de Microsoft

Súper resolución de imagen de Turing





Consultar el artículo en la publicación original

Edge Browser AI mejorará todas las imágenes web
A %d blogueros les gusta esto: