¿Qué son las API de reconocimiento de imágenes y qué pueden hacer por usted? Este artículo aclarará qué es el reconocimiento de imágenes, qué hace una API y cómo puede ayudarlo a usted o a su empresa a sacar más provecho de Internet. El reconocimiento de imágenes tiene un enorme potencial para las empresas y para los usuarios individuales de Internet con discapacidad visual.
¿Qué es una API de reconocimiento de imágenes?
El reconocimiento de imágenes es donde un software detecta las características de una imagen y la clasifica con precisión. Por ejemplo, si sube una imagen de un Ferrari 458 a una API de reconocimiento de imagen, debería reconocer que es un automóvil y que es (o debería ser) rojo. Dependiendo de la API, es posible una clasificación adicional según el tipo de imagen que esté utilizando.
Esto puede parecer realmente simple, la mayoría de las veces los humanos pueden mirar una imagen y decirle de qué es una imagen sin intentarlo, pero este ha sido un problema difícil de enseñar a las computadoras a resolver. Se ha trabajado mucho para descubrir cómo una computadora puede entender cómo son las cosas, y hemos hecho grandes avances, desde la capacidad de hacer búsquedas de imágenes inversas hasta la famosa red Deep Dream de Google.
Una API es una interfaz de programa de aplicación. Es esencialmente un intermediario entre las rutinas del programa que le dice a un elemento cómo trabajar con otro, o proporciona las herramientas que necesitan para realizar una función. Hay docenas de tipos de API que pueden lograr todo tipo de objetivos, utilizando una variedad de lenguajes de programación. En este contexto, una API de reconocimiento de imágenes es la herramienta que puede utilizar para acceder al poder de aprendizaje profundo de algunos sistemas comerciales de reconocimiento de imágenes.
Necesita mucha potencia informática para realizar el reconocimiento de imágenes. Necesita grandes cantidades de datos y el poder para interpretarlo todo. La mayoría de los usuarios simplemente no tienen los recursos masivos para construir su propia máquina de aprendizaje profundo. Grandes nombres como Vision API de Google, Face API de Microsoft, ImageNet y otros tienen tales máquinas y permiten el acceso a ellas a través de API, ya sea de forma gratuita o por una tarifa. Esto permite a las empresas de todos los tamaños acceder a este poder y, como resultado, los usuarios obtienen nuevas experiencias.
¿Cómo va a cambiar el reconocimiento de imágenes nuestra experiencia en Internet?
Los diferentes usuarios de Internet obtendrán diferentes ventajas del reconocimiento de imágenes. Echemos un vistazo al propietario de un sitio web hipotético y a un usuario hipotético para ver cómo pueden beneficiarse ambas partes.
Los beneficios comerciales del reconocimiento de imágenes
Como ejemplo, supongamos que ejecuta un portal de venta automática similar a Etsy o un sitio web de citas. Desea administrar la calidad y la idoneidad de todas las imágenes cargadas por los usuarios. Desea bloquear todas las imágenes para adultos o inadecuadas y clasificarlas en las categorías apropiadas, pero no puede hacerlo todo a mano.
Ingrese a la API de reconocimiento de imagen. Puede usar la API, junto con una máquina de reconocimiento de imagen adecuada, para escanear cada imagen y definirla mediante criterios establecidos. Para que pueda escanear la biblioteca de imágenes en busca de imágenes indecentes y eliminarlas. Puede escanear las imágenes y clasificar las que contienen alimentos en la categoría de "alimentos" y las prendas de punto en la categoría de "lana". Una vez que le dice a la API qué hacer, el proceso se automatiza.
También hay oportunidades aquí para realidad aumentada e imagen y video interactivos. Puede usar el reconocimiento de imágenes para que un programa reconozca objetos en el mundo real. Por ejemplo, podría tomar una foto de un par de zapatillas que alguien usa en la calle. Si el programa reconoce las zapatillas, la imagen podría aumentarse con un enlace para comprarlas usted mismo. Esto beneficia al negocio (ofrece una oportunidad de venta inmediata) y beneficia al usuario (obtiene lo que quiere en este momento).
Los beneficios para el usuario del reconocimiento de imágenes
El ejemplo de zapatillas anterior es solo una forma obvia en que los usuarios pueden beneficiarse del reconocimiento de imágenes. La realidad aumentada significa que podríamos acceder instantáneamente a revisiones, información de precios y muchos datos simplemente tomando una foto de un producto. Eso les da a los usuarios grandes cantidades de datos para ayudarlos a tomar una decisión de compra.
Mark Zuckerberg resumió un beneficio a menudo pasado por alto para el reconocimiento de imágenes en su discurso sobre IA a principios de este año. Imaginó una API de reconocimiento de imágenes que funcionaba con personas ciegas o deficientes visuales que podían "leer" una imagen y describir lo que ve en voz alta. Esto podría tener repercusiones masivas para los usuarios de Internet con problemas o, con la realidad aumentada, en el mundo real en algún momento.
El reconocimiento de imágenes también juega un papel en la seguridad del vehículo. Las nuevas tecnologías de frenado autónomo y anticolisión que se están introduciendo funcionan de manera similar a las API de las que hemos estado hablando. Escanean y evalúan imágenes muchas veces por segundo para mantenerlo a usted y a su automóvil a salvo mientras están en la carretera. Esta tecnología también le dice a los autos autónomos qué hay a su alrededor.
Las API de reconocimiento de imágenes no van a revolucionar nuestra experiencia en Internet por sí mismas. Trabajan junto con la tecnología existente para agregar una capa de interacción e inmersión al mundo que vemos. Si bien los ejemplos de este artículo son limitados, existe un gran potencial para los juegos, las películas, la industria automotriz, el comercio minorista, el entretenimiento y cualquier industria con tecnología. ¡Esto es solo el comienzo de lo que pueden lograr los sistemas inteligentes!
