¿Qué es la inteligencia artificial, machine learning, deep learning?

/, Inteligencia Artificial/¿Qué es la inteligencia artificial, machine learning, deep learning?

www.InteligenciaArtificial.Barcelona

En el anterior post decíamos que John McCarthy acuñó el término Inteligencia Artificial en la década de los 50. Pero, ¿a qué nos referimos cuando hablamos de Inteligencia Artificial?

Una extensa y precisa definición (y descripción de sus ámbitos) se encuentra en el libro de Stuart Rusell y Peter Norvig titulado Artificial Intelligence, a modern approach, el libro de texto sobre inteligencia artificial más popular en el mundo universitario y, Sin duda para mí, el mejor punto de partida para tener una visión global del tema. Pero intentando hacer una aproximación más generalista (propósito de este blog) podríamos resumir que por inteligencia artificial nos referimos a aquella que muestran las máquinas, en contraste con la inteligencia natural que muestran los humanos. En este sentido, una posible definición concisa y general de Inteligencia Artificial podría ser el esfuerzo para automatizar tareas intelectuales normalmente realizadas por humanos.

Como tal, el área de Inteligencia Artificial (IA)  es un campo muy general que abarca muchas áreas de conocimiento relacionadas con el aprendizaje automático; incluso en el campo de la AI se incluyen muchos más enfoques no siempre catalogados como aprendizaje automático por mis compañeros expertos en el tema.  Además, a lo largo del tiempo, a medida que los computadores han sido cada vez más capaces de “hacer cosas”, se han ido cambiando las tareas o tecnologías consideradas como “inteligentes”.

Esto se explica porque desde los 50, la IA ha experimentado varias oleadas de optimismo, seguidas por la decepción y la pérdida de financiación e interés (épocas conocidas como “AI winter“), seguidas de nuevos enfoques, éxito y financiación. Además, durante la mayor parte de su historia, la investigación en IA se ha dividido en subcampos basados en consideraciones técnicas o herramientas matemáticas concretas, que a menudo no se comunicaban suficientemente entre sí.

Por tanto,  de momento creo que podemos avanzar sin una definición detallada de IA: es suficiente darse cuenta de que está aquí y ya nos acompaña con todo lo que estamos haciendo. Por ejemplo, todos hemos visto saltos cuánticos en estos últimos tiempos en la calidad de una amplia gama de tecnologías cotidianas, tales como el reconocimiento de voz  y su transcripción a texto, ya incorporado en todo tipo de dispositivos, para que no tengamos que teclear (puede ser Siri de Apple, Google Now, Cortana de Windows,  Alexa de Amazon, etc.).  Otro caso es el procesado de lenguaje natural, donde ha habido unos avances espectaculares, puesto al alcance de todos gracias a herramientas como Google Translate, que permite, simplemente pulsando en el botón de micro, la transcripción a otro idioma de todo lo que se le va dictando (Google Translate traduce oraciones habladas en más de 32 pares de lenguas y permite traducir a  más de 100  idiomas);y no digamos en avances en visión por computador, donde ya disponemos de la tecnología necesaria para transcribir en texto lo que se ve en la imagen de forma inmediata. Les aseguro que es impresionante lo que se está avanzando en reconocimiento de imágenes, y por ello hablaremos más adelante sobre este tema concreto en este blog. Estos tres avances juntos (reconocimiento de voz, procesado de lenguaje natural, visión por computador), todos ellos puntales de la AI, son cruciales para desencadenar mejoras en robótica, drones, coches que se conducen solos, entre muchas otras áreas que están cambiando el futuro próximo.

Muchos de estos avances han sido posibles gracias a una familia de técnicas IA conocida popularmente como Deep Learning. Por este motivo, en estos post hablaré a menudo de Deep Learning, perteneciente a una de las áreas de la IA conocida como Machine Learning. El Machine Learning (ML), a veces traducido al castellano como Aprendizaje Automático, es en sí mismo un gran campo de investigación y desarrollo.  En concreto,  el ML se podría definir como el subcampo de la IA que proporciona a los ordenadores la capacidad de aprender sin ser explícitamente programados. El objetivo del ML es desarrollar para cada problema, un “algoritmo” de predicción para un caso de uso particular; este tipo de algoritmos aprenden de los datos con el fin de encontrar patrones y construir un modelo para predecir y clasificar los elementos. Dada la madurez del área de investigación de ML, existen muchos enfoques bien establecidos para el aprendizaje automático por parte de máquinas, cada uno de los cuales utiliza una estructura algorítmica diferente para optimizar las predicciones basadas en los datos recibidos. No obstante, entrar en detalle en todos ellos sale del propósito de este post.

En el caso concreto del Deep Learning, las estructuras algorítmicas permiten modelos que están compuestos de múltiples capas de procesamiento para aprender representaciones de datos con múltiples niveles de abstracción.  Como veremos, los avances en Deep Learning  han mejorado drásticamente el estado de la técnica en reconocimiento de voz, reconocimiento de objetos visuales, detección de objetos y muchos otros dominios, y han revolucionado el mundo de la inteligencia artificial.  Pero aunque el Deep Learning a menudo se presenta envuelto en una cierta mística, con referencias a algoritmos que “funcionan como el cerebro”, que “piensan” o “entienden”, a mi entender la realidad está bastante lejos de este sueño de ciencia ficción.  Además, creo que sus conceptos básicos pueden ser explicados de manera relativamente fácil a lectores con un mínimo de formación en informática y ganas de aprender, siendo este el propósito de esta serie de posts, que espero les aporte valor.

 

2018-02-05T15:02:02+00:00January 21st, 2018|