Mapa de conocimiento de IA: cómo clasificar las tecnologías de IA

Un bosquejo de un nuevo panorama de tecnología de IA

Una versión más corta de este artículo apareció primero en Forbes

El artículo también ha sido galardonado con la insignia de plata por KDnuggets como uno de los más leídos y compartidos en agosto de 2018.

I. pensamientos introductorios

He estado en el espacio de la inteligencia artificial durante un tiempo, y soy consciente de que existen múltiples clasificaciones, distinciones, paisajes e infografías para representar y rastrear las diferentes formas de pensar sobre la IA. Sin embargo, no soy un gran admirador de esos ejercicios de categorización, principalmente porque tiendo a pensar que el esfuerzo de clasificar puntos de datos dinámicos en cuadros de arreglos predeterminados a menudo no vale los beneficios de tener un marco tan "claro" (es una generalización por supuesto, porque a veces son extremadamente útiles).

Cuando se trata específicamente de inteligencia artificial, también creo que muchas de las categorizaciones están incompletas o no pueden capturar fuertes vínculos fundamentales y aspectos de esta nueva ola de IA.

Así que déjame decirte primero la razón de esta publicación. Trabajando con la agencia de innovación estratégica Chôra, queríamos crear una herramienta visual para que las personas captaran de un vistazo la complejidad y profundidad de esta caja de herramientas, así como establecer un mapa que pudiera ayudar a las personas a orientarse en la jungla de IA. Debe mirar el siguiente gráfico como una forma de organizar el conocimiento no estructurado en una especie de ontología con el objetivo final de no representar con precisión toda la información existente sobre IA, sino más bien tener una herramienta para describir y acceder a parte de ese conjunto de información.

Lo que sigue es un esfuerzo para dibujar una arquitectura para acceder al conocimiento sobre IA y seguir dinámicas emergentes, una puerta de entrada sobre el conocimiento preexistente sobre el tema que le permitirá buscar información adicional y eventualmente crear nuevos conocimientos sobre IA.

Por lo tanto, la utilidad del trabajo final debería ayudarlo a lograr tres cosas: entender lo que está sucediendo y tener un mapa para seguir el camino; comprender dónde se usa la inteligencia artificial en la actualidad (con respecto a dónde no se usaba en el pasado); Comprender qué y cuántos problemas se vuelven a plantear para que la IA pueda abordarlos (si está familiarizado con el trabajo de Agrawal et al., 2018, esas son consecuencias directas de la caída en el costo de las tecnologías de predicción).

Este artículo, en principio, está dirigido tanto a las personas que están comenzando en la IA para darles una idea general de lo que existe, como a los expertos y profesionales que están experimentando con estas tecnologías durante un tiempo (con una solicitud explícita de enviarme comentarios sobre cómo lo estructurarías u otras tecnologías que deberían ser capturadas por el espectro AI).

También estoy muy consciente de que esta es una tarea ambiciosa, así que simplemente mire esto como un primer borrador o intente hacerlo en lugar de una solución final por escrito.

Permítanme también concluir esta introducción con algo que descubrí tratando de lograr el objetivo de crear esta imagen: es muy, muy difícil. Intentar representar la mayor cantidad de información posible en un mapa bidimensional no obvio ha sido extremadamente desafiante, algo que no se da cuenta hasta que intenta hacerlo usted mismo. Los invito a todos a hacer lo mismo para entender lo que quiero decir (créanme, no es nada fácil, especialmente dada la discrepancia en las opiniones, puntos de vista y enfoques utilizados en la IA en los últimos 60 años). Esto me lleva al descargo de responsabilidad final: a veces tuve que aproximar conceptos o la clasificación en sí misma para mantener un equilibrio entre precisión y claridad, así que perdóname por adelantado por alguna declaración menor (o importante, a los ojos de alguien).

Así que saltemos al AI Knowledge Map (AIKM) ahora.

II Dominio del problema + Enfoque = Solución tecnológica

Así que aquí vamos, eso es todo. Probablemente esperabas dada la introducción de un extraño motor de realidad virtual que proyecta múltiples paquetes de luces para cada tecnología, pero en cambio es un gráfico bidimensional anticuado. Tan sencillo como eso.

Sin embargo, veámoslo un poco más de cerca.

En los ejes, encontrará dos macrogrupos, es decir, los paradigmas de IA y los dominios de problemas de AI. Los paradigmas de IA (eje X) son realmente los enfoques utilizados por los investigadores de IA para resolver problemas específicos relacionados con la IA (incluye los enfoques que conocemos hasta la fecha). Por otro lado, los dominios de problemas de AI (eje Y) son históricamente el tipo de problemas que AI puede resolver. En cierto sentido, también indica las capacidades potenciales de una tecnología de IA.

Por lo tanto, he identificado los siguientes paradigmas de IA:

  • Herramientas basadas en la lógica: herramientas que se utilizan para la representación del conocimiento y la resolución de problemas;
  • Herramientas basadas en el conocimiento: herramientas basadas en ontologías y enormes bases de datos de nociones, información y reglas;
  • Métodos probabilísticos: herramientas que permiten a los agentes actuar en escenarios de información incompleta;
  • Aprendizaje automático: herramientas que permiten a las computadoras aprender de los datos;
  • Inteligencia incorporada: caja de herramientas de ingeniería, que supone que se requiere un cuerpo (o al menos un conjunto parcial de funciones como movimiento, percepción, interacción y visualización) para una inteligencia superior;
  • Búsqueda y optimización: herramientas que permiten realizar búsquedas inteligentes a través de muchas soluciones posibles.

Esos seis paradigmas también se dividen en tres enfoques macro diferentes, a saber, simbólico, sub-simbólico y estadístico (representado por diferentes colores). Brevemente, el enfoque simbólico establece que la inteligencia humana podría reducirse a la manipulación de símbolos, la sub-simbólica que no se deben proporcionar representaciones específicas de conocimiento ex ante, mientras que el enfoque estadístico se basa en herramientas matemáticas para resolver subproblemas específicos.

Una nota adicional rápida: es posible que escuche a la gente hablar sobre “tribus de IA”, un concepto propuesto por Pedro Domingos (2015) que agrupa a los investigadores en grupos según los enfoques que utilizan para resolver problemas. Puede mapear fácilmente esas cinco tribus con nuestra clasificación de paradigma (sin considerar el grupo de inteligencia incorporado), es decir, simbolistas con un enfoque basado en la lógica (usan un razonamiento lógico basado en símbolos abstractos); Connectionists con Machine learning (están inspirados en el cerebro de los mamíferos); Evolutivos con búsqueda y optimización (están inspirados en la evolución darwiniana); Bayesianos con métodos probabilísticos (usan modelos probabilísticos); y finalmente Analogizadores con métodos basados ​​en el conocimiento, ya que intentan extrapolar a partir del conocimiento existente y casos similares anteriores.

En cambio, el eje vertical establece los problemas para los que se ha utilizado AI, y la clasificación aquí es bastante estándar:

  • Razonamiento: la capacidad de resolver problemas;
  • Conocimiento: la capacidad de representar y comprender el mundo;
  • Planificación: la capacidad de establecer y alcanzar objetivos;
  • Comunicación: la capacidad de entender el lenguaje y comunicarse;
  • Percepción: la capacidad de transformar entradas sensoriales sin procesar (por ejemplo, imágenes, sonidos, etc.) en información utilizable.

Todavía me estoy preguntando si esta clasificación es lo suficientemente grande como para capturar todo el espectro de problemas que enfrentamos actualmente o si se deben agregar más instancias (por ejemplo, Creatividad o Movimiento). Sin embargo, por el momento, me quedaré con el de 5 grupos.

Los patrones de los cuadros en su lugar dividen las tecnologías en dos grupos, es decir, aplicaciones estrechas y aplicaciones generales. Las palabras utilizadas son a propósito un poco engañosas, pero tengan paciencia conmigo por un segundo y explicaré lo que quise decir. Para cualquiera que se inicie en IA, conocer la diferencia entre IA débil / estrecha (ANI), IA fuerte / general (AGI) y Super Inteligencia artificial (ASI) es primordial. En aras de la claridad, ASI es simplemente una especulación actualizada, la IA general es el objetivo final y el santo grial de los investigadores, mientras que la IA estrecha es lo que realmente tenemos hoy, es decir, un conjunto de tecnologías que no pueden hacer frente a nada fuera de su alcance (que es la principal diferencia con AGI).

Los dos tipos de líneas utilizadas en el gráfico (continua y punteada) quieren señalar explícitamente esa distinción y hacer que confíes en que cuando leas algún otro material introductorio de IA no te perderás por completo. Sin embargo, al mismo tiempo, la diferencia aquí describe las tecnologías que solo pueden resolver una tarea específica (generalmente mejor que los humanos: aplicaciones estrechas) y otras que pueden resolver hoy o en el futuro múltiples tareas e interactuar con el mundo (mejor que muchos humanos - Aplicaciones generales).

Finalmente, veamos qué hay dentro del gráfico mismo. En el mapa, se representan las diferentes clases de tecnologías de IA. Tenga en cuenta que no nombro algoritmos específicos intencionalmente, sino que los agrupo en macrogrupos. Tampoco le proporciono una evaluación de valor de lo que funciona y lo que no funciona, sino simplemente enumero lo que los investigadores y los científicos de datos pueden aprovechar.

Entonces, ¿cómo se lee e interpreta el mapa? Bueno, déjame darte dos ejemplos para ayudarte a hacer eso. Si observa el procesamiento del lenguaje natural, esto incorpora una clase de algoritmos que utilizan una combinación de un enfoque basado en el conocimiento, aprendizaje automático y métodos probabilísticos para resolver problemas en el dominio de la percepción. Al mismo tiempo, sin embargo, si observa el espacio en blanco en la intersección entre el paradigma basado en la lógica y los problemas de razonamiento, podría preguntarse por qué no hay tecnologías allí. Lo que transmite el mapa no es que no exista categóricamente un método que pueda llenar ese espacio, sino que cuando las personas se acercan a un problema de razonamiento prefieren usar un enfoque de Aprendizaje automático, por ejemplo.

Para concluir esta explicación, esta es la lista completa de tecnologías incluidas con sus propias definiciones:

  • Robotic Process Automation (RPA): tecnología que extrae la lista de reglas y acciones a realizar observando al usuario realizar una determinada tarea;
  • Sistemas expertos: un programa de computadora que tiene reglas codificadas para emular el proceso humano de toma de decisiones. Los sistemas difusos son un ejemplo específico de sistemas basados ​​en reglas que mapean variables en un continuo de valores entre 0 y 1, contrario a la lógica digital tradicional que resulta en un resultado 0/1;
  • Visión por computadora (CV): métodos para adquirir y dar sentido a las imágenes digitales (generalmente divididas en reconocimiento de actividades, reconocimiento de imágenes y visión artificial);
  • Procesamiento de lenguaje natural (PNL): subcampo que maneja datos de lenguaje natural (tres bloques principales pertenecen a este campo, es decir, comprensión del lenguaje, generación de lenguaje y traducción automática);
  • Redes neuronales (NN o ANN): una clase de algoritmos modelados libremente a partir de la estructura neuronal del cerebro humano / animal que mejora su rendimiento sin recibir instrucciones explícitas sobre cómo hacerlo. Las dos principales y subclases conocidas de NN son Deep Learning (una red neuronal con múltiples capas) y Redes Adversarias Generativas (GAN, dos redes que se entrenan entre sí);
  • Sistemas autónomos: subcampo que se encuentra en la intersección entre la robótica y los sistemas inteligentes (por ejemplo, percepción inteligente, manipulación de objetos diestros, control de robot basado en planes, etc.);
  • Inteligencia Artificial Distribuida (DAI): una clase de tecnologías que resuelven problemas al distribuirlos a "agentes" autónomos que interactúan entre sí. Los sistemas de múltiples agentes (MAS), el modelado basado en agentes (ABM) y la inteligencia de enjambre son tres especificaciones útiles de este subconjunto, donde los comportamientos colectivos surgen de la interacción de agentes autoorganizados descentralizados;
  • Computación afectiva: un subcampo que se ocupa del reconocimiento, interpretación y simulación de emociones;
  • Algoritmos evolutivos (EA): es un subconjunto de un dominio informático más amplio llamado computación evolutiva que utiliza mecanismos inspirados en la biología (por ejemplo, mutación, reproducción, etc.) para buscar soluciones óptimas. Los algoritmos genéticos son el subgrupo más utilizado de EA, que son heurísticas de búsqueda que siguen el proceso de selección natural para elegir la solución candidata "más adecuada";
  • Programación lógica inductiva (ILP): subcampo que utiliza lógica formal para representar una base de datos de hechos y formular hipótesis derivadas de esos datos;
  • Decision Networks: es una generalización de las redes / inferencias bayesianas más conocidas, que representan un conjunto de variables y sus relaciones probabilísticas a través de un mapa (también llamado gráfico acíclico dirigido);
  • Programación probabilística: un marco que no te obliga a codificar variables específicas sino que funciona con modelos probabilísticos. La Síntesis del Programa Bayesiano (BPS) es de alguna manera una forma de programación probabilística, donde los programas bayesianos escriben nuevos programas bayesianos (en lugar de que los humanos lo hagan, como en el enfoque de programación probabilística más amplio);
  • Inteligencia ambiental (AmI): un marco que exige dispositivos físicos en entornos digitales para sentir, percibir y responder con conciencia de contexto a un estímulo externo (generalmente desencadenado por una acción humana).

Para resolver un problema específico, puede seguir uno o más enfoques, lo que a su vez significa una o más tecnologías, dado que muchas de ellas no son mutuamente excluyentes sino más bien complementarias.

Finalmente, hay otra clasificación relevante que no he incluido en el gráfico anterior (es decir, los diferentes tipos de análisis) pero que vale la pena mencionar por razones de integridad. En realidad, puede encontrar cinco tipos distintos de análisis: análisis descriptivo (lo que sucedió); análisis de diagnóstico (por qué sucedió algo); análisis predictivo (lo que va a suceder); análisis prescriptivo (acciones recomendadas); y análisis automatizado (realizar acciones automáticamente). También podría verse tentado a usarlo para clasificar de alguna manera las tecnologías anteriores, pero la realidad es que esta es una clasificación funcional y un proceso en lugar de uno de producto; en otras palabras, cada tecnología en el espectro puede cumplir esas cinco funciones analíticas .

III. Conclusión

Enseñar a las computadoras cómo aprender sin la necesidad de ser programado explícitamente es una tarea difícil que involucra varias tecnologías para lidiar con múltiples matices, y aunque este mapa está lejos de ser perfecto, es al menos un primer intento de darle sentido a un paisaje desordenado como el de la inteligencia artificial.

Soy perfectamente consciente de que aquí surge un fuerte principio de Pareto, es decir, que el 80% (si no más) de los esfuerzos y resultados actuales son impulsados ​​por el 20% de las tecnologías representadas en el mapa (a saber, aprendizaje profundo, PNL y computadora visión), pero también estoy seguro de que tener un espectro completo podría ayudar a los investigadores, nuevas empresas e inversores.

Además de intentar incrustar y considerar los comentarios y comentarios sobre esta primera versión, planeo dar dos pasos más en el futuro: uno es crear una capa para el tipo de desafíos que enfrenta la IA (por ejemplo, problemas de memoria y olvidos catastróficos, transferir el aprendizaje, aprender de menos datos con cosas como cero y aprendizaje de una sola vez, etc.) y qué tecnología se puede utilizar para superar ese problema específico. En segundo lugar, tratar de aplicar lentes para observar las diferentes tecnologías y no los problemas que están resolviendo, sino los que están creando (por ejemplo, problemas éticos, problemas de uso intensivo de datos, problemas de caja negra y explicabilidad, etc.).

Si tiene algún comentario sobre cómo mejorar el trabajo existente o sugerencias sobre cómo incorporar esos dos pasos adicionales, ¡comuníquese!

Y si usted es una empresa que trabaja con cualquiera de las tecnologías mencionadas anteriormente, me encantaría saber más de usted.

Divulgación: El mapa de conocimiento de IA se desarrolló con la consultora de innovación estratégica Axilo, para actividades en su plataforma Chôra.

Referencias

Agrawal, A., Gans, J., Goldfarb, A. (2018). "Máquinas de predicción: la economía simple de la inteligencia artificial". Harvard Business Review Press.

Domingos, P. (2015). "El algoritmo maestro: cómo la búsqueda de la máquina de aprendizaje definitiva reconquistará nuestro mundo". Nueva York: Libros básicos.