La inteligencia artificial (IA) generalmente se define como la ciencia que hace que las computadoras hagan cosas que requieren inteligencia cuando las hacen los humanos.

La IA ha tenido cierto éxito en dominios limitados o simplificados.

Sin embargo, las cinco décadas transcurridas desde el inicio de la IA han traído solo un progreso muy lento, y el optimismo inicial sobre el logro de la inteligencia a nivel humano ha dado paso a una apreciación de la profunda dificultad del problema.

¿Qué es la inteligencia?

El comportamiento humano bastante simple puede ser inteligente, pero el comportamiento bastante complejo realizado por los insectos no es inteligente. ¿Cuál es la diferencia? Considere el comportamiento de la avispa excavadora, Sphex ichneumoneus.

Cuando la avispa hembra trae comida a su madriguera, la deposita en el umbral, entra en la madriguera para comprobar si hay intrusos y luego, si la costa está despejada, lleva la comida.

La naturaleza poco inteligente del comportamiento de la avispa se revela si el experimentador que observa mueve la comida unos centímetros mientras la avispa está dentro de la madriguera comprobando. Al salir, la avispa repite todo el procedimiento: vuelve a llevar la comida hasta el umbral, entra a mirar alrededor y sale.

Se le puede hacer repetir este ciclo de comportamiento hasta cuarenta veces seguidas. La inteligencia, notoriamente ausente en el caso de Sphex , es la capacidad de adaptar el comportamiento de uno para adaptarse a nuevas circunstancias.

El pensamiento convencional en psicología considera la inteligencia humana no como una sola habilidad o proceso cognitivo, sino como un conjunto de componentes separados.

La investigación en IA se ha centrado principalmente en los siguientes componentes de la inteligencia: aprendizaje, razonamiento, resolución de problemas, percepción y comprensión del lenguaje.

Aprendizaje

El aprendizaje se distingue en varias formas diferentes. El más simple es aprender por ensayo y error. Por ejemplo, un programa simple para resolver problemas de ajedrez de mate en uno podría probar movimientos al azar hasta encontrar uno que logre el mate.

El programa recuerda el movimiento exitoso y la próxima vez que la computadora enfrenta el mismo problema, puede producir la respuesta de inmediato. La simple memorización de elementos individuales (soluciones a problemas, palabras de vocabulario, etc.) se conoce como aprendizaje de memoria.

El aprendizaje de memoria es relativamente fácil de implementar en una computadora. Más desafiante es el problema de implementar lo que se llama generalización.

El aprendizaje que involucra la generalización permite que el alumno se desempeñe mejor en situaciones que no había encontrado antes.

Un programa que aprende tiempos pasados de verbos regulares en inglés de memoria no podrá producir el tiempo pasado de, por ejemplo, “jump” hasta que se presente al menos una vez con “jumped”, mientras que un programa que pueda generalizar a partir de ejemplos puede aprender ” add-ed” y así formar el tiempo pasado de “jump” en ausencia de cualquier encuentro previo con este verbo.

Las técnicas modernas y sofisticadas permiten que los programas generalicen reglas complejas a partir de los datos.

Razonamiento

Razonar es sacar inferencias apropiadas a la situación en cuestión. Las inferencias se clasifican en deductivas o inductivas. Un ejemplo de lo primero es “Fred está en el museo o en el café; no está en el café; entonces está en el museo” y del segundo “Accidentes anteriores como este han sido causados por fallas en los instrumentos; así que probablemente este fue causado por una falla del instrumento”.

La diferencia entre los dos es que en el caso deductivo, la verdad de las premisas garantiza la verdad de la conclusión, mientras que en el caso inductivo, la verdad de la premisa apoya la conclusión de que el accidente fue causado por la falla del instrumento, pero sin embargo, una mayor investigación podría revelar que, a pesar de la verdad de la premisa, la conclusión es de hecho falsa.

Ha habido un éxito considerable en la programación de computadoras para sacar inferencias, especialmente inferencias deductivas.

Sin embargo, no se puede decir que un programa razona simplemente en virtud de poder sacar inferencias. El razonamiento implica sacar inferencias que son relevantes para la tarea o situación en cuestión.

Uno de los problemas más difíciles que enfrenta la IA es el de dar a las computadoras la capacidad de distinguir lo relevante de lo irrelevante.

resolución de problemas

Los problemas tienen la forma general: dados tales y tales datos, encuentre x. En la IA se aborda una gran variedad de tipos de problemas.

Algunos ejemplos son: encontrar jugadas ganadoras en juegos de mesa; identificar personas a partir de sus fotografías; y planificar una serie de movimientos que permitan a un robot realizar una tarea determinada.

Los métodos de resolución de problemas se dividen en de propósito especial y de propósito general. Un método de propósito especial está hecho a medida para un problema en particular y, a menudo, explota características muy específicas de la situación en la que está inmerso el problema.

Un método de propósito general es aplicable a una amplia gama de problemas diferentes. Una técnica de propósito general utilizada en IA es el análisis de medios y fines que implica la reducción paso a paso de la diferencia entre el estado actual y el estado objetivo.

El programa selecciona acciones de una lista de medios, que en el caso de, digamos, un robot simple, podría consistir en recoger, dejar, avanzar, retroceder, mover a la izquierda y mover a la derecha, hasta que el estado actual se transforma en el estado objetivo. .

Percepción

En la percepción, el entorno se explora por medio de varios órganos de los sentidos, reales o artificiales, y los procesos internos del perceptor analizan la escena en objetos y sus características y relaciones.

El análisis se complica por el hecho de que un mismo objeto puede presentar muchas apariencias diferentes en diferentes ocasiones, según el ángulo desde el que se mire, si partes de él proyectan o no sombras, etc.

En la actualidad, la percepción artificial está lo suficientemente avanzada como para permitir que un dispositivo autocontrolado similar a un automóvil conduzca a velocidades moderadas en la carretera, y que un robot móvil deambule por un conjunto de oficinas ocupadas en busca y limpieza de latas de refresco vacías.

Uno de los primeros sistemas para integrar la percepción y la acción fue Freddy, un robot estacionario con un ‘ojo’ de TV en movimiento y una ‘mano’ de pinza (construido en la Universidad de Edimburgo durante el período 1966-1973 bajo la dirección de Donald Michie).

FREDDY pudo reconocer una variedad de objetos y se le pudo indicar que ensamblara artefactos simples, como un automóvil de juguete, a partir de un montón aleatorio de componentes.

Comprensión del lenguaje

Una lengua es un sistema de signos que tienen significado por convención. Las señales de tráfico, por ejemplo, forman un mini-lenguaje, siendo una cuestión de convención que, por ejemplo, la señal de peligro adelante significa peligro adelante.

Este significado por convención que es distintivo del lenguaje es muy diferente de lo que se denomina significado natural, ejemplificado en afirmaciones como ‘Esas nubes significan lluvia’ y ‘La caída de presión significa que la válvula no funciona bien’.

Una característica importante de los lenguajes humanos completos, como el inglés, que los distingue de, por ejemplo, los cantos de pájaros y los sistemas de señales de tráfico, es su productividad . Un lenguaje productivo es aquel que es lo suficientemente rico como para permitir que se formulen dentro de él un número ilimitado de oraciones diferentes.

Es relativamente fácil escribir programas de computadora que sean capaces, en contextos severamente restringidos, de responder en inglés, aparentemente con fluidez, a preguntas y afirmaciones, por ejemplo, los programas Parry y Shrdlu descritos en la sección Primeros programas de IA. Sin embargo, ni Parry ni Shrdlu entienden el lenguaje.

Una computadora debidamente programada puede usar un lenguaje sin comprenderlo, en principio, incluso hasta el punto en que el comportamiento lingüístico de la computadora es indistinguible del de un hablante humano nativo del idioma.

Entonces, ¿qué está involucrado en la comprensión genuina, si una computadora que usa el lenguaje de manera indistinguible de un hablante humano nativo no necesariamente entiende?

No existe una respuesta universalmente aceptada para esta difícil pregunta.

De acuerdo con una teoría, que uno entienda o no depende no sólo de su comportamiento sino también de su historia: para que se diga que entiende uno debe haber aprendido el idioma y haber sido entrenado para ocupar su lugar en la comunidad lingüística por medio de interacción con otros usuarios de la lengua.

IA fuerte, IA aplicada y simulación cognitiva

La investigación en IA se divide en tres categorías: IA “fuerte”, IA aplicada y simulación cognitiva o CS.

La IA fuerte tiene como objetivo construir máquinas cuya capacidad intelectual general sea indistinguible de la de un ser humano. Joseph Weizenbaum, del Laboratorio de IA del MIT, ha descrito que el objetivo final de la IA fuerte es “nada menos que construir una máquina en el modelo del hombre, un robot que va a tener su infancia, aprender el lenguaje como lo hace un niño, adquirir su conocimiento del mundo sintiéndolo a través de sus propios órganos y, en última instancia, contemplar todo el dominio del pensamiento humano”.

El término “IA fuerte”, ahora de uso generalizado, fue introducido para esta categoría de investigación de IA en 1980 por el filósofo John Searle, de la Universidad de California en Berkeley.

Algunos creen que el trabajo en IA fuerte eventualmente conducirá a computadoras cuya inteligencia supere en gran medida a la de los seres humanos.

Edward Fredkin, también del MIT AI Lab, ha sugerido que tales máquinas “podrían tenernos como mascotas”.

La IA fuerte ha llamado la atención de los medios, pero de ninguna manera todos los investigadores de IA consideran que valga la pena seguir con la IA fuerte.

El excesivo optimismo de las décadas de 1950 y 1960 con respecto a la IA fuerte ha dado paso a una apreciación de la extrema dificultad del problema, que es posiblemente el más difícil que la ciencia jamás haya abordado.

Hasta la fecha, el progreso ha sido escaso. Algunos críticos dudan de que la investigación en las próximas décadas produzca incluso un sistema con la capacidad intelectual general de una hormiga.

El excesivo optimismo de las décadas de 1950 y 1960 con respecto a la IA fuerte ha dado paso a una apreciación de la extrema dificultad del problema, que es posiblemente el más difícil que la ciencia jamás haya abordado.

Hasta la fecha, el progreso ha sido escaso. Algunos críticos dudan de que la investigación en las próximas décadas produzca incluso un sistema con la capacidad intelectual general de una hormiga.

El excesivo optimismo de las décadas de 1950 y 1960 con respecto a la IA fuerte ha dado paso a una apreciación de la extrema dificultad del problema que es posiblemente el más difícil que la ciencia jamás haya abordado. Hasta la fecha, el progreso ha sido escaso.

Algunos críticos dudan de que la investigación en las próximas décadas produzca incluso un sistema con la capacidad intelectual general de una hormiga.

La IA aplicada, también conocida como procesamiento de información avanzado, tiene como objetivo producir sistemas “inteligentes” comercialmente viables, como por ejemplo, un sistema de seguridad que pueda reconocer los rostros de las personas a las que se les permite ingresar a un edificio en particular.

La IA aplicada ya ha disfrutado de un éxito considerable. En este artículo se describen varios sistemas aplicados.

En la simulación cognitiva, las computadoras se usan para probar teorías sobre cómo funciona la mente humana; por ejemplo, teorías sobre cómo reconocemos rostros y otros objetos o sobre cómo resolvemos problemas abstractos (como el problema de los “misioneros y caníbales” que se describe más adelante).

La teoría que se va a probar se expresa en forma de un programa de computadora y el desempeño del programa en la tarea, por ejemplo, reconocimiento facial, se compara con el de un ser humano.

Las simulaciones por computadora de redes de neuronas han contribuido tanto a la psicología como a la neurofisiología (parte de este trabajo se describe en la sección Conexionismo ).

El programa Parry, que se describe a continuación, fue escrito para probar una teoría particular sobre la naturaleza de la paranoia. Los investigadores en psicología cognitiva suelen ver a la CS como una herramienta poderosa.

Alan Turing y los orígenes de la Inteligencia Artificial

El primer trabajo sustancial en el campo fue realizado por el lógico británico y pionero informático Alan Mathison Turing.

En 1935, en la Universidad de Cambridge, Turing concibió la computadora moderna. Describió una máquina de computación abstracta que consiste en una memoria ilimitada y un escáner que se mueve de un lado a otro a través de la memoria, símbolo por símbolo, leyendo lo que encuentra y escribiendo más símbolos.

Las acciones del escáner están dictadas por un programa de instrucciones que también se almacena en la memoria en forma de símbolos. Este es el “concepto de programa almacenado” de Turing, e implícito en él está la posibilidad de que la máquina opere y por lo tanto, modifique o mejore su propio programa.

La máquina informática de Turing de 1935 ahora se conoce simplemente como la máquina universal de Turing. Todas las computadoras modernas son, en esencia, máquinas de Turing universales.

Durante la Segunda Guerra Mundial, Turing fue un importante criptoanalista en la Government Code and Cypher School, Bletchley Park (donde los aliados pudieron decodificar una gran proporción de las comunicaciones por radio de la Wehrmacht).

Turing no pudo dedicarse al proyecto de construir una máquina informática electrónica de programa almacenado hasta el cese de las hostilidades en Europa en 1945.

Sin embargo, durante los años de la guerra, pensó mucho en el tema de la inteligencia artificial. Los colegas de Bletchley Park recuerdan numerosas discusiones con él fuera de servicio sobre el tema, y ​​en un momento Turing hizo circular un informe escrito a máquina (ahora perdido) que exponía algunas de sus ideas.

Uno de estos colegas, Donald Michie (quien más tarde fundó el Departamento de Inteligencia y Percepción de Máquinas en la Universidad de Edimburgo), recuerda Turing hablando a menudo sobre la posibilidad de que las máquinas informáticas aprendan de la experiencia y resuelvan problemas mediante la búsqueda en el espacio de posibles soluciones, guiadas por principios empíricos.

El término moderno para la última idea es “búsqueda heurística”, una heurística es cualquier principio de regla empírica que reduce la cantidad de búsqueda requerida para encontrar la solución a un problema.

La programación mediante heurística es una parte importante de la IA moderna, al igual que el área que ahora se conoce como aprendizaje automático. una heurística es cualquier principio de regla empírica que reduce la cantidad de búsqueda necesaria para encontrar la solución a un problema.

La programación mediante heurística es una parte importante de la IA moderna, al igual que el área que ahora se conoce como aprendizaje automático una heurística es cualquier principio de regla empírica que reduce la cantidad de búsqueda necesaria para encontrar la solución a un problema.

La programación mediante heurística es una parte importante de la IA moderna, al igual que el área que ahora se conoce como aprendizaje automático.

En Bletchley Park, Turing ilustró sus ideas sobre la inteligencia artificial con referencia al ajedrez. (Desde entonces, el ajedrez y otros juegos de mesa se han considerado como un banco de pruebas importante para las ideas en IA, ya que son una fuente útil de problemas desafiantes y claramente definidos contra los cuales se pueden probar los métodos propuestos para la resolución de problemas).

Una computadora que juega al ajedrez podría jugar buscando exhaustivamente entre todos los movimientos disponibles, pero en la práctica esto es imposible, ya que implicaría examinar una cantidad astronómicamente grande de movimientos. Las heurísticas son necesarias para guiar y acotar la búsqueda.

Michie recuerda que Turing experimentó con dos heurísticas que luego se volvieron comunes en IA, minimax y mejor primero.. La heurística minimax (descrita por el matemático John von Neumann en 1928) implica asumir que el oponente se moverá de tal manera que maximice sus ganancias; luego, uno hace su propio movimiento de tal manera que minimiza las pérdidas causadas por el movimiento esperado del oponente.

La heurística de mejor primero implica clasificar los movimientos disponibles para uno por medio de un sistema de puntuación de regla empírica y examinar primero las consecuencias del movimiento con la puntuación más alta.

En Londres, en 1947, Turing pronunció lo que fue, hasta donde se sabe, la primera conferencia pública en mencionar la inteligencia informática, diciendo:

“Lo que queremos es una máquina que pueda aprender de la experiencia”, y agregó que la “posibilidad de dejar que la máquina altere su propias instrucciones proporciona el mecanismo para ello”.

En 1948 escribió (pero no publicó) un informe titulado “Maquinaria inteligente”.

Este fue el primer manifiesto de la IA y en él Turing introdujo brillantemente muchos de los conceptos que luego se convertirían en centrales, en algunos casos después de que otros los reinventaran. Uno de ellos fue el concepto de “entrenar” una red de neuronas artificiales para realizar tareas específicas.

En 1950, Turing introdujo la prueba de inteligencia informática que ahora se conoce simplemente como la prueba de Turing.. Esto involucra a tres participantes, la computadora, un interrogador humano y un “contrapunto” humano.

El interrogador intenta determinar, haciendo preguntas a los otros dos participantes, cuál es la computadora. Toda la comunicación es vía teclado y pantalla. El interrogador puede hacer preguntas tan penetrantes y amplias como desee y la computadora puede hacer todo lo posible para forzar una identificación incorrecta. (Entonces, la computadora podría responder “No” en respuesta a “¿Eres una computadora?” y podría seguir una solicitud para multiplicar un número grande por otro con una larga pausa y una respuesta incorrecta).

El florete debe ayudar al interrogador a hacer una pregunta. identificación correcta.

Varias personas diferentes desempeñan los papeles de interrogador y frustrante, y si suficientes interrogadores son incapaces de distinguir la computadora del ser humano, entonces (según los defensores de la prueba) se debe concluir que la computadora es una entidad inteligente y pensante. En 1991, el empresario de Nueva York Hugh Loebner inició la competencia anual del Premio Loebner, ofreciendo un premio de $100,000 para el primer programa de computadora que pasara la prueba de Turing (con $2,000 otorgados cada año por el mejor esfuerzo).

Sin embargo, hasta ahora ningún programa de IA se ha acercado a pasar una prueba de Turing sin diluir.

En 1951 Turing dio una conferencia sobre inteligencia artificial en la radio británica y en 1953 publicó uno de sus primeros artículos clásicos sobre programación de ajedrez . Tanto durante como después de la guerra, Turing experimentó con rutinas mecánicas para jugar al ajedrez. (Uno se llamaba Turochamp.)

En ausencia de una computadora para ejecutar su programa de ajedrez heurístico, Turing simuló el funcionamiento del programa a mano, usando papel y lápiz. ¡El juego fue pobre!

Los primeros programas verdaderos de IA tuvieron que esperar la llegada de las computadoras digitales electrónicas con programas almacenados.