IA = Automatizar lo inefable

En este video de apenas cinco minutos, Cassie Kozyrkov resume en qué consiste la Inteligencia Artificial (IA) en solo tres palabras: automatizar lo inefable (en inglés, Automating the Ineffable*). Este lema, al más puro estilo Less is More de Mies Van der Rohe, me parece que condensa como ninguna otra definición qué es la IA.

Está claro que automatizar tiene que estar presente, de alguna u otra manera, en una definición sobre la IA. La A de artificial recoge la aspiración de crear una inteligencia escapando de los métodos naturales. La automatización sería el proceso de describir computacionalmente los procesos cognitivos necesarios para construir esa inteligencia artificial. ¿Pero cómo vamos a describir algorítmicamente los procesos mentales si no somos capaces de explicarlos? Y aquí entra la segunda parte de la definición: lo inefable.

Efectivamente, la inteligencia, o más concretamente lo que llamamos mente o consciencia, es inefable (al menos a día de hoy). En palabras de Patricia Tezanos tenemos dos grandes problemas para explicar que es la consciencia: uno suave y otro duro. El problema suave (soft problem) es que ignoramos cómo trabaja el cerebro para hacer emerger la consciencia. El problema duro (hard problem) es que no sabemos cómo a partir de algo material y objetivo como el cerebro aparece algo inmaterial y subjetivo como la mente, esto es, cómo a partir del mundo material surge el mundo de las ideas. Este segundo problema va más allá del aspecto funcional, y plantea una cuestión que se sitúa en la frontera de lo que podemos conocer científicamente**.

Si la IA pretende emular la inteligencia humana, y no somos capaces de explicar en qué consiste ni cómo funciona, entonces necesitamos algoritmos que imiten el comportamiento sin necesidad de entenderlo. Aquí entra en juego el aprendizaje automático (en inglés, machine learning) que se basa en codificar con ejemplos lo que un programador no puede expresar con reglas. De esta manera, no es preciso entender cómo funciona el cerebro para poder describir el comportamiento del mismo. Los algoritmos se entrenan con ejemplos de entradas y respuestas correctas, y son capaces de aprender un modelo que aprenden los patrones que asocian las entradas a las respuestas. Este podría ser el caso de un clasificador de correo indeseado (spam) que ha sido entrenado con ejemplos de correos válidos y correos basura. Cuando llega un nuevo correo es capaz de asignarle la etiqueta correcta (o al menos la mayor parte de las veces).

Volviendo a la definición de qué la IA consiste en automatizar lo inefable, de ésta se desprende que el concepto de IA explicable (XIA, en inglés Explainable AI)  es un oxímoron. Si es una IA,  no puede explicarse por la propia definición. Así, se establece una condición necesaria para poder referirse a un sistema como inteligente. Un algoritmo que permita explicar la decisión que ha tomado no puede ser inteligente, de la misma manera, la inteligencia natural no puede explicar cómo toma las decisiones. En concreto, un sistema implementado con una regresión lineal o logística, o un árbol de decisión no deberíamos llamarlo IA.

Esta definición impacta sobre aspectos éticos de profundo calado. Por ejemplo, en la carta de Derechos Digitales se establece el derecho a qué los sistemas de IA aseguren su transparencia, auditabilidad, explicabilidad y trazabilidad. Este derecho colisiona con la propia definición que estamos discutiendo. Si la toma de decisiones de los sistemas IA no es explicable, como vamos a garantizar la explicabilidad. En cambio, sí que aplica a otro tipo de sistemas basados en técnicas que por su simplicidad permiten una explicación transparente y clara de en qué han basado su decisión. 

Creo que estamos lejos de construir una IA general capaz de emular la inteligencia humana***. En este camino resolvemos tareas parciales y muy específicas en las que imitamos el comportamiento humano. IA es un término extremadamente ambicioso que requiere contextualizarlo a las tecnologías que disponemos actualmente si no queremos devaluarlo. No todos los sistemas basados en algoritmos de aprendizaje automático merecen esa denominación, lo cual no significa que los algoritmos más sencillos sean inútiles. Al contrario suelen ser una gran solución de compromiso en la mayoría de los casos reales donde no tiene por qué ser necesario incluir una IA. 

Por último, hay que tener en cuenta que los algoritmos resuelven las tareas de manera radicalmente distinta al ser humano. Se basan en formulación matemática que es más compleja cuanto más se asemeja la tarea a lo que entendemos por IA. En este punto de sofisticación, no es que no se pueda explicar cómo toman decisiones los algoritmos, es que nadie entiende la explicación. Es comprensible la preocupación de la sociedad por las implicaciones que conlleva convivir con sistemas artificiales que toman decisiones de manera autónoma. Ahora bien, me temo que a medida que incrementemos la complejidad de estos sistemas, la confianza que depositemos en los mismos pasará por tener sistemas ultra-probados, que garantizen que funcionen en la inmensa mayoría de las situaciones, más que disponer de manuales de cómo funcionan super detallados.

* Fijaos que las siglas en inglés de Artificial Intelligence (AI) se pueden utilizar como regla nemotécnica de la propia definición Automating the Ineffable (AI).

** Depende de a quién le preguntes te dirá que está a un lado u otro de la frontera.

*** A día de hoy dudo que podamos construir una inteligencia artificial general, o al menos, yo no veo que se esté siguiendo un plan claro que asegure un éxito a medio o largo plazo.

Influir en Europa: Por una Europa Adaptada a la Era Digital en la Fundación Carlos de Amberes

El pasado 21 de Septiembre participe en las jornadas organizadas por la Fundación Carlos de Amberes tituladas “Diálogos sobre la digitalización en el futuro de Europa.”

Derivado de esta participación escribí la siguiente reflexión: Herramientas colaborativas en una Europa Digital.

La intervección ha quedado recogida en este video:

También os dejo la transcripción de la intervección:

Mientras preparaba esta intervención, por raro que os suene, me vino a la cabeza la figura de Denis Diderot, el gran escritor, filósofo y enciclopedista francés de la Ilustración, autor junto con d’Alembert de la “Enciclopedia”, su obra magna compuesta por 72 000 artículos. En este 2021 se cumplen 20 años desde que comenzó su andadura la Wikipedia. Actualmente recopila el saber humano en alrededor de 57 millones de artículos escritos en más de 300 idiomas, y se encuentra entre los 15 sitios más visitados de Internet. Creo que Diderot se sentiría orgulloso de este logro sin precedentes creado gracias al esfuerzo colaborativo de millones de personas que han aportado su granito de arena en forma de conocimiento y tiempo.

Sin duda, herramientas que tomen como modelo a la Wikipedia están dentro de las que me gustaría tener para la Europa Digital del futuro. Un ágora digital, como comentaba Daniel Inneratity, que permita coordina a los ciudadanos para poder resolver problemas reales, que fomente un uso creativo de las mismas, que habilite la discusión, agregue opiniones, y permita analizar y sintetizar conclusiones de millones de usuarios. Herramientas que canalicen el excedente cognitivo del que nos habla Clark Shirky. En sus propias palabras, una de las cosas que hace que la época actual sea notable es que ahora podemos tratar el tiempo libre como un activo social que puede aprovecharse para grandes proyectos creados en común, en lugar de como un conjunto de minutos individuales que se pierden de uno en uno.

Por otro lado, creo que la Inteligencia Artificial abre una ventana de oportunidades para impulsar el desarrollo de servicios digitales que permitan mejorar la calidad de vida de los ciudadanos, la productividad de las empresas y la eficiencia de las administraciones como exponía Lucía Velasco. Aquí encontramos aplicaciones que impactan en una mejor atención sanitaria, en una fabricación y distribución más eficientes, en una producción agrícola más adaptada al cambio climático, en mejores servicios públicos, como la gestión del reciclaje, un transporte más seguro y limpio, y un consumo y producción de energía más barata y sostenible.

Especial atención adquieren los datos como principal combustible de la IA, la economía del dato a la que apelaba Andrés Ortega. Necesitamos datos abiertos de calidad, accesibles, y que se mantengan actualizados, así como seguir impulsando un marco ético y regulatorio que nos permita trabajar con datos de carácter personal con todas las garantías para el ciudadano que nos comentaba Noemí Brito. Esta transformación tiene que regirse, tal como establece la propia Unión Europea, dotándonos de sistemas de IA que sean seguros, transparentes, éticos e imparciales y que estén bajo el control humano. En definitiva, una IA fiable y centrada en las personas que nos introducía Lina Gálvez en su transformación justa.

Este camino no se puede recorrer con el sector privado y el sector público andando cada uno por su cuenta. Necesitamos una mayor colaboración público-privada en la línea que propone la economista Mariana Mazzucato, y que ya se ha iniciado desde el gobierno de España con programas como Misiones Ciencia e Innovación. Pero también mejorar herramientas de contratación como la Compra Pública Innovadora, disponible pero actualmente infrautilizada.

Finalmente, me gustaría señalar que esta nueva Europa Digital no está exenta de riesgos generados por las propias tecnologías. Sin duda son importantes todas aquellas amenazas que atenten contra la privacidad y propiedad de los datos, aunque mi mayor preocupación es la difusión de la desinformación, en particular, por agentes externos que tienen como objetivo minar los valores europeos, las instituciones y los sistemas democráticos en línea que han comentado Nacho Torreblanca, Manuela Battaglini y Daniel Inneratity. Tiene que ser una prioridad para Europa contrarrestar la desinformación y garantizar la libertad de expresión, los debates democráticos pluralistas e inclusivos y la libertad de los medios de comunicación.

Gracias

Pablo A. Haya Coll ~ Septiembre 2021

Nuevo artículo: ¿Cómo se difunden las noticias falsas?

Cada vez es más complicado discernir lo real de lo ficticio, la verdad de la mentira. Y no nos lo ponen fácil como estamos viendo durante la crisis sanitaria que nos está tocando vivir. No es de extrañar que el pensamiento crítico sea una de las competencias claves de este siglo XXI. Cultivar ese pensamiento requiere conocer los mecanismos que nos dificultan separar hechos de opiniones, que camuflan lo falso como verdadero, o que amplifican artificialmente la mentira.

En el siguiente artículo resumo cómo se difunden las noticias falsas, una amenaza seria a nuestra convivencia en la que intervienen bots, inteligencia artificial y nuestro propio cerebro. Este artículo ha sido publicado en el número especial de la revista BIT del Colegio Oficial de Ingenieros de Telecomunicación que conmemora la cien años de vida del título de Ingenierio de Telecomunicación.

Adicionalmente, el blog del IIC ha publicado una versión extendida del artículo anterior dividia en las siguientes dos entradas:

Finalmente, mi compañero Alejandro Vaca escribió una entrada intímamente relacionada sobre las tecnologías de Procesamiento de Lenguaje Natural que se emplean en la generación de noticias falsas.

Nueva ponencia en «V Congreso Nacional de Registradores 2019»

El pasado viernes 4 de octubre participe en una mesa redonda en el V Congreso Nacional de Registradores dentro del bloque de “AI & Data Analytics” donde se debatió las enormes posibilidades que aportan estas tecnologías a los servicios que prestan los Registros.

Mi aportación estuvo centrada en presentar las técnicas de aprendizaje automático (machine learning) como aliadas para las labores de los registradores, así como explicar el proceso que supone desarrollar una aplicación basada en machine learning, y las diferencisa sustanciales que hay con el proceso tradicional de desarrollo software.

En el blog del IIC puedes encontrar un resumen de la ponencia, y en la siguiente publicación un resumen de todo el congreso.