IA compatible con lo humano. La visión de Stuart Russell y el CHAI
Ubicado en la Universidad de California en Berkeley, el Centro para la IA Compatible con lo Humano (CHAI, por sus siglas en inglés), está dedicado al desarrollo de medios conceptuales y técnicos orientados a garantizar que el diseño de máquinas impulsadas por IA se encuentre alineado con objetivos humanos y genere resultados benéficos.
Compatibilidad vs impredecibilidad
Fundado en 2016 por Stuart Russell, investigador en Inteligencia Artificial y destacado asesor sobre el tema para Naciones Unidas y el Foro Económico Mundial, el CHAI tiene como objetivo a largo plazo reenfocar la Inteligencia Artificial para lograr que las máquinas cada vez más inteligentes no ofrezcan soluciones impredecibles y potencialmente perniciosas. Para ello, el centro toma como base de sus investigaciones el concepto de Compatibilidad Humana, entendida como la capacidad de transitar desde una IA que logre objetivos arbitrarios a una cuyo comportamiento sea benéfico para la sociedad al incorporar a su ontología (conceptos, relaciones, atributos y restricciones que permiten su operación) un carácter eminentemente humano.
Principios de la Compatibilidad Humana
Desarrollado en su obra “Human Compatible: Artificial Intelligence and the Problem of Control” (2019) el concepto de Compatibilidad Humana de Russell descansa en cinco ideas fundamentales:
- El problema de la Inteligencia Artificial no es que opere con malicia, sino que no está necesariamente alineada con objetivos humanos. El riesgo que implica la IA no es que se independice y se vuelva contra nosotros como lo señalan los seriales literarios y cinematográficos; por el contrario, el riesgo radica en que ejecuta exactamente lo que le pedimos, aunque estos requerimientos que le proporcionamos no necesariamente reflejen nuestros mejores deseos o valores humanos.
- El paradigma de la IA basado en el cumplimiento de objetivos fijos es peligroso. Los seres humanos poseemos la capacidad de modificar nuestros objetivos conforme vamos evaluando si se encuentran bien planteados o resultan convenientes. Una IA sin esa capacidad de evaluar sus metas y someter a juicio sus repercusiones, ya sean actuales o futuras, puede ocasionar daños colaterales indeseables.
- La IA debe estar encaminada a la realización máxima de la satisfacción humana bajo la premisa de que desconoce nuestros objetivos, pero puede aprender de nuestro comportamiento. Si los deseos humanos son reconocidos por la IA como desconocidos e indescifrables, la máquina inteligente deberá observar y aprender la conducta humana para adaptar su operación a ella bajo el principio de aprendizaje por reforzamiento inverso: “no entiendo por completo lo que es mejor y deseable para los humanos, pero debo ayudarlos”.
- Se requiere de una ética diseñada para máquinas superinteligentes. En un escenario futuro en el que la IA produzca máquinas cuya inteligencia escape al control humano, se requiere de una ética autodirigida que opere bajo tres preceptos:
- Humildad – la máquina es capaz de reconocer su ignorancia.
- Supervisión – la máquina, en consecuencia, acepta la corrección humana
- Aprendizaje – la máquina aprende los valores y criterios humanos, aunque nunca tiene certeza de conocerlos por completo o para siempre.
- La Inteligencia Artificial puede promover desigualdad, desplazamiento laboral y riesgos geopolíticos. En el escenario actual, la IA está otorgando poder a quienes la controlan sin que estos individuos, grupos o instancias de poder se encuentren restringidos legal o éticamente. Por ello, dado que nunca se podrá confiar en la no maleficencia de quienes controlen la IA, esta debe controlarse a sí misma incorporando desde su diseño, sea por alimentación o aprendizaje, las preferencias y valores humanos.
La Super-Inteligencia Artificial del futuro
La investigación sobre Inteligencia Artificial no sólo compete al ámbito de la ingeniería o la informática, desde la visión de Russell, es una labor técnica pero también conceptual que demanda la participación de las ciencias sociales, la ética y la filosofía. El reto para Russell y para el CHAI es alcanzar una IA compatible con lo humano, esto es, capaz de reconocer nuestras limitaciones y aprender de ellas para ayudarnos a alcanzar nuestros mejores fines posibles. Las máquinas superinteligentes del futuro deberán asumir su ignorancia con respecto a la sinceridad y carácter loable de las intenciones humanas y estar preparadas para autodirigirse éticamente, para modificar sus objetivos de acuerdo con valores superiores a fin de preservar aquello para lo que fueron construidas: nuestra humanidad.

