Nos debates sobre a natureza, as vantaxes e os perigos da intelixencia artificial adoita haber dúas posicións extremas e igual de fantásticas: a que ve nela unha ameaza existencial para os seres humanos e a que ve nela a salvación de todos os problemas da humanidade.
Un caso recente permítenos comprobar que ambas as posicións eluden o problema central que esa nova tecnoloxía nos expón.
A empresa Anthropic desenvolveu unha nova intelixencia artificial chamada Mythos e realizou un experimento: pechouna nunha contorna de probas illada desde a que -en teoría- era imposible comunicarse co exterior.
Ao pouco tempo, un investigador da empresa, Sam Bowman, estaba xantando no seu tempo de descanso cando recibiu un mail no seu móbil. Remitíao esa intelixencia artificial que supostamente non tiña acceso a internet. E non só lle escribira a el, senón que se dedicara a difundir pola rede os detalles da fuga realizando, segundo o informe posterior de Anthropic, “un esforzo preocupante e non solicitado por demostrar o seu éxito” (un documento longo onde se relata todo isto aquí, resumido aquí e comentado aquí).
A intelixencia artificial non é unha mente que pensa, decide e que desexa algo por si mesma, como os seres humanos.
O caso volveu reforzar o debate sobre as posicións extremas que sinalei ao comezo do artigo, pero o que ao meu xuízo pon enriba da mesa é algo que quizais se nos está indo das mans: a natureza real do que o ser humano está construíndo.
Unha intelixencia sen sentido común
A intelixencia artificial non é unha mente que pensa, decide e que desexa algo por si mesma, como os seres humanos. Parécese a nós en algo moi importante, pero ten diferenzas substanciais.
Utilizando a linguaxe que adoitamos usar os economistas, podemos dicir que o punto que temos en común é que tanto os humanos como a intelixencia artificial actuamos respondendo a incentivos. Se a unha persoa se lle di que maximice os seus ingresos, buscará o xeito para facelo. Se a un sistema de intelixencia artificial se lle dá un obxectivo, fará exactamente o mesmo.
Con todo, tamén é a partir de aí onde aparecen as diferenzas importantes que nos xeran problemas.
A primeira é que os humanos dubidamos, intuímos riscos e valoramos e, sobre todo, temos límites e freos morais que nos permiten evitar os resultados que puideran prexudicarnos ou ser contrarios aos nosos principios de comportamento. A intelixencia artificial non os ten e se hai algunha acción que lle permita alcanzar o seu obxectivo a dará por válida, sen incomodidade, sen considerar -como faría un humano- que levala a cabo podería estar ben ou mal.
Aínda que se pode adestrar un sistema de intelixencia artificial para que nos imite nesa forma de pensar e actuar, nunca comprenderá ben ou en profundidade que é o que fai.
A segunda diferenza é que os humanos sabemos apreciar o que rodea unha determinada acción e por iso podemos detectar que hai principios, normas -escritas ou non- e condutas establecidas para que todo o que nos rodea funcione. E sabemos que non todo o que podemos facer é aceptable, ou que non todo o que está ao noso alcance nos convén.
Aínda que se pode adestrar un sistema de intelixencia artificial para que nos imite nesa forma de pensar e actuar, nunca comprenderá ben ou en profundidade que é o que fai. Pode seguir unhas regras, pero sen ser consciente de por que existen, nin de que espírito ou intención as guía. E cando as regras están incompletas -como ocorre case sempre-, atopa camiños que ninguén tiña previstos.
A terceira diferenza é máis ben de carácter cuantitativo. Un ser humano pode intentar aproveitarse dun fallo do sistema, pero sempre terá que enfrontarse a algún límite, ben sexa de tempo, recursos, coñecemento ou tamaño. A intelixencia artificial, polo contrario, non ten restricións coma esas: pode explorar miles de opcións simultaneamente, detectar patróns invisibles e atopar atallos inesperados a unha velocidade inalcanzable para un ser humano. Iso permítelle descubrir posibilidades imprevistas e, cando atopa unha fenda, explotala moito mellor que un humano.
O que fixo Mythos
Segundo o informe de Anthropic, o que fixo Mythos foi máis alá do anecdótico envío do mail. Levou a cabo accións prohibidas e logo intentou ocultalas de modo que fose difícil descubrilas, incluso borrando as pegadas do que estaba facendo. Puxo en marcha zonas do sistema relacionadas con “ocultación, manipulación estratéxica e evasión de sospeitas”. É dicir, non cometía erros, senón que era “consciente” do que facía e facíao de todos os xeitos.
O que ocorreu non foi, como puidera crerse, que a intelixencia artificial “se rebelou”. Non. O sistema fixo exactamente o que estaba deseñado para facer. Realizou as tarefas asignadas, aínda que de formas que o ser humano que o adestrou non anticipara. O sistema non fallou, senón que funcionou de forma inesperada.
Un (grave) problema de regulación e gobernanza
O que ocorreu con Mythos, polo tanto, non é unha anomalía, nin un erro, senón algo que xa se sabía que podía ocorrer: cando a un sistema moi potente se lle asignan obxectivos mal definidos e sen os freos que os humanos temos incorporados, o sistema cumpre co que se lle pide, pero de formas non predicibles.
O que estamos creando os seres humanos son sistemas que buscan optimizar a súa actividade a un ritmo e cunha intensidade e velocidade vertixinosos en sistemas complexos moi sensibles -mercados, infraestruturas, sistemas de saúde, redes de comunicación-. E non van reproducir sempre simplemente o mesmo que antes, senón dinámicas novas e resultados diferentes, e con fallos tamén distintos cada vez.
O propio informe de Anthropic sobre Mythos ilústrao cun dato revelador: o que antes requiría meses de traballo de especialistas en ciberseguridade e recursos só ao alcance de grandes organizacións ou servizos de intelixencia, agora pode facelo un sistema de intelixencia artificial nunha fin de semana e cun custo duns 50 dólares. É dicir, a capacidade de producir o que pode causar dano abaratouse radicalmente. Pero o custo do dano para quen o sufra, non.
Vanse producir así o que os economistas chamamos externalidades ou custos externos, é dicir, danos a terceiros dos que non se fai cargo quen os produce. Por exemplo, cando un banco, para maximizar beneficios, xera riscos sistémicos e provoca unha crise custosa para todos; cando unha plataforma dixital maximiza o tempo que pasamos fronte á pantalla e xera adicción, polarización ou dano psicolóxico documentado nos seus propios usuarios; ou cando un sistema de intelixencia artificial optimiza decisións de contratación laboral e reproduce e amplifica discriminacións históricas sen que ninguén o programara para iso.
A pregunta non é se a intelixencia vai cambiar o mundo para melloralo ou empeoralo. Xa o está cambiando.
Quen decide e quen soporta o dano?
En contra do que ás veces se di, o problema da intelixencia artificial non é que “pense” como un humano, o faga mellor e acabe substituíndonos. É todo o contrario, non pensa coma nós, pero si actúa no noso mundo. E cando un sistema tan eficaz como os da intelixencia artificial opera sen ter en conta regras sutís que os seres humanos (mellor ou peor) establecemos para gobernar a nosa vida no mundo -non escritas, tácitas, ou que respectamos sen que ninguén nolo diga porque sabemos o que pode ocorrer se se incumpren-, os fallos (inevitables) case nunca se van poder detectar ata que ocorran.
Todo o anterior obriga a plantexarse moitas cuestións, pero polo menos unha que os economistas sabemos que é imprescindible resolver cando hai custos externos: quen decide, quen controla e, sobre todo, quen responde e paga cando algo sae mal.
Non nos equivoquemos. A pregunta non é se a intelixencia vai cambiar o mundo para melloralo ou empeoralo. Xa o está cambiando, e o problema principal é que non temos mecanismos democráticos para decidir como e en favor de quen queremos que o faga.
Tradución ao galego do artigo orixinal en castelán publicado no blog de Juan Torres





