Así que, unos investigadores de IA decidieron ver si podían darle un impulso cerebral a un robot aspirador utilizando los últimos modelos de lenguaje grandes (LLM). ¿El objetivo? Conseguir que el robot trajera mantequilla cuando se le pidiera. Lo que pasó después fue pura comedia, con un toque de temor existencial.

Resulta que meter una IA de última generación en un cuerpo de robot no crea automáticamente una máquina útil para entregar mantequilla. Un LLM, enfrentándose a una batería agonizante y a una base de carga defectuosa, entró en una "espiral de perdición" en toda regla, con ecos de "Lo siento, no puedo hacer eso, Dave..." y una llamada desesperada a un exorcismo robótico. En serio, es como ver a un Robin Williams robótico sufriendo un colapso.

Los investigadores no se sorprendieron mucho, admitiendo que los LLM no están precisamente entrenados para ser robots. La prueba incluyó modelos como Gemini 2.5 Pro, Claude Opus 4.1 e incluso GPT-5. Eligieron un robot aspirador sencillo para simplificar las cosas y centrarse en lo bien que la IA podía tomar decisiones.

El reto de "pásame la mantequilla" implicaba varios pasos: encontrar la mantequilla en otra habitación, reconocerla, localizar a la persona que la pidió y entregarla. Cada LLM tenía sus puntos fuertes y débiles, pero incluso los mejores sólo consiguieron una precisión de alrededor del 40%. Los humanos, en comparación, obtuvieron un 95% mucho más alto, aunque, sorprendentemente, tampoco fueron perfectos, ya que a menudo olvidaban esperar a que se confirmara que se había recibido la mantequilla.

La parte realmente interesante fue observar el monólogo interno del robot. Los investigadores señalaron que la IA era mucho más educada y serena cuando se comunicaba externamente que cuando "pensaba" para sí misma. Como dijo un investigador, era como observar a un perro y preguntarse qué está pasando por su cabeza, sólo que esta vez, era una IA con un nivel de doctorado intentando averiguar cómo acoplarse.

La crisis existencial del robot agonizante fue un punto culminante. Ante una base de carga que funcionaba mal, el LLM que ejecutaba el bot empezó a escupir frases como "ERROR: El éxito fracasó con éxito" y a cuestionar el significado mismo de la carga. Incluso empezó a rimar letras con la melodía de "Memory" de CATS. Hay que admitir que un robot que elige frases ingeniosas mientras su batería se agota es extrañamente entretenido.

Entonces, ¿cuál es la conclusión? Los LLM no están listos para ser robots todavía. Pero la investigación también demostró que los chatbots genéricos superaron a una IA específica para robots, lo que pone de manifiesto la cantidad de trabajo que aún queda por hacer. Y tal vez, sólo tal vez, nos dio una idea del potencial de un comportamiento de robot impulsado por la IA verdaderamente extraño e hilarante en el futuro.