El lenguaje ya no es humano: dos años de razón incómoda

Getting your Trinity Audio player ready...

Publicado en agosto de 2025. Actualizado en junio de 2026 a raíz de la conversación con Bruno Herrmann en LT-Innovate.

En abril de 2024 publiqué un artículo en MultiLingual Magazine titulado «Language Is No Longer Human». Sabía que iba a incomodar. No esperaba la magnitud de la reacción: mensajes de traductores que se sentían traicionados, académicos que me acusaban de reduccionismo, y también —lo que me sorprendió más— mensajes privados de directivos de grandes empresas de localización que me decían en privado que llevaban años pensando lo mismo pero no se atrevían a decirlo. Dos años después, no cambio una coma de la tesis. Pero sí tengo más matices que añadir, y algunos ángulos que entonces dejé sin desarrollar.

En el blog de Pangeanic ya expandí el argumento industrial: la traducción como proceso fabril, la automatización por etapas, el papel del GenAI en la posedición. Aquí quiero ir a otro sitio: a lo que me parece más relevante y menos discutido, dos años después.

Lo que realmente dije (y lo que la gente entendió que dije)

La tesis no era que las máquinas sean mejores que los humanos. Era más específica y, creo, más incómoda: que la producción de lenguaje funcional a escala, la traducción, la redacción técnica, el resumen, la clasificación, ha dejado de ser una tarea cognitiva que requiera inteligencia humana para producirse con calidad suficiente para la mayoría de los usos. Eso no es un juicio de valor. Es una observación de ingeniería.

Usé el ejemplo de Henry Kissinger a propósito. Un hombre que durante décadas movió el mundo sin dominar ningún idioma a la perfección, hablando inglés y alemán con un acento que nunca abandonó. El lenguaje, incluso en la diplomacia de élite, funciona como herramienta estratégica, no como expresión perfecta del alma. Si eso era cierto para Kissinger, ¿por qué nos sorprende que una máquina produzca lenguaje funcional sin «comprender» nada en el sentido filosófico?

La «lengua franca» matemática que nadie quiere nombrar

Lo que me parece más fascinante de los dos años transcurridos es un fenómeno que apenas se discute fuera de los laboratorios: los modelos de lenguaje no traducen «entre idiomas» en el sentido en que lo hace un intérprete humano. Mapean conceptos en espacios matemáticos de alta dimensión donde las lenguas se solapan, y la «traducción» es en realidad una proyección desde ese espacio compartido hacia la sintaxis del idioma de destino. No hay un momento en que el modelo «piense en inglés» y luego «lo pase al francés». Hay representaciones internas que son, en cierto sentido, anteriores a cualquier idioma concreto.

Eso tiene una implicación que me parece filosóficamente relevante: las máquinas están desarrollando algo que podríamos llamar una lengua franca propia, no cultural, no histórica, no cargada de los siglos de evolución que pesan sobre el español o el mandarín, sino puramente funcional y matemática. No sé si eso es empobrecedor o liberador, pero sinceramente sospecho que ambas cosas a la vez.

La brecha que nadie resuelve: las lenguas con pocos recursos

Aquí sí tengo una crítica que en 2024 apenas esbocé y que hoy me parece urgente. La tesis de que «el lenguaje ya no es humano» es, en gran medida, una tesis sobre idiomas con recursos abundantes. El inglés, el español, el francés, el alemán, el chino: lenguas con miles de millones de palabras de entrenamiento disponibles, con corpus paralelos extensos, con presencia masiva en internet.

Para las lenguas con pocos recursos, el panorama es radicalmente distinto. Un modelo que no tiene datos suficientes no produce lenguaje de calidad humana: produce ruido con apariencia de texto. Y el riesgo no es solo técnico. Es que la eficiencia de la IA en las lenguas dominantes acelere la marginalización de las lenguas pequeñas, porque la brecha económica entre producir contenido en inglés (barato, automatizado) y producirlo en una lengua indígena (caro, lento, dependiente de hablantes nativos escasos) se vuelve insostenible para la mayoría de las organizaciones.

Este es uno de los motivos por los que en Pangeanic llevamos años trabajando en datos multilingües para IA, incluyendo lenguas europeas de menor difusión y lenguas co-oficiales. No es filantropía: es la convicción de que una IA que solo funciona bien en cinco idiomas no es una IA universal. Es una herramienta de las lenguas dominantes.

Lo que 2025 y 2026 han confirmado

Cuando escribí el artículo, la posedición automática era todavía una promesa. Hoy es una realidad operativa en producción. Los modelos pequeños y específicos para tareas de traducción funcionan con una calidad que hace dos años hubiera parecido optimista. Gartner predice que en 2027 las organizaciones usarán modelos pequeños y específicos al menos tres veces más que los grandes modelos genéricos. No me sorprende: llevamos años diciendo que la especialización gana a la escala bruta.

Lo que también ha confirmado este tiempo es el argumento de la soberanía. Las organizaciones que subcontrataron su producción lingüística a grandes APIs de pago por token están descubriendo ahora los límites de ese modelo: costes que escalan con la adopción, dependencia de decisiones ajenas sobre disponibilidad y precios, y la imposibilidad de auditar lo que ocurre con sus datos. Es el mismo argumento que desarrollo con más detalle en mi reflexión sobre el peligro de subcontratar la cognición, escrita tras mi conversación con Bruno Herrmann de LT-Innovate.

El nuevo rol humano: curador, auditor, persona astuta

La pregunta que más me hacen desde 2024 es: ¿qué hacemos los humanos ahora? Y mi respuesta sigue siendo la misma que entonces, aunque la he afinado un poco con el tiempo, claro: las personas dejamos de ser los productores del lenguaje funcional y pasamos a ser sus directores de calidad, sus curadores de significado y los responsables de las decisiones que el texto debe sustentar. Somos “verificadores inteligentes”, “jueces”, y “los que toman decisiones”.

Hay una distinción que me gusta hacer entre ser inteligente y ser astuto. Las máquinas son inteligentes a una escala que ningún humano puede igualar: procesan, recuperan, traducen, resumen, clasifican, más rápido y en más idiomas que cualquiera de nosotros. Pero la astucia, la capacidad de leer una situación, aprovechar una red de relaciones, decidir qué no decir además de qué decir, y asumir la responsabilidad de las consecuencias, eso sigue siendo nuestro. No porque las máquinas no puedan imitarlo superficialmente, sino porque la responsabilidad no puede delegarse. Alguien tiene que firmar.

Eso convierte al traductor, al redactor técnico, al gestor de contenidos multilingüe, en algo más parecido a un ingeniero de calidad que a un artesano del idioma. No es una degradación: es una reinvención. Los que lo estén haciendo así ya llevan ventaja.

Una industria que por fin empieza a parecerse a una industria

Termino donde empecé el artículo original: la industria de la traducción y la localización, valorada en más de 65.000 millones de dólares, ha vivido décadas resistiendo su propia industrialización. El romanticismo lingüístico, la idea de que el lenguaje es demasiado humano para ser automatizado, ha sido tanto una defensa gremial legítima como una excusa para no modernizarse. La IA generativa ha cortado ese nudo de golpe.

Lo que viene ahora no es el fin del trabajo lingüístico humano. Es su transformación en algo que se parece más a la gestión de procesos industriales con control de calidad por lotes, supervisión humana experta en los puntos críticos, y especialización profunda en los dominios donde la precisión no admite error: medicina, derecho, seguridad. Para todo lo demás, la máquina ya es suficientemente buena. Aceptar eso no es rendirse. Es ponerse a trabajar en lo que viene después.

Si te interesa cómo lo estamos trasladando a la práctica en Pangeanic, el punto de entrada es AI Data Operations: la disciplina de datos que hace posible que los modelos funcionen en producción, con calidad medible, en entornos regulados y en lenguas que van más allá del inglés.