El legendario programador John Carmack, conocido por su papel fundamental en la historia de los gráficos 3D y por su trabajo en compañías como id Software, Oculus y ahora Keen Technologies, ha vuelto a encender una discusión técnica de gran relevancia para la industria de la computación de alto rendimiento. En un mensaje reciente publicado en X (antes Twitter), Carmack expuso una de las limitaciones más persistentes en el uso de GPUs para investigación: la falta de mecanismos limpios y eficientes para preemptar tareas, es decir, pausarlas y reanudarlas sin necesidad de reiniciar procesos completos. Como conclusión final, parece que quieren tu dinero y el de todas las empresas posibles.
The glory work of GPU scheduling is in the frontier data centers with hundreds of thousands of GPUs, but a lot of research work is done with single GPU jobs on modest clusters, and the scheduling leaves much to be desired.
— John Carmack (@ID_AA_Carmack) February 17, 2026
I wish there were a clean way to preempt GPU tasks, so…
Limitaciones actuales en la planificación de tareas con GPU
Su reflexión parte de una realidad evidente: aunque los grandes centros de datos —los que concentran cientos de miles de GPUs— se llevan la gloria y la atención mediática, una enorme cantidad de investigación se realiza en entornos modestos, con una o pocas GPUs. En estos escenarios, la planificación de tareas deja mucho que desear. Los investigadores suelen enfrentarse a colas saturadas, procesos largos que bloquean recursos y una incapacidad casi total para priorizar trabajos urgentes sin interrumpir otros que llevan horas o días ejecutándose.
Carmack plantea un deseo claro: un sistema que permita pausar tareas de GPU de forma transparente, sin obligar a los desarrolladores a implementar complejos sistemas de checkpointing manual. La alternativa actual —guardar estados, gestionar memoria y coordinar pausas cooperativas— no solo complica los proyectos, sino que introduce un terreno fértil para errores difíciles de depurar.
Lo interesante es que, según Carmack, las piezas técnicas necesarias ya existen. Las GPUs modernas utilizan tablas de páginas para gestionar memoria, Nvidia ofrece Unified Virtual Memory (UVM) para paginación bajo demanda y el sistema Multi-Process Service (MPS) podría actuar como capa de abstracción para forzar un modelo de asignación de memoria más flexible. Su propuesta teórica consiste en pausar el proceso de baja prioridad, permitir que el de alta prioridad expulse únicamente las páginas necesarias y, una vez finalizado, reanudar el proceso pausado, que volvería a cargar sus datos. No se trataría de cambios en milisegundos, sino de conmutaciones en escalas de decenas de segundos, suficientes para mejorar la eficiencia en entornos de investigación.
Una solución parcial que podría transformar la investigación
Aunque reconoce que no todo tipo de memoria podría gestionarse de esta forma —por ejemplo, ciertas asignaciones del kernel—, Carmack sostiene que incluso una solución parcial sería enormemente útil para la comunidad científica y para desarrolladores que dependen de recursos limitados.
Su comentario final, sin embargo, apunta a un problema estructural de la industria: “Of course, Nvidia would prefer you to Just Buy More GPUs!”. La frase, irónica pero directa, resume una tensión creciente. Las grandes compañías de hardware, en plena explosión de la inteligencia artificial, han encontrado un mercado donde la demanda supera con creces la oferta. En ese contexto, optimizar el uso de GPUs existentes no siempre es una prioridad comercial. Después de todo, como muchos investigadores comentan, las empresas “quieren tu dinero”, no necesariamente que exprimas al máximo el hardware que ya tienes.
La reflexión de Carmack llega en un momento en el que la escasez de GPUs afecta tanto a startups como a laboratorios académicos. La falta de mecanismos avanzados de planificación no solo ralentiza proyectos, sino que incrementa los costes operativos y obliga a muchos equipos a sobredimensionar infraestructuras para evitar cuellos de botella.
Un debate que podría impulsar nuevas líneas de investigación: Quieren tu dinero
Su propuesta no es un plan de ingeniería detallado, sino una invitación a repensar un problema que lleva años sin resolverse. Y viniendo de una figura con su trayectoria, es probable que reavive el interés de la comunidad técnica y de los fabricantes. La pregunta ahora es si Nvidia —o cualquier otro actor del sector— estará dispuesto a invertir en soluciones que optimicen recursos en lugar de impulsar la venta de más hardware.
Lo que está claro es que Carmack ha vuelto a poner el foco en una limitación real, cotidiana y ampliamente reconocida por quienes trabajan con GPUs. Y su mensaje, breve pero incisivo, podría ser el catalizador de nuevas líneas de investigación en un área que afecta directamente al futuro de la computación científica y de la inteligencia artificial. Finaliza con un… quieren tu dinero.
