La IA empresarial entra en su era post-RAG
Diario de Innovación #360
Durante los últimos años si querías usar la IA Generativa en un entorno empresarial, la opción disponible parecía bastante clara.
Si querías trabajar con datos privados, necesitabas RAG.
Chunking.
Embeddings.
Bases de datos vectoriales.
Top-k retrieval.
Y después… el modelo razonando sobre esos fragmentos.
Se convirtió casi en una religión para los arquitectos empresariales de la IA Generativa.
Pero quizá acabamos de empezar a ver una grieta bastante importante en esa idea.
Un nuevo paper propone algo incómodo: puede que el problema no sea el modelo, ni siquiera el retrieval. Sino la forma en la que obligamos a los agentes a interactuar con el conocimiento.
Porque el RAG tradicional tiene una limitación enorme.
El agente solo puede pensar sobre aquello que el retriever decide enseñarle.
Si una pista importante queda fuera del top-k, desaparece de la realidad cognitiva del modelo.
Y eso empieza a ser un problema serio cuando los agentes ya no hacen una única pregunta.
Ahora: investigan, prueban hipótesis, conectan entidades, reformulan búsquedas, verifican detalles, exploran contexto local y construyen razonamiento multi-step.
Es decir, cada vez se parecen menos a un chatbot y más a un analista.
Y aquí aparece la idea más interesante del paper.
En vez de usar retrieval semántico tradicional, el agente interactúa directamente con el corpus corporativo.
Como lo haría un investigador humano.
Usando herramientas tipo terminal: grep, find, rg, sed, pipelines bash o lectura directa de archivos.
No pide “los documentos más parecidos”.
Explora.
Navega.
Investiga.
Contrasta.
Compone operaciones pequeñas.
Y aunque esto pueda sonar casi retro los resultados son bastante prometedores.
En benchmarks agentic: mejora accuracy del 69% al 80% y además reduce costes.
La idea profunda aquí no es técnica. Es filosófica.
Durante años pensamos que retrieval era: “cómo encontrar información”.
Pero quizá retrieval realmente era: “cómo permitimos pensar al agente”.
Y eso cambia bastante las implicaciones para empresa.
Porque quizá el futuro de la IA corporativa no pase únicamente por construir mejores pipelines RAG.
Sino por construir mejores corpus corporativos.
Repositorios navegables.
Sistemas de conocimiento vivos.
Documentación estructurada.
Logs accesibles.
Código explorable.
Históricos consultables.
Interfaces cognitivas para agentes.
El paper introduce un concepto muy potente: “Retrieval Interface Resolution”.
La resolución con la que el agente puede interactuar con el conocimiento.
Y cuanto más inteligente es el agente, más importante parece volverse esa resolución.
Porque los embeddings son muy buenos comprimiendo semántica.
Pero bastante malos explorando ambigüedad.
Y el trabajo real en las empresas está lleno de ambigüedad.
IDs raros.
Versiones.
Errores específicos.
Nombres internos.
Restricciones exactas.
Pistas débiles distribuidas.
Cosas que muchas veces un embedding suaviza, o directamente destruye.
Por eso quizá estamos entrando en una nueva etapa.
Una donde el valor diferencial no sea únicamente tener el mejor modelo.
Sino tener el mejor “sistema operativo cognitivo” para que los agentes trabajen sobre el conocimiento interno de la organización.
Y eso tiene consecuencias enormes.
Porque cambia la conversación desde: “¿Qué LLM usamos?” hacia: “¿Cómo está organizado nuestro conocimiento?”
Y sospecho que muchas empresas descubrirán algo incómodo.
Que el problema nunca fue la IA.
Era el caos documental que llevaban acumulando durante años.
🌍 El eco del mercado
🛡️ Claude Mythos convierte la ciberseguridad en infraestructura crítica. Anthropic restringe el acceso a Mythos, su modelo más avanzado orientado a ciberseguridad ofensiva y defensiva, tras detectar capacidades capaces de explotar vulnerabilidades complejas de forma autónoma.
🛒 Alipay quiere convertirse en la infraestructura económica de los agentes. Ant Group prepara una capa de pagos diseñada específicamente para agentes autónomos, permitiendo que sistemas de IA puedan comprar, contratar o ejecutar transacciones directamente.
⚖️ Europa prepara una multa histórica contra Google bajo la DMA. Bruselas intensifica la presión sobre Google por posibles incumplimientos de la Digital Markets Act relacionados con posicionamiento y competencia.
🧑⚖️ La IA empieza a saturar los tribunales con demandas automatizadas. Los juzgados estadounidenses detectan un aumento de escritos legales generados parcialmente por IA, muchos con errores, citas falsas o baja calidad jurídica.
🧠 Claude Code muestra el lado menos glamuroso de los agentes. Un reportaje de WIRED recoge experiencias reales de desarrolladores usando Claude Code para automatizar tareas complejas, incluyendo errores inesperados, decisiones opacas y comportamientos difíciles de predecir. Ya hablamos hace unos días de este fenómeno aquí y en Código Abierto.
💸 Uber cuestiona si el gasto masivo en IA empieza a desalinearse del negocio. Directivos tecnológicos alertan de que parte de la inversión actual en IA podría no traducirse en retorno económico claro para muchas compañías.
🧑💻 Linus Torvalds avisa del riesgo de programar peor con IA. El creador de Linux cuestiona el uso indiscriminado de asistentes de código y alerta sobre desarrolladores que aceptan código generado sin comprenderlo.
El problema no es que la IA escriba código. Es perder la comprensión profunda de sistemas complejos mientras aumenta la dependencia de herramientas opacas.
🔐 GitHub vuelve a enfrentarse a una oleada de commits maliciosos. Investigadores detectan nuevas campañas que introducen código malicioso en repositorios open source mediante commits aparentemente legítimos.
⛪ El Papa sitúa la IA en el centro del debate sobre poder y humanidad. Debo confesarlo, nunca pensé que fuese hablar sobre la Iglesia y tecnología en una misma frase. El Vaticano intensifica su discurso sobre IA alertando del riesgo de concentración de poder tecnológico y pérdida de autonomía humana.
🤖 Unitree acelera hacia bolsa en plena fiebre humanoide. La compañía china de robótica humanoide avanza planes para cotizar mientras crece el interés inversor por robots generalistas.
📡 Los routers empiezan a parecer sensores permanentes de vigilancia. Investigadores alertan sobre cómo dispositivos domésticos conectados pueden convertirse en fuentes constantes de telemetría y monitorización invisible.
🏭 El downtime se convierte en un problema estratégico multimillonario. Nuevos estudios muestran cómo las interrupciones tecnológicas están impactando directamente en productividad, ingresos y resiliencia empresarial.
Cuanto más dependiente es una organización del software y la automatización, más caro resulta cualquier fallo. La resiliencia operativa empieza a convertirse en ventaja competitiva.
🧬 Reddit se convierte en laboratorio inesperado para detectar efectos secundarios médicos. Investigadores utilizan modelos de IA para analizar conversaciones en Reddit y detectar señales tempranas de efectos secundarios farmacológicos.
🏥 La IA sanitaria choca con el verdadero problema: el sistema. Expertos del sector sanitario advierten que muchos proyectos de IA fracasan no por el modelo, sino por procesos hospitalarios obsoletos y mala integración organizativa.
Déjame recordarte que si te gusta la tecnología, el podcast de Código Abierto también puede ser una buena opción.
Si algo de lo que has leído te ha removido, dímelo.
Ya sabes que estoy al otro lado si quieres comentar, discrepar o simplemente saludar.
Que nunca te falten ideas, ni ganas de probarlas.
A.
PD: Esto también explica por qué tantas demos de IA funcionan… hasta que las conectas a sistemas corporativos reales.
PD2: Quizá el futuro del knowledge management se parezca menos a SharePoint… y más a darle a un agente acceso operativo a la memoria completa de la empresa.
PD3: Libros interesantes alrededor de esta idea:
The Unaccountability Machine de Dan Davies
Information Architecture for the World Wide Web de Rosenfeld y Morville
Designing Data-Intensive Applications de Martin Kleppmann
The Knowledge-Creating Company de Nonaka y Takeuchi
Pensar en Sistemas de Donella Meadows


