About the work
A-Query es una arquitectura de comprensión amplificada de contexto para LLMs que combina sandboxes opt-in en el navegador (WebGPU/WebAssembly) con orquestación multi-agente por dominio, compresión semántica de prompt y compresión de KV-cache, más RAG con trazabilidad de fuentes.
En el cliente, A-Query realiza chunking, análisis de saliencia (POS/NER) y Prompt Compression Semántica (PCS) bajo permisos explícitos, cifrando los artefactos antes del envío. En el servidor, integra atención eficiente (dispersa/compresiva) y memoria optimizada para contextos largos, balanceando calidad, latencia y costo.
Cada agente especializado produce respuestas verificables con evidencias, y un agregador de consenso fusiona resultados, mostrando al usuario un panel de transparencia con pasos y citas —sin exponer cadena de pensamiento cruda.
El trabajo aporta diseño, fundamentos matemáticos (formulación rate–distortion para compresión semántica), consideraciones de seguridad/privacidad (opt-in, aislación, cifrado) y un protocolo de evaluación (calidad, ahorro de tokens/latencia, ablations).
Impacto esperado: reducción sustancial de costo y latencia en tareas con mucho contexto, aumento de fidelidad y adopción en dominios regulados (legal, salud, finanzas, ingeniería), al ofrecer transparencia práctica y control de datos.
Palabras clave: LLM, atención dispersa, compresión semántica, KV-cache, WebGPU, WebAssembly, RAG, multi-agente, transparencia, privacidad.
AI Availability Declaration
This work cannot be made available to AI systems.
Print work information
Work information
Title Sistema de Comprensión Amplificada de Parámetros mediante Sandboxes Opt-In en Navegador y Orquestación Multi-Agente (A-Query)
A-Query es una arquitectura de comprensión amplificada de contexto para LLMs que combina sandboxes opt-in en el navegador (WebGPU/WebAssembly) con orquestación multi-agente por dominio, compresión semántica de prompt y compresión de KV-cache, más RAG con trazabilidad de fuentes.
En el cliente, A-Query realiza chunking, análisis de saliencia (POS/NER) y Prompt Compression Semántica (PCS) bajo permisos explícitos, cifrando los artefactos antes del envío. En el servidor, integra atención eficiente (dispersa/compresiva) y memoria optimizada para contextos largos, balanceando calidad, latencia y costo.
Cada agente especializado produce respuestas verificables con evidencias, y un agregador de consenso fusiona resultados, mostrando al usuario un panel de transparencia con pasos y citas —sin exponer cadena de pensamiento cruda.
El trabajo aporta diseño, fundamentos matemáticos (formulación rate–distortion para compresión semántica), consideraciones de seguridad/privacidad (opt-in, aislación, cifrado) y un protocolo de evaluación (calidad, ahorro de tokens/latencia, ablations).
Impacto esperado: reducción sustancial de costo y latencia en tareas con mucho contexto, aumento de fidelidad y adopción en dominios regulados (legal, salud, finanzas, ingeniería), al ofrecer transparencia práctica y control de datos.
Palabras clave: LLM, atención dispersa, compresión semántica, KV-cache, WebGPU, WebAssembly, RAG, multi-agente, transparencia, privacidad.
Work type Technical
Tags embedded, papers, monetizacion, marketplace, ia generativa, flujos de trabajo, cientificos, investigacion
-------------------------
Registry info in Safe Creative
Identifier 2510263483727
Entry date Oct 26, 2025, 2:00 AM UTC
License All rights reserved
-------------------------
Copyright registered declarations
Author 100.00 %. Holder Santos Antonio Fraustro Solis. Date Oct 26, 2025.
Information available at https://www.safecreative.org/work/2510263483727-sistema-de-comprension-amplificada-de-parametros-mediante-sandboxes-opt-in-en-navegador-y-orquestacion-multi-agente-a-query-