Detallamos fuentes, normalizacion y controles de calidad para que los datos sean auditables.
Transparencia sobre la transparencia: fuentes, versionado y calidad.
Catalogamos boletines, portales de contratacion y presupuestos abiertos.
312 fuentesTaxonomia comun para cargos, partidas y proveedores.
48 reglasCada dato tiene sello temporal y cambios auditables.
Logs diariosAlertas por outliers, importes duplicados y ausencia de campos clave.
QC automaticoOrigenes oficiales y verificables de informacion publica
Tipo
RSS Feed
Frecuencia
Diaria
Tipo
Web Scraping
Frecuencia
Semanal
Tipo
CSV/XLSX
Frecuencia
Diaria
Tipo
CSV/XLSX
Frecuencia
Mensual
Pipeline automatizado de extraccion, validacion y carga
Conectores automatizados descargan datos desde fuentes oficiales (RSS, CSV, XLSX, HTML).
Verificacion de formato, tipos de datos, valores obligatorios y rangos validos.
Aplicacion de taxonomias comunes: nombres de entidades, codigos CPV, categorias presupuestarias.
Vinculacion con jerarquia territorial, deteccion de proveedores duplicados, calculo de metricas.
Guardado en PostgreSQL con registro de trazabilidad (SourceRecord) y checksum para deduplicacion.
Generacion automatica de alertas por anomalias: concentracion, sobrecostes, contratos sin licitacion.
Reglas automaticas de validacion y deteccion de anomalias
Entidad, importe, fecha y tipo deben estar presentes.
Importes negativos, fechas futuras, porcentajes >100%.
Deteccion por checksum SHA-256 de campos clave.
Top 5 proveedores acumulan >80% del gasto de una entidad.
Gasto ejecutado supera el presupuesto inicial.
Auditoria completa de cada punto de dato
Cobertura parcial: No todas las administraciones publican datos en formatos estructurados. La cobertura varia segun el nivel administrativo y la comunidad autonoma.
Calidad de origen: Los datos provienen de fuentes oficiales, pero pueden contener errores tipograficos, valores nulos o inconsistencias. Aplicamos controles de calidad automaticos, pero no garantizamos exactitud absoluta.
Actualizacion asincrona: Las frecuencias de actualizacion varian por fuente. Los datos mas recientes pueden tardar entre 1 y 30 dias en aparecer en la plataforma.
Uso responsable: Esta plataforma es una herramienta de investigacion y observatorio ciudadano. No sustituye consultas legales ni auditorias oficiales. Cualquier analisis debe contrastarse con las fuentes originales.