TransparenciaViva
Inicio
TransparenciaViva

Plataforma de datos abiertos para analizar y comparar información de las Administraciones Públicas españolas.

Plataforma

  • Inicio
  • Entidades
  • Contratos

Recursos

  • Temas
  • Noticias
  • Metodología
  • API

Legal

  • Aviso Legal
  • Privacidad
  • Cookies

© 2026 Transparencia Viva. Datos abiertos para todos.

Metodologia

Metodo y trazabilidad

Detallamos fuentes, normalizacion y controles de calidad para que los datos sean auditables.

Metodo y trazabilidad

Transparencia sobre la transparencia: fuentes, versionado y calidad.

Fuentes oficiales

Catalogamos boletines, portales de contratacion y presupuestos abiertos.

312 fuentes

Normalizacion

Taxonomia comun para cargos, partidas y proveedores.

48 reglas

Versionado

Cada dato tiene sello temporal y cambios auditables.

Logs diarios

Calidad

Alertas por outliers, importes duplicados y ausencia de campos clave.

QC automatico

Fuentes de datos

Origenes oficiales y verificables de informacion publica

Boletin Oficial del Estado (BOE)

Tipo

RSS Feed

Frecuencia

Diaria

NoticiasNormativa

Portal de Transparencia

Tipo

Web Scraping

Frecuencia

Semanal

ContratosEntidades

Portales de Contratacion Publica

Tipo

CSV/XLSX

Frecuencia

Diaria

ContratosLicitaciones

Datos Abiertos Municipales

Tipo

CSV/XLSX

Frecuencia

Mensual

PresupuestosSueldos

Proceso de ingesta

Pipeline automatizado de extraccion, validacion y carga

01

Descubrimiento

Conectores automatizados descargan datos desde fuentes oficiales (RSS, CSV, XLSX, HTML).

02

Validacion

Verificacion de formato, tipos de datos, valores obligatorios y rangos validos.

03

Normalizacion

Aplicacion de taxonomias comunes: nombres de entidades, codigos CPV, categorias presupuestarias.

04

Enriquecimiento

Vinculacion con jerarquia territorial, deteccion de proveedores duplicados, calculo de metricas.

05

Almacenamiento

Guardado en PostgreSQL con registro de trazabilidad (SourceRecord) y checksum para deduplicacion.

06

Alertas

Generacion automatica de alertas por anomalias: concentracion, sobrecostes, contratos sin licitacion.

Controles de calidad

Reglas automaticas de validacion y deteccion de anomalias

Campos obligatorios

HIGH

Entidad, importe, fecha y tipo deben estar presentes.

Valores fuera de rango

HIGH

Importes negativos, fechas futuras, porcentajes >100%.

Duplicados

WARN

Deteccion por checksum SHA-256 de campos clave.

Concentracion de proveedores

WARN

Top 5 proveedores acumulan >80% del gasto de una entidad.

Presupuesto excedido

INFO

Gasto ejecutado supera el presupuesto inicial.

Trazabilidad y versionado

Auditoria completa de cada punto de dato

Registro de proveniencia

ModeloSourceRecord
Campos clavesource_id, checksum, metadata
DeduplicacionSHA-256 hash
Timestampscreated_at, updated_at

Logs de ingesta

ModeloIngestionRun
EstadosSTARTED, COMPLETED, FAILED
Metricasrows_processed, rows_inserted
Erroreserror_message, error_details

Limitaciones y disclaimers

Cobertura parcial: No todas las administraciones publican datos en formatos estructurados. La cobertura varia segun el nivel administrativo y la comunidad autonoma.

Calidad de origen: Los datos provienen de fuentes oficiales, pero pueden contener errores tipograficos, valores nulos o inconsistencias. Aplicamos controles de calidad automaticos, pero no garantizamos exactitud absoluta.

Actualizacion asincrona: Las frecuencias de actualizacion varian por fuente. Los datos mas recientes pueden tardar entre 1 y 30 dias en aparecer en la plataforma.

Uso responsable: Esta plataforma es una herramienta de investigacion y observatorio ciudadano. No sustituye consultas legales ni auditorias oficiales. Cualquier analisis debe contrastarse con las fuentes originales.