El proyecto en 4 fases
Adaptamos la estructura de investigación usada en empleo-colombia a una materia prima distinta: texto no estructurado (programas de gobierno, debates, entrevistas) en lugar de datasets numéricos.
- Fase 1 — Fuentes y metodología. Documentar calendario electoral, reglas del juego y el marco comparativo para cada eje temático antes de extraer nada.
- Fase 2 — Recolección y normalización. Descargar programas oficiales inscritos ante la Registraduría, transcribir debates clave y normalizar cada propuesta a una fila de CSV con columnas estandarizadas.
- Fase 3 — Análisis comparativo. Matrices candidato × propuesta por eje. Visualizaciones que muestran coincidencias y divergencias.
- Fase 4 — Reporte final. Síntesis por eje con anexos citables.
Los 8 ejes
Organizamos por área de política pública, no por candidato. Los ejes son A. Contexto electoral, B. Economía y empleo, C. Seguridad y paz, D. Salud, E. Educación, F. Justicia y anticorrupción, G. Ambiente y energía, H. Política exterior y migración.
Reglas de extracción
Cada propuesta que publicamos debe cumplir:
- Citar fuente primaria. El programa oficial inscrito ante la Registraduría manda. Un debate o una entrevista solo se usa si lo que dice el candidato es consistente con su programa o lo complementa sin contradecirlo.
- Marcar lo no oficial. Si una propuesta aparece solo en prensa, se
marca explícitamente como
reportada_no_oficial. - Fecha de corte visible. Cada entregable muestra cuándo se extrajo. Los programas cambian; las promesas también.
- Palabras del candidato. Primero describimos la propuesta con los términos del candidato. Solo después, si aplica, agregamos análisis externo separado en una sección distinta.
- Distinguir propuesta de factibilidad. "El candidato X propone Y" es descriptivo. "Y costaría Z" es análisis externo y va en otra columna/bloque.
Estructura del CSV normalizado
Cada propuesta se almacena con estas columnas:
id_candidato— código único (C01, C02...)eje— letra A–Hsubtema— categoría dentro del eje (p. ej., "reforma pensional")propuesta_texto— la propuesta normalizada en una oraciónfuente_tipo—programa_oficial,debate,entrevista,red_social,prensafuente_url— enlace verificablefuente_fecha— fecha de la fuentepagina_o_minuto— ubicación exacta dentro de la fuenteestado_verificacion—verificada,reportada_no_oficial,contradictoria
Qué este sitio NO hace
- No recomienda candidato. El objetivo es que tú compares, no que nosotros decidamos.
- No predice resultados. Las encuestas que citamos son datos de contexto, no pronósticos.
- No verifica hechos (fact-check). Eso es trabajo de medios como Colombiacheck o La Silla Vacía. Aquí describimos la propuesta; su veracidad empírica no es nuestro alcance.
- No evalúa factibilidad política. Un análisis sobre si una propuesta pasaría el Congreso es externo y se marca como tal.
Código abierto y reproducible
El repositorio completo de la investigación incluye el YAML maestro
(investigacion.yml), los CSV procesados, los reportes por eje y
este sitio web. Todo está pensado para que cualquiera pueda reproducir el
análisis o señalar errores.