Punto 1 — Exploración de la API Data360
Antes de diseñar las visualizaciones mapeamos el territorio: qué ofrece data360api.worldbank.org ↗, cómo se organiza su catálogo y qué campos devuelve cada observación. Esa exploración definió el subconjunto de indicadores que sostienen las tres visualizaciones de este trabajo.
1Qué bases de datos existen
Data360 es una plataforma agregadora: no es una única base,
sino un hub que unifica 50 datasets temáticos (~12.800
indicadores en total) mantenidos por el Banco Mundial, el FMI, la UIT, la ONU,
OECD, Our World in Data y otras organizaciones. Cada base tiene un identificador
propio (DATABASE_ID) que permite filtrar sus indicadores.
Las bases más pobladas y relevantes para análisis de desarrollo son:
- WB_WDI — World Development Indicators (1.526 indicadores). Es el dataset insignia del Banco Mundial.
- IMF_BOP — Balanza de Pagos del FMI (1.147).
- WB_EDSTATS — Estadísticas de Educación (1.073).
- IMF_FSI — Financial Soundness Indicators (594).
- WB_ES — Enterprise Surveys (583).
- IMF_IFS — International Financial Statistics (496).
- WB_GS — Gender Statistics (364).
- WB_FINDEX — Global Findex de inclusión financiera (281).
- WB_HNP — Health, Nutrition & Population (193).
- OWID_CB — Our World in Data, Carbon Budget (77).
- WB_CCKP — Climate Change Knowledge Portal (41).
- ITU_DH — UIT, telecomunicaciones y digital (39).
Los indicadores se organizan también por temática, y esta dimensión transversal cruza varias bases. Los temas con mayor cobertura son Prosperity (7.707 indicadores), Economic Policy (3.657), Finance (1.625), Trade (1.168), People (954), Institutions (938) y Digital (234), entre otros.
2Qué indicadores están disponibles y cómo se consultan
La API expone 5 endpoints REST principales. Los usamos todos durante la exploración:
GET /data360/data— obtiene observaciones filtradas por base, indicador, país, período, sexo, edad. Respuesta paginada (máx. 1.000 filas por request, se navega conskip).GET /data360/indicators?datasetId={id}— lista los indicadores de una base específica.POST /data360/searchv2— búsqueda por texto libre con filtros OData (por tema, tipo, base). Soporta facetas y paginación. Fue el endpoint que más usamos para descubrimiento.POST /data360/metadata— devuelve metadatos detallados de un indicador (descripción, fuente primaria, metodología).GET /data360/disaggregation— informa qué desagregaciones acepta un indicador (sexo, edad, urbanización, etc.).
Cada indicador se identifica con un código compuesto que
empieza con el identificador de su base: por ejemplo
WB_WDI_IT_NET_USER_ZS para uso de internet como % de población,
o WB_WDI_NE_TRD_GNFS_ZS para comercio como % del PIB.
El detalle de los indicadores seleccionados para este trabajo, junto con su fuente y el pilar analítico al que contribuyen, se encuentra en la tabla de Definición de variables más abajo.
3Cómo se estructuran los datos
El endpoint /data360/data devuelve JSON en long-format:
una fila por combinación única de país × indicador × año × desagregación.
Cada observación trae 24 campos, de los cuales los más importantes son:
DATABASE_ID— base fuente (p. ej.WB_WDI).INDICATOR— código del indicador.REF_AREA— país en código ISO3 (ARG,BRA) o agregado regional (LAC).TIME_PERIOD— período, típicamente año.OBS_VALUE— el valor numérico observado.UNIT_MEASURE— unidad (PT=porcentaje,USD,SCORE, etc.), acompañada deUNIT_MULTcomo multiplicador.COMMENT_TS— nombre legible del indicador, cuando la fuente original lo provee.SEX,AGE,URBANISATION— desagregaciones (_T= total,M/F= sexo, etc.).OBS_STATUS,OBS_CONF— estado de la observación (A=actual) y nivel de confidencialidad.FREQ— frecuencia de la serie (A=anual).
Esta estructura es uniforme a lo largo de todas las bases, lo cual es la gran ventaja de Data360 frente a consumir cada fuente por separado: una vez escrito el código para una base, sirve para todas.
4Pipeline de extracción implementado
Para bajar los datos implementamos un pipeline en Python que automatiza tres pasos: descubrimiento, extracción paginada y persistencia. El notebook completo está disponible en el repositorio del proyecto: notebooks/data_extraction.ipynb ↗
En el paso de descubrimiento, iteramos sobre una lista de
keywords temáticos (internet, rule of law, corruption,
freedom, governance, trade, fdi, etc.) y
para cada uno llamamos a /data360/searchv2, que devuelve los
indicadores cuya descripción matchea. Esto resolvió el problema de no saber
de antemano qué indicadores existían.
En la extracción, para cada indicador encontrado llamamos
a /data360/data en páginas de 1.000 filas, navegando con el
parámetro skip hasta agotar la serie. La respuesta JSON de cada
página se insertaba en una tabla temporal de DuckDB mediante
read_json_auto, lo que nos permitió evitar cargar todo en memoria
de Python y manejar inferencia de tipos automáticamente.
Finalmente, la persistencia se hace con
COPY ... TO '...' (FORMAT PARQUET): un archivo Parquet por
indicador, organizados en carpetas por tema
(data/raw/rule of law/,
data/raw/governance/, etc.). El formato Parquet nos dio
compresión, tipos preservados y lectura rápida con pandas/DuckDB en la
etapa posterior de análisis y visualización.
Preguntas que buscamos responder
- Es el comercio internacional un pilar del desarrollo? Los paises mas abiertos al comercio tienen mayor desarrollo humano?
- Como se relacionan la calidad institucional (estado de derecho, control de corrupcion, libertades civiles) con el desarrollo?
- La conectividad digital (acceso a internet, gobierno electronico) se correlaciona con mejores resultados de desarrollo?
- Existen paises que contradicen los patrones esperados — alto comercio pero bajo desarrollo, o viceversa?
- Como evoluciono la brecha digital global entre 2000 y 2022?
Punto 2 — Visualizaciones
Coordenadas Paralelas — Tres Pilares
Cada linea es un pais. Siete ejes representan indicadores de los tres pilares (apertura economica, instituciones, conectividad). El color codifica el IDH. Permite agregar y quitar paises para comparar perfiles multidimensionales.
Interactivo · Buscar paisesCartograma No Contiguo
Mapa mundial donde cada pais conserva su forma real pero se escala proporcionalmente a la variable seleccionada. Ocho indicadores disponibles con transiciones animadas. El color codifica el IDH.
Interactivo · 8 variables · MapaScatter Plot Animado — Conectividad y E-Gobierno
Grafico de dispersion que muestra la relacion entre uso de internet (eje X) e indice de gobierno electronico (eje Y) para 182 paises, animado desde el ano 2000 hasta 2022. El tamano de cada burbuja codifica el IDH.
Animado · 2000–2022 · 182 paisesPunto 3 — Implementación en Observable
Definicion de variables
| Variable | Descripcion | Fuente | Pilar |
|---|---|---|---|
| Comercio % PIB | Comercio de mercancias (exportaciones + importaciones) como porcentaje del PIB | World Bank WDI | Apertura |
| Exportaciones (USD) | Volumen total de exportaciones en dolares corrientes | World Bank WITS | Apertura |
| IED Entrante (% PIB) | Inversion extranjera directa neta entrante como porcentaje del PIB | World Bank WDI | Apertura |
| Riqueza per capita | Riqueza nacional integral per capita en USD reales encadenados (2019) | Changing Wealth of Nations | Apertura |
| Libertades Civiles | Puntaje total de Freedom House (derechos politicos + libertades civiles, 0–100) | Freedom House | Instituciones |
| Estado de Derecho | Indice de Estado de Derecho del WJP (0–1) | World Justice Project | Instituciones |
| Control de Corrupcion | Rango percentil del indicador de control de corrupcion del WGI (0–100) | World Bank WGI | Instituciones |
| Uso de Internet (%) | Individuos que usan internet como porcentaje de la poblacion | ITU / World Bank WDI | Conectividad |
| Indice de E-Gobierno | Indice de Desarrollo de Gobierno Electronico de la ONU (0–1) | UN EGDI | Conectividad |
| IDH | Indice de Desarrollo Humano — combina salud, educacion y nivel de vida (0–1) | PNUD | Transversal |
Conclusión
Las tres visualizaciones, construidas a partir de datos del World Bank Data360, convergen en una misma conclusión: el desarrollo humano no tiene atajos unidimensionales. La apertura económica sin instituciones genera riqueza concentrada. La conectividad digital sin equidad profundiza brechas. Las instituciones fuertes sin apertura limitan el crecimiento.
Los datos muestran que los países con mayor IDH del mundo no son necesariamente los más ricos ni los que más comercian en términos absolutos — son los que logran valores altos y equilibrados en los tres pilares simultáneamente. Norway, visible en las coordenadas paralelas, ilustra esto: su línea corre alta y pareja en todos los ejes, sin picos extremos ni caídas. En contraste, países como Singapur o China muestran que el éxito económico sin equilibrio institucional produce un desarrollo asimétrico.
Esta regularidad sugiere que apertura económica, calidad institucional y conectividad digital no son simplemente correlatos del desarrollo — son engranajes interdependientes. Cuando uno avanza, arrastra a los otros. Cuando uno falla, frena al sistema. Las políticas de desarrollo sostenible necesitan atender los tres frentes simultáneamente, no secuencialmente.
Limitaciones
Correlación, no causalidad. Las visualizaciones muestran asociaciones estadísticas entre indicadores, pero no demuestran relaciones causales. Es posible que un cuarto factor no medido (como la geografía, la historia colonial, o la dotación de recursos naturales) explique parcialmente las correlaciones observadas.
Datos transversales vs. longitudinales. Las coordenadas paralelas y el cartograma usan los datos más recientes disponibles (c. 2020–2022), lo que ofrece una foto estática. Solo el scatter animado muestra evolución temporal. Un análisis más completo requeriría series temporales para los tres pilares.
Cobertura desigual. No todos los indicadores están disponibles para todos los países. El índice de estado de derecho del WJP cubre menos países que el WDI, y el EGDI se publica cada dos años. Los datos faltantes fueron interpolados linealmente o excluidos según el caso.
Indicadores como proxy. Cada variable es una aproximación imperfecta del concepto que representa. El "control de corrupción" del WGI es una percepción agregada, no una medición directa. El IDH comprime tres dimensiones en un número. Estas simplificaciones son inherentes al análisis comparativo internacional.