Módulo 5. Adquisición de datos

Recuperación de información de la web; buscadores; web scraping; spider y crawler; curl y cron; API REST.

Imagen de Tony Hirst CC-BY 2.0

Objetivos

  • Ser capaz de aplicar técnicas y herramientas para la adquisición de datos de Internet, mediante APIs o scraping
  • Adquisición de datos de portales de datos abiertos
  • Técnicas scraping de páginas web y documentos
  • Ser capaz de aplicar herramientas de extracción de datos desde formatos cerrados para impresión como PDF

Equipo docente

  • Profesorado: Martín Nadal
  • Taller: Pablo Rey y Victòria Oliveres
  • Charla: Concha Catalán y Riva Quiroga
Concha Catalán
Concha Catalán
datavis, infografía, fact-checking

Cofundadora de la asociación sin ánimo de lucro Innovación y Derechos Humanos (ihr.world); su proyecto principal es la base de datos centralizada de la Guerra Civil y el franquismo.

Martín Nadal
Martín Nadal
art, data

Artista de datos independiente; Bitcoin Traces, In the Air (version js), Ars Explorer, GALA o mapas del descontento.

Riva Quiroga
Riva Quiroga
R, Ciencia de Datos

Lingüista y actualmente cursa un doctorado 📘 en esa área. Es parte del equipo editorial de Programming Historian, participa de forma activa de la comunidad de R en Latinoamérica a través de iniciativas como RLadies, LatinR y R4DS-es.

Pablo Rey Mazón
Pablo Rey Mazón
análisis de datos

Realiza su tesis sobre corrupción en la UOC. Fundador de Basurama, participa en Meipi.org, software para cartografías participativas. Es miembro activo de Montera34.com.

Victoria Oliveres Torrescasana
Victoria Oliveres Torrescasana
rstats

Graduada en Periodismo por la Universitat Pompeu Fabra y máster en Periodismo de Datos por la Birmigham City University. Especializada en obtención, análisis y visualización de datos. Actualmente trabaja como periodista de datos en elDiario.es.

Siguiente
Anterior