Módulo 5. Adquisición de datos
Recuperación de información de la web; buscadores; web scraping; spider y crawler; curl y cron; API REST.
Última actualización el
2022-02-04
Imagen de Tony Hirst CC-BY 2.0
Objetivos
- Ser capaz de aplicar técnicas y herramientas para la adquisición de datos de Internet, mediante APIs o scraping
- Adquisición de datos de portales de datos abiertos
- Técnicas scraping de páginas web y documentos
- Ser capaz de aplicar herramientas de extracción de datos desde formatos cerrados para impresión como PDF
Equipo docente
- Profesorado: Martín Nadal y Yolanda Ruiz
- Taller: Pablo Rey y Victòria Oliveres
- Charla: Concha Catalán y Riva Quiroga
datavis, infografía, fact-checking
Cofundadora de la asociación sin ánimo de lucro Innovación y Derechos Humanos (ihr.world); su proyecto principal es la base de datos centralizada de la Guerra Civil y el franquismo.
art, data
Artista de datos independiente; Bitcoin Traces, In the Air (version js), Ars Explorer, GALA o mapas del descontento.
R, Ciencia de Datos
Lingüista y actualmente cursa un doctorado 📘 en esa área. Es parte del equipo editorial de Programming Historian, participa de forma activa de la comunidad de R en Latinoamérica a través de iniciativas como RLadies, LatinR y R4DS-es.
análisis de datos
Realiza su tesis sobre corrupción en la UOC. Fundador de Basurama, participa en Meipi.org, software para cartografías participativas. Es miembro activo de Montera34.com.
rstats
Graduada en Periodismo por la Universitat Pompeu Fabra y máster en Periodismo de Datos por la Birmigham City University. Especializada en obtención, análisis y visualización de datos. Actualmente trabaja como periodista de datos en elDiario.es.