La campaña de vacunación “Yo me vacuno” sigue avanzando en Chile, con 9.453.206 personas vacunadas con primera dosis al 19 de mayo de 2021. Una pregunta muy importante es saber cuánto días quedarían hasta llegar a la tan esperada inmunidad de rebaño.
El sitio web TimeToHerd.com responde esta pregunta. Usando las cifras de vacunación de cada país, da un número de días esperado por país hasta que se llegue a la inmunidad de rebaño (que por defecto en el sitio correspondería a un 70% de la población vacunada).
Hoy quisimos hablar un poco de Web Scraping. ¿De qué se trata?
El Web Scraping agrupa los métodos de extracción de datos en la web:
Los sitios web tienen mucha información relevante. A veces, esta puede ser exportada directamente como Excel .xlsx, un archivo separado por comas .csv u otras extensiones comunes. Como ejemplo, mencionamos a Our World In Data, que está hecho para ser de uso simple. En un par de clics, uno puede generar distintas visualizaciones y acceder a los datos en varios formatos.
Otras veces, se ponen a disposición APIs, que permiten recuperar la información directamente. Por ejemplo, Uber tiene una (ver ahí). Con una línea de código, uno puede enviar solicitudes “requests”, y obtener información de tráfico, de precios, entre otros.
Pero, en la mayoría de los casos, el sitio no está hecho para que uno pueda recolectar información. Ahí llega el mundo del Web Scraping.
Además, el Web Scraping está muy relacionado con el manejo de tareas repetitivas. La misma pregunta vuelve siempre: ¿Vale la pena armar código para automatizar la recuperación de datos? ¿O es mejor hacerlo manual?
La herramientas de Web Scraping se justifican cuando la recolección de datos manual requeriría demasiado recursos (tiempo, energía…). Como muchas veces, esto depende de trade-offs.
Sigamos un poco con las herramientas disponibles. Dependiendo del sitio web scrapeado, uno puede usar distintas librerías. En general, se usan librerías de Python para hacer Web Scraping (también existen librerías para Node.js).
Las librerías que más se usan son requests, selenium, beautifulsoup o scrapy. Permiten navegar en las páginas web, y recuperar la información deseada, al acceder a los elementos del html.
Si necesitas ayuda para armar este tipo de herramientas, nos puedes escribir a contacto@yachaygroup.com. Si quieres aprender a programar en Python, inscríbete a los cursos Le Wagon (contáctanos si quieres beneficiar del descuento 15% Yachay por correo, o a nuestra página Instagram).
Hemos implementado un visualizador de datos de COVID-19 para Chile. Viene acá abajo. Es dinámico, y permite ver varias métricas a nivel nacional, por región, y por comuna! Los datos se obtienen a partir del repositorio Datos COVID-19 del Ministerio de Ciencia.
Tal como saben, Yachay es “El mundo a través de los datos”. Muchas veces les hemos comentado la importancia del Big Data, del Machine Learning o de la Inteligencia Artificial. Estos conceptos han permitido el éxito de muchísimos startups a lo largo del mundo en los últimos años.
Aprender de ciencia de datos y de programación puede ser un acelerador muy importante para tu carrera.
Le Wagon Chile es una referencia en Bootcamps de programación a nivel mundial. Los startups de sus ex-alumnos han conseguido levantar más de400 millones de dólares (sí, es mucho), y trabajan hoy en las siguientes empresas:
¡La buena noticia es que se viene un curso de Python & Data Analytics! Por comunidad Yachay, puedes tener un descuento de 15% (precio final $20.400). Quedan pocos cupos de descuento, así que inscríbanse si quieren tener una introducción completa a todo el mundo de los datos (Python, Pandas, Web Scraping)!