Llevamos tres semanas publicando sondeos en la página Instagram de Yachay Data para tratar de saber cuáles son los candidatos más plebiscitados por nuestra comunidad.
Nota preliminar: Este artículo es una versión actualizada y completada del artículo similar que habíamos publicado hace tres semanas.
A lo largo de las últimas elecciones, los organismos de sondeo han sido bastante criticados, por haber tenido dificultades en predecir bien el resultado del Plebiscito, o de las Primarias Presidenciales.
Aprovechamos nuestro artículo de hoy para ir más allá de los resultados que acabamos de publicar en nuestra página:
¡Ahí van nuestros comentarios/notas!
Somos tan curiosos como ustedes acerca de los resultados
Primero, queremos insistir en que no estamos asegurando nada con estos resultados. Sólo representan a las personas que han votado, y este público puede no ser representativo de los votantes chilenos, o del resultado futuro de las elecciones.
Somos los primeros en preguntarnos: ¿Serán parecidos a los resultados finales de las elecciones? ¿Representan algo?
Representatividad
Para ir más allá con respecto a la representatividad, vemos que las encuestas han tenido cada vez más votantes. En la encuesta 3, nos hemos acercado a los 8.000 votantes por candidato, lo que es muy por sobre de los tamaños de muestras en las encuestas tradicionales (1.000-2.000 personas).
Finalmente, es muy relevante tomar en cuenta la composición de la Comunidad Yachay. A continuación se muestran algunos datos:
Es interesante observar que los resultados de la encuesta 3 se asemejan a los del último Pulso Ciudadano para el tramo de edad 18-30 años. Este da Boric con 26,1%, Kast con 16,5%, Parisi con 7,4% y Sichel con 5,7%.
Metodología
Tal como lo hemos explicado en el post, somos dependientes de la plataforma que usamos para publicar la encuesta (Instagram). Hubiéramos podido publicar una encuesta más elaborada (Google Form, artículo en nuestro sitio Web), pero esta hubiera claramente tenido menos visibilidad y votos. Fue por esto que preferimos optar por las Stories Instagram.
Luego, decidimos publicar una Story por candidato, para medir la aprobación de cada candidato. Esta metodología puede no representar el porcentaje de voto de cada candidato: existen duplicados, cantidades distintas de votos según candidato, etc…
Sin embargo, esta encuesta puede representar alguna realidad, o algunas dinámicas en la carrera presidencial.
Transparencia
Otro tema interesante es que a pesar de no ser tan rigurosa como una encuesta de organismo de sondeo, este sondeo Instagram es transparente. Los datos consolidados de la encuesta están disponibles en esta página Google Sheet. Seguimos complementando la grilla con los datos nuevos. Queremos que las encuestas sean de “todos”, y nos hace feliz si la Comunidad Yachay se apropia estos datos. Si algunos tienen comentarios, saben cómo evaluar métricas adicionales, o complementar el análisis, pueden contactarse con nosotros.
A futuro, queremos seguir desarrollando este tipo de encuestas. Reforzándonos en los resultados reales de las presidenciales, podremos complementar nuestro análisis, y ver si la comunidad Yachay representaba el voto de las Presidenciales de 2021.
Hoy quisimos hablar un poco de Web Scraping. ¿De qué se trata?
El Web Scraping agrupa los métodos de extracción de datos en la web:
Los sitios web tienen mucha información relevante. A veces, esta puede ser exportada directamente como Excel .xlsx, un archivo separado por comas .csv u otras extensiones comunes. Como ejemplo, mencionamos a Our World In Data, que está hecho para ser de uso simple. En un par de clics, uno puede generar distintas visualizaciones y acceder a los datos en varios formatos.
Otras veces, se ponen a disposición APIs, que permiten recuperar la información directamente. Por ejemplo, Uber tiene una (ver ahí). Con una línea de código, uno puede enviar solicitudes “requests”, y obtener información de tráfico, de precios, entre otros.
Pero, en la mayoría de los casos, el sitio no está hecho para que uno pueda recolectar información. Ahí llega el mundo del Web Scraping.
Además, el Web Scraping está muy relacionado con el manejo de tareas repetitivas. La misma pregunta vuelve siempre: ¿Vale la pena armar código para automatizar la recuperación de datos? ¿O es mejor hacerlo manual?
La herramientas de Web Scraping se justifican cuando la recolección de datos manual requeriría demasiado recursos (tiempo, energía…). Como muchas veces, esto depende de trade-offs.
Sigamos un poco con las herramientas disponibles. Dependiendo del sitio web scrapeado, uno puede usar distintas librerías. En general, se usan librerías de Python para hacer Web Scraping (también existen librerías para Node.js).
Las librerías que más se usan son requests, selenium, beautifulsoup o scrapy. Permiten navegar en las páginas web, y recuperar la información deseada, al acceder a los elementos del html.
Si necesitas ayuda para armar este tipo de herramientas, nos puedes escribir a contacto@yachaygroup.com. Si quieres aprender a programar en Python, inscríbete a los cursos Le Wagon (contáctanos si quieres beneficiar del descuento 15% Yachay por correo, o a nuestra página Instagram).
Hemos implementado un visualizador de datos de COVID-19 para Chile. Viene acá abajo. Es dinámico, y permite ver varias métricas a nivel nacional, por región, y por comuna! Los datos se obtienen a partir del repositorio Datos COVID-19 del Ministerio de Ciencia.
Quisimos analizar la composición del PIB Chileno en el tercer trimestre de 2021. A partir de datos de la Base de Datos Estadísticos del Banco Central de Chile, obtuvimos este “Treemap” en Flourish:
Esperamos que les haya gustado este formato dinámico, realizado gracias a Flourish.