Commit 318dac7a authored by numeroteca's avatar numeroteca

clarify structure of eliminados Barcelona section

parent c329196e
......@@ -21,29 +21,49 @@ En el gráfico de numero de anuncios por mes se puede apreciar un descenso fuera
{{< figure src="/images/barcelona/linea-numero-anuncios-barcelona-airbnb.png" alt="Número de anuncios de Airbnb (2017-septiembre 2018)" title="Número de anuncios de Airbnb (2017-septiembre 2018)" >}}
Si vemos solamente los anuncios de pisos completos el descenso es más _____.
[hacer gráfico]
Es conveniente señalar que los datos con los qu
## ¿Qué anuncios se eliminan cada mes?
A partir de los anuncios publicados en Airbnb (llamados _listings_ en la terminología de Airbnb), disponibles en las diferentes bases de datos de los _scrapings_ de InsideAirbnb, hemos comparado mes a mes el número de anuncios nuevos y el de eliminados. Comparamos mediante el identificador único (id) si un anuncio que aparece en un determinado mes está diponible en el siguiente o se ha elminado.
A partir de los anuncios publicados en Airbnb (llamados _listings_ en la terminología de Airbnb), disponibles en las diferentes bases de datos de los _scrapings_ de InsideAirbnb, hemos comparado mes a mes el número de anuncios nuevos y el de eliminados. Comparamos mediante el identificador único (id) si un anuncio que aparece en un determinado mes está diponible en el siguiente o no. Si no lo está se considera que se ha elminado.
Mediante un script de Python se ha calculado cuántos nuevos/eliminados anuncios hay respecto el mes anterior desde enero de 2017 a septiembre de 2018. Generamos un histograma para poner en contexto si realmente en junio de 2018 se eliminan más pisos que en los otros meses.
NOTA: Para ser más precisos, no podemos hablar estrictamente de eliminados, sino de anuncios despublicados o no encontrados, ya que con los datos de los que disponemos no se puede tener la certeza de que se hayan eliminado. Las razones pueden se varias para no encontrarlo: bien porque se ha dado de baja; porque el anuncio está pausado (el anfitrión lo ha quitado por alguna razón); está alquilado durante un largo periodo y por eso no aparece en las búsquedas; o bien porque el _scraper_ no lo ha encontrado. Se puede hablar de "desaparecidos", siguiendo la terminología de Victoria Oliveres [catalunyaplural meter link](en este artículo que investiga sobre el tema).
Hemos calculado cuántos anuncios hay respecto el mes anterior desde enero de 2017 a septiembre de 2018. Así ponemos en contexto si realmente en junio de 2018 se eliminaron más pisos que en los otros meses.
{{< figure src="/images/barcelona/barras-eliminacion-anuncios-mes-barcelona-airbnb.png" alt="Anuncios añadidos y borrados cada mes con respecto al mes anterior" title="Anuncios añadidos y borrados cada mes con respecto al mes anterior" >}}
Podemos entonces **responder a la pregunta inicial: Sí, se eliminaron anuncios**. Pero... ¿cuales eran esos anuncios? ¿qué está pasando aproximadamente cada mes con los anuncios de Airbnb en Barcelona?
Parece que desaparecieron más anuncios en junio de 2018 que en ningún otro mes, que se eliminaron más anuncios entre esas dos fechas. Pero... ¿cómo eran esos anuncios? ¿pisos completos o habitaciones? ¿dónde se ubicaban? ¿qué tipo de _hosts_ los gestionaban? ¿con licencia o sin licencia? ¿activos o no activos?
### Total de anuncios
Si analizamos quién gestiona esos anuncios eliminados (de mayo a junio de 2018) vemos que existe una relación 40% [revisar porcentaje] de anuncios de _hosts_ que tienen uno solo y 60% de multigestores.
### Según tipo de _host_
Si analizamos quién gestiona esos anuncios eliminados (de mayo a junio de 2018) vemos que existe una relación 40% [revisar porcentaje] de anuncios de _hosts_ que tienen uno solo y 60% de multigestores. Se comprueba con este gráfico que es o no una anomalía en la serie:
[hace falta gráfico de barras de anuncios eliminados por mes con % de tipo de host y otro con room type]
{{< figure src="/images/barcelona/anuncios-borrados-junio2018-por-tipo-de-host.png" alt="Número de anuncios borrados en junio de 2018 según tipo de host en junio 2018" title="Número de anuncios borrados en junio de 2018 según tipo de host en junio 2018" >}}
Ahora analizamos el balance mensual, la diferencia entre anuncios nuevos y anuncios eliminados de cada mes respecto el mes anterior. [mantener el orden 2017-2018 en eje vertical] Podemos ver el fuerte descenso de más de 1.500 en junio de 2018 (se eliminaron en torno a 3.500, pero se crearon unos 2.000 durante ese periodo) a la vez que un aumento cercano a 1.500 dos meses después, en agosto de 2018.
### Según tipo de habitación
¿son diferentes los anuncios desparecidos respecto de otros meses
## Balance mensual
Miramos ahora el balance mensual, la diferencia entre anuncios nuevos y anuncios eliminados en cada mes respecto al mes anterior. Podemos ver el fuerte descenso de más de 1.500 [dar número exacto] en junio de 2018 (se eliminaron en torno a 3.500, pero se crearon unos 2.000 durante ese periodo) a la vez que un aumento cercano a 1.500 [dar número exacto] dos meses después, en agosto de 2018.
{{< figure src="/images/barcelona/barras-balance-anuncios-mes-barcelona-airbnb.png" alt="Balance de anuncios respecto mes anterior" title="Balance de anuncios respecto mes anterior" >}}
Calculamos el porcentaje para comprobar la estacionalidad de los anuncios creados y eliminados. Comprobamos por ejemplo que el 37% de los pisos anunciados por primera vez en agosto de 2017 se borraron, ya no estaban dispnibles, un mes después. [comprobar si es esa cifra, parece que el script habla d eagosto 2017).
Para comprobar la estacionalidad de los anuncios creados y eliminados calculamos el porcentaje de ellos que hay disponibles un mes después (los scrapings de InsideAirbnb están separados aproximadamente por un mes). El 37% de los pisos anunciados por primera vez en agosto de 2017 se borraron, ya no estaban disponibles, un mes después. [comprobar si es esa cifra, parece que el script habla de agosto 2017 - rehacer gráfico para solamente pisos completos].
Con los datos de la diferencia vemos mediante el comportamiento de cuantos pisos existen mes a mes en Airbnb desde 2017 hasta septiembre 2018. Hay un pico que marca un mínimo en el mes de junio.
Con los datos de la diferencia vemos mediante el comportamiento de cuántos pisos existen mes a mes en Airbnb desde 2017 hasta septiembre 2018. Hay un pico que marca un mínimo en el mes de junio.
### Para seguir investigando
......@@ -53,7 +73,6 @@ Con los datos de la diferencia vemos mediante el comportamiento de cuantos pisos
Para la visualización de datos geográficos se usa Qgis con el plugin “qgis2web”.
<iframe height="600" width="600" src="file:///home/numeroteca/sites/airbnb/static/web-eliminados-barcelona/index.html"></iframe>
[insertar iframe o imagen al mapa].
......@@ -68,10 +87,10 @@ Para la visualización de datos geográficos se usa Qgis con el plugin “qgis2w
Los scripts desarrollados en Python analizan la situación y generan visualiaciones. En concreto, compararn mes a mes para ver cuantos anuncios aparecen y desaparecen. Primero hemos contado cuantas IDs de anuncios coinciden en meses consecutivos y con ello hemos generado tablas para cada grupo de anuncios eliminados y nuevos por mes. Están disponibles en el repositorio del taller: https://github.com/montera34/airbnb.barcelona/blob/master/taller/mango/airbnb.ipynb
## Análisis espacial
## Análisis espacial. Metodología
+ Integración de los archivos csv de “borrados” y “añadidos” relativos al agosto de 2017 y con respecto al mes anterior (previamente procesados en Python) en Quantum GIS y conversación / exportación para formato shapefile en el sistema de Coordenadas WGS84 (EPSG: 4326).
+ Recuento de puntos (borrados y añadidos ) en polígonos a nivel de los barrios de barcelona (herramienta “Count Points in Polygons”). La operación se ejecutó dos veces para cada capa de puntos.
+ Integración de los archivos csv de “borrados” y “añadidos” relativos al agosto de 2017 y con respecto al mes anterior (previamente procesados en Python [añadir link]) en QGIS y conversión / exportación para formato shapefile en el sistema de Coordenadas WGS84 (EPSG: 4326).
+ Recuento de puntos (borrados y añadidos) en polígonos a nivel de los barrios de barcelona (herramienta “Count Points in Polygons”). La operación se ejecutó dos veces para cada capa de puntos.
+ Representación de los mapas de las cuentas “borrados” y “añadidos ” en mapas de coropletas con clasificación en Quantis.
+ Creación del webmap con recurso al template Leaflet con el plugin "qgis2web" asignando la representación de clúster dinámico para las shapefiles de puntos relativas a “borrados” y “añadidos ”.
+ Se crea automáticamente una carpeta con los archivos relativos a la webapp (disponibles en Google Drive del Taller -https://drive.google.com/drive/folders/1RsmxBuZtkelCmqH8CJqVB81zVZnans2d?usp=sharing y en Git de Montera34 - https://github.com/montera34/airbnb.barcelona/tree/master/taller/mango/qgis2web).
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment