Adds inside airbnb scraper documentation in README. Improves folder tree diagram

parent fad25428
......@@ -5,30 +5,32 @@ Este respositorio reúne datos, scrapers y análisis sobre la situación de los
Se crea para uso del grupo de trabajo "Los datos de la turistización en Sevilla", dentro del encuentro [La ciudad es nuestra](http://zemos98.org/2019/10/14/la-ciudad-que-existe-menos/), en Sevilla, durante los días 24, 25 y 26 de octubre de 2019.
## Grupo de trabajo "Los datos de la turistización en Sevilla"
### Grupo de trabajo "Los datos de la turistización en Sevilla"
El turismo en Sevilla ha crecido exponencialmente en los últimos años; sin embargo, a diferencia de lo que ocurre en otras ciudades, el consistorio municipal no contempla la posibilidad de regular el mercado turístico de la ciudad. En esta mesa utilizaremos herramientas periodísticas y de visualización de datos para ofrecer una dimensión real de lo que ocurre y ocurrirá en Sevilla en los próximos años.
# Structure of files and directories
## Structure of files and directories
This is our simplified tree of directories and files
```
├── analisis To store scripts for analysys
├── data where to store data
│   ├── original original data
│   │   ├── airbnb airbnb data
│   │   │   ├── 150430
│   │   │   │   ├── data
│   │   │   │   │   └── listings.csv.gz [not included in repo). Use
│   │   │   │   ├── listings_summary_sevilla_insideairbnb.csv
│   │   │   │   └── reviews_summary_sevilla_insideairbnb.csv
│   │   │   ├── YYMMDD
│   │   │   │   ├── calendar.csv.gz
│   │   │   │   ├── listings.csv
│   │   │   │   ├── listings.csv.gz
│   │   │   │   ├── neighbourhoods.geojson
│   │   │   │   ├── reviews.csv
│   │   │   │   └── reviews.csv.gz
│   │   │   ├── (...)
│   │   │   └── 190308
│   │   │   ├── data
│   │   │   ├── listings_summary_sevilla_insideairbnb.csv
│   │   │   └── reviews_summary_sevilla_insideairbnb.csv
│   │   │   └── YYMMDD
│   │   │      ├── calendar.csv.gz
│   │   │       ├── listings.csv
│   │   │      ├── listings.csv.gz
│   │   │      ├── neighbourhoods.geojson
│   │   │      ├── reviews.csv
│   │   │      └── reviews.csv.gz
│   │   ├── contornos shapes
│   │   └── demografia-vivienda
│   └── output processed data
......@@ -37,12 +39,24 @@ This is our simplified tree of directories and files
│   └── airbnb
│   ├── eliminados
│   ├── hosts
│   │   ── mapas
│   ── reviews
│   │   ── mapas
│   ── reviews
├── README.md
├── scraping
│   ├── YYYYMMDD-ia.urls.log log of inside airbnb scraper
│   ├── airbnb.lastreview.py
│   └── get-insideairbnb-data.R
│   └── ia.datasets.download.get.urls.py scraper to download inside airbnb datasets
├── taller
│   └── team1 files of one of the workshop groups
```
## How to run Inside Airbnb scraper
Inside Airbnb scraper is a python script that seacrh for all available files for a territory in insideairbnb.com site and download them all.
The script is located in `scraping/` folder and it is call ia.dataset.download.get.urls.py.
To run it:
```bash
cd scraping
python2 ia.datasets.download.get.urls.py {city}
```
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment