Entrades Extractor Informació Idealista
Post
Cancel

Extractor Informació Idealista

Eina que permet extreure informació dels habitatges o locals que estan a la venda o per llogar a Idealista i les agències que els gestionen.

Informació

  • Dificultat d’instal·lació: mitjana
  • Dificultat d’ús: fàcil
  • Utilitat en investigació: útil en la fase d’adquisició
  • Coneixements previs: saber utilitzar una terminal

Característiques

  • Crea un CSV amb tots els habitatges d’una zona determinada.
  • Crea un CSV de totes les agències que gestionen els habitatges d’una zona determinada.
  • El CSV es pot importar fàcilment a un Excel o similars.

Instal·lació

Programa

Pots descarregar-te el programa del Github de Projecte Nadki:

També pots utilitzar la comanda “git” des d’una terminal:

1
git clone https://github.com/projectenadki/Extractor-Idealista.git

Requisits

Primer de tot, has d’instal·lar Python3 si no el tens:

1
sudo apt install python3

Per a poder instal·lar tots els requisits fàcilment, pots utilitzar pip3:

1
sudo apt install python3-venv python3-pip

A continuació, has d’instal·lar tots els paquets específics per a poder executar el programa:

  • BeautifulSoup4
  • datetime
  • argparse
  • progress

Pots instal·lar cada requisit manualment executant:

1
pip3 install <NOM_PAQUET>

Si vols anar més de pressa, al repositori hi ha un fitxer anomenat “requisits.txt”. Si el baixes i executes la següent comanda, s’instal·laran tots els requisits automàticament:

1
pip3 install -r requisits.txt

Finalment, només caldrà executar el programa:

1
python3 idealista.py

Funcionament

Idealista

Aquesta eina utilitza la informació que hi ha a Idealista.

Específicament, l’apartat on apareixen els pisos una vegada has escollit la província, ciutat i zona:

Atributs

El programa té diversos atributs que pots utilitzar quan l’executes:

  • –url: una vegada has buscat la zona, copia la URL i enganxa-la després d’aquest atribut.
  • -n o –nombre: especifica el nom del fitxer que vols que tinguin els CSV. Si no especifiques l’atribut, generarà un nom automàticament combinant el nom de la zona i la data.
  • -a o –agencias: indica si vols obtenir informació sobre les agències de la zona. Per una banda, generarà un altre CSV amb informació específica i per l’altra, actualitzarà les dades sobre les agències del CSV que conté el llistat d’habitatges.

Execució

A continuació indiquem com executar el programa amb els diferents atributs. Perquè puguis veure les diferències, utilitzarem els habitatges de Devesa (Girona) com a exemple.

La manera més fàcil és indicar només l’URL:

1
python3 idealista.py --url URL

Posant com a URL https://www.idealista.com/alquiler-viviendas/girona/devesa/, obtenim un fitxer, que es pot obrir amb l’Excel o similars, que conté un llistat de tots els habitatges que et mostra l’URL que has indicat:

Com pots veure, la majoria dels camps d’agència (nom, carrer i codi postal) estan buits. Això és degut al fet que no s’ha pogut obtenir tota la informació necessària de primeres.

L’atribut -a o –agencies fa una segona recopilació (pot tardar una mica) per obtenir informació sobre les agències:

1
python3 idealista.py --url URL -a

Per una banda, completa els camps que estaven buits del document amb el llistat d’habitatges:

I per l’altra, crea un nou document amb informació més detallada sobre les agències trobades:

Per últim, amb l’atribut -n o –nombre pots especificar un nom en concret que tindran els fitxers creats. Per defecte, tenen el format “zona_[listado o agencias]_data”:

  • devesa_listado_16_09_2020.csv
  • devesa_agencias_16_09_2020.csv

Si especifiques un nom, en lloc de posar la zona, posarà el nom:

  • Nadki_listado_16_09_2020.csv
  • Nadki_agencias_16_09_2020.csv
1
python3 idealista.py --url URL -n Nadki

Errors

Si utilitzes el programa mentre estàs connectat a un Wi-Fi públic o al de casa teva, no hauries de tenir problemes. No obstant això, si et connectes a través d’una VPN, és possible que vegis el següent error:

Això és degut al fet que Idealista bloqueja tot el tràfic provinent de Tor o de VPNs. Per a poder executar correctament el programa, hauràs d’obrir la pestanya incògnit d’un navegador i entrar a Idealista.

Veuràs que en lloc de sortir-te la pàgina web en si, et sortirà un missatge dient que no saben si ets un robot i et faran resoldre un CAPTCHA de Google:

Una vegada resolt, ja podràs utilitzar el programa amb normalitat. Normalment t’obligaran a resoldre el CAPTCHA la primera vegada que et connectis i passat un temps.

Conclusions

A Idealista pots trobar habitatges i locals que estan en venda i lloguer. Depenent de la zona que t’interessi, pots ser bastant feixuc haver d’anar passant pàgines i perdre la pista dels pisos que t’interessen.

Amb aquest programa podràs exportar tots els pisos a un Excel per a poder filtrar ràpidament per preu, habitacions o zona. Si algun t’interessa, és tan fàcil com copiar l’enllaç i enganxar-lo al navegador per veure els detalls a la web.

A més a més, amb els resultats que s’obtenen, tant de pisos com d’agències, es poden fer estudis en l’àmbit d’habitatge per saber la tendència dels preus o quines agències predominen a la zona.

Aquesta entrada està sota la llicència CC BY 4.0 que pertany a l'autor.