Selenium

Come ottenere l'URL corrente con Selenium

Come ottenere l'URL corrente con Selenium
Selenium è uno strumento per il test del browser, l'automazione del web e il web scraping. Mentre lavori sui tuoi progetti Selenium, potresti aver bisogno di conoscere l'URL della pagina visualizzata dal tuo browser web controllato da Selenium. Queste informazioni possono essere utili per tenere traccia dell'URL da cui hai estratto alcuni dati in modo che tu possa essere in grado di aggiornare i dati automaticamente usando uno script.

In questo articolo, ti mostrerò come ottenere l'URL corrente del browser con Selenium. Quindi iniziamo.

Prerequisiti:

Per provare i comandi e gli esempi di questo articolo, devi avere,

1) Una distribuzione Linux (preferibilmente Ubuntu) installata sul tuo computer.
2) Python 3 installato sul tuo computer.
3) PIP 3 installato sul tuo computer.
4) Pitone virtualenv pacchetto installato sul tuo computer.
5) Browser web Mozilla Firefox o Google Chrome installati sul tuo computer.
6) Deve sapere come installare Firefox Gecko Driver o Chrome Web Driver.

Per soddisfare i requisiti 4, 5 e 6, leggi il mio articolo Introduzione al selenio con Python 3 su Linuxhint.come.

Puoi trovare molti articoli sugli altri argomenti su LinuxHint.come. Assicurati di controllarli se hai bisogno di assistenza.

Configurazione di una directory di progetto:

Per mantenere tutto organizzato, crea una nuova directory di progetto selenio-url/ come segue:

$ mkdir -pv selenium-url/drivers

Vai a selenio-url/ directory del progetto come segue:

$ cd selenio-url/

Crea un ambiente virtuale Python nella directory del progetto come segue:

$ virtualenv .venv

Attiva l'ambiente virtuale come segue:

$ fonte .venv/bin/activate

Installa la libreria Selenium Python nel tuo ambiente virtuale usando PIP3 come segue:

$ pip3 installa selenio

Scarica e installa tutti i driver web necessari nel autisti/ directory del progetto. Ho spiegato il processo di download e installazione dei driver web nel mio articolo Introduzione al selenio con Python 3. Se hai bisogno di assistenza, cerca su LinuxSuggerimento.come per quell'articolo.

Userò il browser web Google Chrome per la dimostrazione in questo articolo. Quindi, userò il chromedriver binario con selenio. Dovresti usare il gecodriver binario se vuoi usare il browser web Firefox.

Ottenere l'URL corrente con il selenio:

Crea uno script Python ex01.pi nella directory del tuo progetto e digita le seguenti righe di codici al suo interno.

dal webdriver di importazione del selenio
dal selenio.webdriver.Comune.chiavi di importazione chiavi
opzioni = driver web.Opzioni Chrome()
opzioni.senza testa = Vero
browser = driver web.Chrome(executable_path="./drivers/chromeddriver", opzioni=opzioni)
browser.get("https://duckduckgo.com/")
stampa (browser.url_corrente)
browser.vicino()

Una volta che hai finito, salva il ex01.pi Script Python.

Qui, la riga 1 e la riga 2 importano tutti i componenti richiesti dalla libreria di selenio Python.

La riga 4 crea un oggetto Opzioni di Chrome e la riga 5 abilita la modalità headless per il browser web Chrome.

La riga 7 crea un Chrome browser oggetto usando il chromedriver binario da autisti/ directory del progetto.

La riga 9 dice al browser di caricare il duckduckgo.sito web com.

La riga 10 stampa l'URL corrente del browser. Qui, browser.url_corrente viene utilizzata per accedere all'URL corrente del browser.

La riga 12 chiude il browser.

Esegui lo script Python ex01.pi come segue:

$ python3 ex01.pi

Come puoi vedere, l'URL corrente (https://duckduckgo.com) è stampato sulla console.

Nell'esempio precedente, ho visitato il sito web duckduckgo.com e ha stampato l'URL corrente sulla console. Questo restituisce l'URL della pagina che stiamo visitando. Non molto elaborato poiché conosciamo già l'URL della pagina. Ora cerchiamo qualcosa su DuckDuckGo e proviamo a stampare l'URL della pagina dei risultati di ricerca sulla console.

Crea uno script Python ex02.pi nella directory del tuo progetto e digita le seguenti righe di codici al suo interno.

dal webdriver di importazione del selenio
dal selenio.webdriver.Comune.chiavi di importazione chiavi
opzioni = driver web.Opzioni Chrome()
opzioni.senza testa = Vero
browser = driver web.Chrome(executable_path="./drivers/chromeddriver", opzioni=opzioni)
browser.get("https://duckduckgo.com/")
stampa (browser.url_corrente)
searchInput = browser.find_element_by_id('search_form_input_homepage')
cercaInput.send_keys('selenium hq' + chiavi.ACCEDERE)
stampa (browser.url_corrente)
browser.vicino()

Una volta che hai finito, salva il ex02.pi Script Python.

Qui, le righe 1-10 sono le stesse di in ex01.pi. Quindi, non li spiego di nuovo.

La riga 12 trova la casella di testo di ricerca e la memorizza nel cercaInput variabile.

La riga 13 invia la query di ricerca selenio hq nel cercaInput casella di testo e preme il tasto chiave usando chiavi.ACCEDERE.

Una volta caricata la pagina di ricerca, browser.url_corrente viene utilizzato per accedere all'URL corrente aggiornato.

La riga 15 stampa l'URL corrente aggiornato sulla console.

La riga 17 chiude il browser.

Corri il ex02.pi Script Python come segue:

$ python3 ex02.pi

Come puoi vedere, lo script Python ex02.pi stampa 2 URL.

Il primo è l'URL della homepage del motore di ricerca DuckDuckGo.

Il secondo è l'URL corrente aggiornato dopo aver eseguito una ricerca sul motore di ricerca DuckDuckGo utilizzando la query selenio hq.

Conclusione:

In questo articolo, ti ho mostrato come ottenere l'URL corrente del browser Web utilizzando la libreria Selenium Python. Ora dovresti essere in grado di rendere i tuoi progetti Selenium più interessanti.

Il pulsante centrale del mouse non funziona in Windows 10
Il tasto centrale del mouse ti aiuta a scorrere lunghe pagine web e schermate con molti dati. Se si ferma, finirai per usare la tastiera per lo scorri...
Come cambiare i pulsanti sinistro e destro del mouse su PC Windows 10
È abbastanza normale che tutti i mouse dei computer siano progettati ergonomicamente per gli utenti destrimani. Ma sono disponibili dispositivi mouse ...
Emula i clic del mouse passando il mouse utilizzando il mouse senza clic in Windows 10
L'uso di un mouse o di una tastiera nella postura sbagliata di un uso eccessivo può causare molti problemi di salute, tra cui tensione, sindrome del t...