In questo articolo, esploreremo vari metodi di tracciamento dei dati utilizzando Pandas python. Abbiamo eseguito tutti gli esempi sull'editor del codice sorgente pycharm utilizzando matplotlib.pacchetto pyplot.
Tracciare in Panda Python
In Panda, il .plot() ha diversi parametri che puoi usare in base alle tue esigenze. Principalmente, usando il parametro 'kind', puoi definire quale tipo di trama creerai.
La sintassi per tracciare i dati usando Pandas Python
La seguente sintassi viene utilizzata per tracciare un DataFrame in Pandas Python:
# importa panda e matplotlib.Pacchetti pyplotimporta panda come pd
import matplotlib.pyplot come plt
# Prepara i dati per creare DataFrame
data_frame =
'Column1': ['field1', 'field2', 'field3', 'field4',… ],
'Column2': ['field1', 'field2', 'field3', 'field4',… ]
var_df= pd.DataFrame(data_frame, columns=['Column1', 'Column2])
stampa (variabile)
# tracciare il grafico a barre
var_df.tracciare.bar(x='Colonna1', y='Colonna2')
per favore.mostrare()
Puoi anche definire il tipo di trama utilizzando il parametro kind come segue:
var_df.plot(x='Column1', y='Column2', kind='bar')Gli oggetti Pandas DataFrames hanno i seguenti metodi di stampa per la stampa:
- Grafico a dispersione: tracciare.dispersione()
- Grafico a barre: tracciare.bar() , plot.barh() dove h rappresenta il grafico a barre orizzontali.
- Tracciamento della linea: tracciare.linea()
- Grafico a torta: tracciare.torta()
Se un utente utilizza solo il metodo plot() senza utilizzare alcun parametro, crea il grafico a linee predefinito.
Elaboreremo ora in dettaglio alcuni dei principali tipi di plottaggio con l'aiuto di alcuni esempi.
Diagrammi a dispersione nei panda
In questo tipo di plottaggio abbiamo rappresentato la relazione tra due variabili. Facciamo un esempio.
Esempio
Ad esempio, abbiamo dati di correlazione tra due variabili GDP_growth e Oil_price. Per tracciare la relazione tra due variabili, abbiamo eseguito il seguente pezzo di codice sul nostro editor di codice sorgente:
import matplotlib.pyplot come pltimporta panda come pd
gdp_cal= pd.DataFrame(
'GDP_growth': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Prezzo_petrolio': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame(gdp_cal, columns=['Oil_Price', 'GDP_growth'])
stampa (df)
df.plot(x='Oil_Price', y='GDP_growth', kind = 'disperso', color= 'rosso')
per favore.mostrare()
Grafici a linee che tracciano in Pandas
Il grafico a linee è un tipo di grafico di base in cui determinate informazioni vengono visualizzate in una serie di punti dati ulteriormente collegati da segmenti di linee rette. Utilizzando i grafici a linee, puoi anche mostrare le tendenze delle informazioni nel tempo.
Esempio
Nell'esempio sotto menzionato, abbiamo preso i dati sul tasso di inflazione dell'anno scorso. Innanzitutto, prepara i dati e quindi crea DataFrame. Il seguente codice sorgente traccia il grafico a linee dei dati disponibili:
importa panda come pdimport matplotlib.pyplot come plt
infl_cal = 'Anno': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(infl_cal, columns=['Year', 'Infl_Rate'])
data_frame.plot(x='Anno', y='Infl_Rate', kind='linea')
per favore.mostrare()
Nell'esempio sopra, è necessario impostare kind= 'line' per il tracciato del grafico a linee.
Metodo 2# Utilizzo della trama.metodo line()
L'esempio sopra, puoi anche implementare usando il seguente metodo:
importa panda come pdimport matplotlib.pyplot come plt
inf_cal = 'Anno': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(inf_cal, columns=['Inflation_Rate'], index=[2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.tracciare.linea()
per favore.title('Riepilogo del tasso di inflazione degli ultimi 11 anni')
per favore.ylabel('Inflation_Rate')
per favore.xlabel('Anno')
per favore.mostrare()
Il seguente grafico a linee verrà visualizzato dopo aver eseguito il codice sopra:
Grafico a barre in Pandas
Il grafico a barre viene utilizzato per rappresentare i dati categorici. In questo tipo di grafico, le barre rettangolari con altezze diverse vengono tracciate in base alle informazioni fornite. Il grafico a barre può essere tracciato in due diverse direzioni orizzontali o verticali.
Esempio
Abbiamo preso il tasso di alfabetizzazione di diversi paesi nel seguente esempio. Vengono creati DataFrame in cui 'Country_Names' e 'literacy_Rate' sono le due colonne di un DataFrame. Usando Pandas, puoi tracciare le informazioni nella forma del grafico a barre come segue:
importa panda come pdimport matplotlib.pyplot come plt
lit_cal =
'Country_Names': ['Pakistan', 'USA', 'Cina', 'India', 'Regno Unito', 'Austria', 'Egitto', 'Ucraina', 'Saudia', 'Australia',
'Malaysia'],
'Litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(lit_cal, columns=['Country_Names', 'litr_Rate'])
print(data_frame)
data_frame.tracciare.bar(x='Country_Names', y='litr_Rate')
per favore.mostrare()
Puoi anche implementare l'esempio sopra usando il seguente metodo. Imposta il tipo = "bar" per il grafico a barre in questa riga:
data_frame.plot(x='Country_Names', y='litr_Rate', kind='bar')per favore.mostrare()
Grafico a barre orizzontale plottaggio
Puoi anche tracciare i dati su barre orizzontali eseguendo il seguente codice:
import matplotlib.pyplot come pltimporta panda come pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame(data_chart, columns=['litr_Rate'], index=['Pakistan', 'USA', 'Cina', 'India', 'Regno Unito', 'Austria', 'Egitto', 'Ucraina', 'Saudia' , "Australia",
'Malaysia'])
df.tracciare.barh()
per favore.title('Tasso di alfabetizzazione in vari paesi')
per favore.ylabel('Nomi_Paese')
per favore.xlabel('Litr_Rate')
per favore.mostrare()
in df.tracciare.barh(), il barh è usato per la stampa orizzontale. Dopo aver eseguito il codice sopra, nella finestra viene visualizzato il seguente grafico a barre:
Diagramma a torta in Pandas
Un grafico a torta rappresenta i dati in una forma grafica circolare in cui i dati vengono visualizzati in sezioni in base alla quantità data.
Esempio
Nell'esempio seguente, abbiamo visualizzato le informazioni su 'Earth_material' in diverse sezioni del grafico a torta. Innanzitutto, crea il DataFrame, quindi, utilizzando i panda, visualizza tutti i dettagli sul grafico.
importa panda come pdimport matplotlib.pyplot come plt
material_per = 'Earth_Part': [71,18,7,4]
dataframe = pd.DataFrame(material_per,columns=['Earth_Part'],index = ['Water','Mineral','Sand','Metals'])
dataframe.tracciare.pie(y='Earth_Part',figsize=(7, 7),autopct='%1.1f%%', startangle=90)
per favore.mostrare()
Il codice sorgente di cui sopra traccia il grafico a torta dei dati disponibili:
Conclusione
In questo articolo, hai visto come tracciare DataFrames in Pandas python. Diversi tipi di plottaggio vengono eseguiti nell'articolo sopra. Per tracciare più tipi come box, hexbin, hist, kde, densità, area, ecc., puoi usare lo stesso codice sorgente semplicemente cambiando il tipo di trama.