panda

Come tracciare i dati in Pandas Python

Come tracciare i dati in Pandas Python
La visualizzazione dei dati svolge un ruolo importante nell'analisi dei dati. Pandas è una solida libreria di analisi dei dati in Python per la scienza dei dati. Fornisce varie opzioni per la visualizzazione dei dati con .plot() metodo. Anche se sei un principiante, puoi facilmente tracciare i tuoi dati utilizzando la libreria Pandas. Devi importare i panda e matplotlib.pacchetto pyplot per la visualizzazione dei dati.

In questo articolo, esploreremo vari metodi di tracciamento dei dati utilizzando Pandas python. Abbiamo eseguito tutti gli esempi sull'editor del codice sorgente pycharm utilizzando matplotlib.pacchetto pyplot.

Tracciare in Panda Python

In Panda, il .plot() ha diversi parametri che puoi usare in base alle tue esigenze. Principalmente, usando il parametro 'kind', puoi definire quale tipo di trama creerai.

La sintassi per tracciare i dati usando Pandas Python

La seguente sintassi viene utilizzata per tracciare un DataFrame in Pandas Python:

# importa panda e matplotlib.Pacchetti pyplot
importa panda come pd
import matplotlib.pyplot come plt
# Prepara i dati per creare DataFrame
data_frame =
'Column1': ['field1', 'field2', 'field3', 'field4',… ],
'Column2': ['field1', 'field2', 'field3', 'field4',… ]

var_df= pd.DataFrame(data_frame, columns=['Column1', 'Column2])
stampa (variabile)
# tracciare il grafico a barre
var_df.tracciare.bar(x='Colonna1', y='Colonna2')
per favore.mostrare()

Puoi anche definire il tipo di trama utilizzando il parametro kind come segue:

var_df.plot(x='Column1', y='Column2', kind='bar')

Gli oggetti Pandas DataFrames hanno i seguenti metodi di stampa per la stampa:

Se un utente utilizza solo il metodo plot() senza utilizzare alcun parametro, crea il grafico a linee predefinito.

Elaboreremo ora in dettaglio alcuni dei principali tipi di plottaggio con l'aiuto di alcuni esempi.

Diagrammi a dispersione nei panda

In questo tipo di plottaggio abbiamo rappresentato la relazione tra due variabili. Facciamo un esempio.

Esempio

Ad esempio, abbiamo dati di correlazione tra due variabili GDP_growth e Oil_price. Per tracciare la relazione tra due variabili, abbiamo eseguito il seguente pezzo di codice sul nostro editor di codice sorgente:

import matplotlib.pyplot come plt
importa panda come pd
gdp_cal= pd.DataFrame(
'GDP_growth': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Prezzo_petrolio': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame(gdp_cal, columns=['Oil_Price', 'GDP_growth'])
stampa (df)
df.plot(x='Oil_Price', y='GDP_growth', kind = 'disperso', color= 'rosso')
per favore.mostrare()

Grafici a linee che tracciano in Pandas  

Il grafico a linee è un tipo di grafico di base in cui determinate informazioni vengono visualizzate in una serie di punti dati ulteriormente collegati da segmenti di linee rette. Utilizzando i grafici a linee, puoi anche mostrare le tendenze delle informazioni nel tempo.

Esempio

Nell'esempio sotto menzionato, abbiamo preso i dati sul tasso di inflazione dell'anno scorso. Innanzitutto, prepara i dati e quindi crea DataFrame. Il seguente codice sorgente traccia il grafico a linee dei dati disponibili:

importa panda come pd
import matplotlib.pyplot come plt
infl_cal = 'Anno': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame(infl_cal, columns=['Year', 'Infl_Rate'])
data_frame.plot(x='Anno', y='Infl_Rate', kind='linea')
per favore.mostrare()

Nell'esempio sopra, è necessario impostare kind= 'line' per il tracciato del grafico a linee.

Metodo 2# Utilizzo della trama.metodo line()

L'esempio sopra, puoi anche implementare usando il seguente metodo:

importa panda come pd
import matplotlib.pyplot come plt
inf_cal = 'Anno': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame(inf_cal, columns=['Inflation_Rate'], index=[2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.tracciare.linea()
per favore.title('Riepilogo del tasso di inflazione degli ultimi 11 anni')
per favore.ylabel('Inflation_Rate')
per favore.xlabel('Anno')
per favore.mostrare()

Il seguente grafico a linee verrà visualizzato dopo aver eseguito il codice sopra:

Grafico a barre in Pandas

Il grafico a barre viene utilizzato per rappresentare i dati categorici. In questo tipo di grafico, le barre rettangolari con altezze diverse vengono tracciate in base alle informazioni fornite. Il grafico a barre può essere tracciato in due diverse direzioni orizzontali o verticali.

Esempio

Abbiamo preso il tasso di alfabetizzazione di diversi paesi nel seguente esempio. Vengono creati DataFrame in cui 'Country_Names' e 'literacy_Rate' sono le due colonne di un DataFrame. Usando Pandas, puoi tracciare le informazioni nella forma del grafico a barre come segue:

importa panda come pd
import matplotlib.pyplot come plt
lit_cal =
'Country_Names': ['Pakistan', 'USA', 'Cina', 'India', 'Regno Unito', 'Austria', 'Egitto', 'Ucraina', 'Saudia', 'Australia',
'Malaysia'],
'Litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame(lit_cal, columns=['Country_Names', 'litr_Rate'])
print(data_frame)
data_frame.tracciare.bar(x='Country_Names', y='litr_Rate')
per favore.mostrare()

Puoi anche implementare l'esempio sopra usando il seguente metodo. Imposta il tipo = "bar" per il grafico a barre in questa riga:

data_frame.plot(x='Country_Names', y='litr_Rate', kind='bar')
per favore.mostrare()

Grafico a barre orizzontale plottaggio

Puoi anche tracciare i dati su barre orizzontali eseguendo il seguente codice:

import matplotlib.pyplot come plt
importa panda come pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame(data_chart, columns=['litr_Rate'], index=['Pakistan', 'USA', 'Cina', 'India', 'Regno Unito', 'Austria', 'Egitto', 'Ucraina', 'Saudia' , "Australia",
'Malaysia'])
df.tracciare.barh()
per favore.title('Tasso di alfabetizzazione in vari paesi')
per favore.ylabel('Nomi_Paese')
per favore.xlabel('Litr_Rate')
per favore.mostrare()

in df.tracciare.barh(), il barh è usato per la stampa orizzontale. Dopo aver eseguito il codice sopra, nella finestra viene visualizzato il seguente grafico a barre:

Diagramma a torta in Pandas

Un grafico a torta rappresenta i dati in una forma grafica circolare in cui i dati vengono visualizzati in sezioni in base alla quantità data.

Esempio

Nell'esempio seguente, abbiamo visualizzato le informazioni su 'Earth_material' in diverse sezioni del grafico a torta. Innanzitutto, crea il DataFrame, quindi, utilizzando i panda, visualizza tutti i dettagli sul grafico.

importa panda come pd
import matplotlib.pyplot come plt
material_per = 'Earth_Part': [71,18,7,4]
dataframe = pd.DataFrame(material_per,columns=['Earth_Part'],index = ['Water','Mineral','Sand','Metals'])
dataframe.tracciare.pie(y='Earth_Part',figsize=(7, 7),autopct='%1.1f%%', startangle=90)
per favore.mostrare()

Il codice sorgente di cui sopra traccia il grafico a torta dei dati disponibili:

Conclusione

In questo articolo, hai visto come tracciare DataFrames in Pandas python. Diversi tipi di plottaggio vengono eseguiti nell'articolo sopra. Per tracciare più tipi come box, hexbin, hist, kde, densità, area, ecc., puoi usare lo stesso codice sorgente semplicemente cambiando il tipo di trama.

SuperTuxKart per Linux
SuperTuxKart è un fantastico titolo progettato per offrirti l'esperienza di Mario Kart gratuitamente sul tuo sistema Linux. È piuttosto impegnativo e ...
Tutorial Battaglia per Wesnoth
The Battle for Wesnoth è uno dei giochi di strategia open source più popolari a cui puoi giocare in questo momento. Non solo questo gioco è in svilupp...
0 A.D. Tutorial
Tra i tanti giochi di strategia in circolazione, 0 A.D. riesce a distinguersi come un titolo completo e un gioco molto profondo e tattico nonostante s...