Scienza dei dati

Come creare DataFrame Panda in Python?

Come creare DataFrame Panda in Python?

Pandas DataFrame è una struttura di dati annotati 2D (bidimensionale) in cui i dati sono allineati in forma tabellare con diverse righe e colonne. Per una più facile comprensione, DataFrame si comporta come un foglio di calcolo che contiene tre diversi componenti: indice, colonne e dati. I DataFrame Panda sono il modo più comune per utilizzare gli oggetti del panda.

I Panda DataFrame possono essere creati utilizzando diversi metodi. Questo articolo spiegherà tutti i possibili metodi attraverso i quali è possibile creare Pandas DataFrame in python. Abbiamo eseguito tutti gli esempi sullo strumento pycharm. Iniziamo l'implementazione di ogni metodo uno per uno.

Sintassi di base

Segui la seguente sintassi durante la creazione di DataFrames in Pandas python:

pd.DataFrame(Df_data)

Esempio:Spieghiamoci con un esempio. In questo caso, abbiamo archiviato i dati dei nomi e delle percentuali degli studenti in una variabile 'Students_Data'. Inoltre, usando il pd.DataFrame (), abbiamo creato un DataFrame per visualizzare il risultato dello studente.

importa panda come pd
Dati_studenti =
'Nome':['Samreena', 'Asif', 'Mahwish', 'Raees'],
'Percentuale':[90,80,70,85]
risultato = pd.DataFrame(Studenti_Dati)
stampa (risultato)

Metodi per creare DataFrame Panda

I Panda DataFrame possono essere creati utilizzando i diversi modi che discuteremo nel resto dell'articolo. Stamperemo il risultato dei corsi dello studente sotto forma di DataFrames. Quindi, utilizzando uno dei seguenti metodi, puoi creare DataFrame simili che sono rappresentati nell'immagine seguente:

Metodo n. 01: creazione di DataFrame Panda dal dizionario delle liste

Nell'esempio seguente, i DataFrame vengono creati dai dizionari degli elenchi relativi ai risultati del corso dello studente. Innanzitutto, importa la libreria di un panda e quindi crea un dizionario di elenchi. Le chiavi dict rappresentano i nomi delle colonne come "Student_Name", "Course_Title" e "GPA". Gli elenchi rappresentano i dati o il contenuto della colonna. La variabile 'dictionary_lists' contiene i dati degli studenti che vengono ulteriormente assegnati alla variabile 'df1'. Usando l'istruzione print, stampa tutto il contenuto di DataFrames.

Esempio:

# Importa librerie per panda e numpy
importa panda come pd
# Importa la libreria di panda
importa panda come pd
# Crea un dizionario di list
liste_dizionario =
'Nome_studente': ['Samreena', 'Raees', 'Sara', 'Sana'],
'Course_Title': ['SQA','SRE','IT Basics', 'Artificial Intelligence'],
'GPA': [3.1, 3.3, 2.8, 4.0]
# Crea il DataFrame
dframe = pd.DataFrame(dictionary_lists)
stampa (dframe)

Dopo aver eseguito il codice sopra, verrà visualizzato il seguente output:

Metodo n. 02: crea Pandas DataFrame dal dizionario dell'array NumPy

Il DataFrame può essere creato dal dict di array/list. A tal fine, la lunghezza deve essere la stessa di tutta la narrazione. Se viene passato un indice, la lunghezza dell'indice dovrebbe essere uguale alla lunghezza dell'array. Se non viene passato alcun indice, allora, in questo caso, l'indice predefinito sarà un intervallo (n). Qui, n rappresenta la lunghezza dell'array.

Esempio:

importa numpy come np
# Crea un array numpy
nparray = np.Vettore(
[['Samreena', 'Raees', 'Sara', 'Sana'],
['SQA', 'SRE', 'Informazioni di base','Intelligenza artificiale'],
[3.1, 3.3, 2.8, 4.0]])
# Crea un dizionario di nparray
dizionario_di_nparray =
'Nome_studente': nparray[0],
'Course_Title': nparray[1],
'GPA': nparray[2]
# Crea il DataFrame
dframe = pd.DataFrame(dictionary_of_nparray)
stampa (dframe)

Metodo n. 03: creazione di DataFrame panda utilizzando l'elenco di elenchi

Nel codice seguente, ogni riga rappresenta una singola riga.

Esempio:

# Importa libreria Panda pd
importa panda come pd
# Crea un elenco di elenchi
elenchi_gruppi = [
['Samreena', 'SQA', 3.1],
['Raees', 'SRE', 3.3],
['Sara', 'Informazioni di base', 2.8],
['Sana', 'Intelligenza Artificiale', 4.0]]
# Crea il DataFrame
dframe = pd.DataFrame(group_lists, columns = ['Student_Name', 'Course_Title', 'GPA'])
stampa (dframe)

Metodo n. 04: creazione di DataFrame panda utilizzando l'elenco dei dizionari

Nel codice seguente, ogni dizionario rappresenta una singola riga e le chiavi che rappresentano i nomi delle colonne.

Esempio:

# Importa i panda della libreria
importa panda come pd
# Crea un elenco di dizionari
dict_list = [
'Student_Name': 'Samreena', 'Course_Title': 'SQA', 'GPA': 3.1,
'Student_Name': 'Raees', 'Course_Title': 'SRE', 'GPA': 3.3,
'Student_Name': 'Sara', 'Course_Title': 'IT Basics', 'GPA': 2.8,
'Student_Name': 'Sana', 'Course_Title': 'Artificial Intelligence', 'GPA': 4.0]
# Crea il DataFrame
dframe = pd.DataFrame(dict_list)
stampa (dframe)

Metodo # 05: creazione di dataframe panda da dict of pandas Series

I tasti dict rappresentano i nomi delle colonne e ogni serie rappresenta il contenuto delle colonne. Nelle seguenti righe di codice, abbiamo preso tre tipi di serie: Name_series, Course_series e GPA_series.

Esempio:

# Importa i panda della libreria
importa panda come pd
# Crea la serie dei nomi degli studenti
Name_series = pd.Serie(['Samreena', 'Raees', 'Sara', 'Sana'])
Course_series = pd.Series(['SQA', 'SRE', 'IT Basics', 'Artificial Intelligence'])
GPA_series = pd.Serie([3.1, 3.3, 2.8, 4.0])
# Crea un dizionario in serie
dizionario_di_nparray
\
'] = 'Nome': Name_series, 'Età': Course_series, 'Department': GPA_series
# Creazione DataFrame
dframe = pd.DataFrame(dictionary_of_nparray)
stampa (dframe)

Metodo n. 06: crea Pandas DataFrame utilizzando la funzione zip().

Diversi elenchi possono essere uniti tramite la funzione list(zip()). Nell'esempio seguente, i panda DataFrame vengono creati chiamando pd.Funzione DataFrame(). Vengono create tre diverse liste che vengono unite sotto forma di tuple.

Esempio:

importa panda come pd
# Elenco1
Student_Name = ['Samreena', 'Raees', 'Sara', 'Sana']
# Lista2
Course_Title = ['SQA', 'SRE', 'IT Basics', 'Artificial Intelligence']
# Lista3
GPA = [3.1, 3.3, 2.8, 4.0]
# Prendi l'elenco delle tuple da tre elenchi ulteriormente, uniscile usando zip().
tuple = list(zip(Student_Name, Course_Title, GPA))
# Assegna i valori dei dati alle tuple.
tuple
# Conversione di elenchi di tuple in dataframe di panda.
dframe = pd.DataFrame(tuple, columns=['Student_Name', 'Course_Title', 'GPA'])
# Stampa dati.
stampa (dframe)

Conclusione

Usando i metodi sopra, puoi creare Pandas DataFrames in python. Abbiamo stampato il GPA del corso di uno studente creando Pandas DataFrames. Si spera che otterrai risultati utili dopo aver eseguito gli esempi sopra menzionati. Tutti i programmi sono commentati bene per una migliore comprensione. Se hai più modi per creare Pandas DataFrame, non esitare a condividerli con noi. Grazie per aver letto questo tutorial.

Tutorial Shadow of the Tomb Raider per Linux
Shadow of the Tomb Raider è la dodicesima aggiunta alla serie Tomb Raider, un franchise di giochi d'azione e avventura creato da Eidos Montreal. Il gi...
Come aumentare gli FPS in Linux?
FPS sta per Fotogrammi al secondo. Il compito dell'FPS è misurare il frame rate nelle riproduzioni video o nelle prestazioni di gioco game. In parole ...
I migliori giochi di laboratorio dell'app Oculus
Se possiedi un visore Oculus, devi essere informato sul sideloading. Il sideloading è il processo di installazione di contenuti non archiviati sul vis...