Lettura del file CSV nei frame dati in R

Con l’aiuto delle funzioni specifiche offerte da R, la lettura dei file CSV in data frame è molto più semplice.

Cosa è un file CSV?

CSV sta per Comma Separated Values. In questo tipo di file, i valori memorizzati sono separati da virgole. Questo processo di memorizzazione dei dati è molto più semplice.


Perché il CSV è il formato di file più utilizzato per la memorizzazione dei dati?

Memorizzare i dati in un foglio di calcolo Excel è una pratica comune in molte aziende. Nella maggior parte delle aziende, le persone memorizzano i dati come valori separati da virgole (CSV), poiché il processo è più semplice rispetto alla creazione di fogli di calcolo normali. Successivamente, possono utilizzare i pacchetti integrati di R per leggere e analizzare i dati.

Essendo il linguaggio di programmazione per analisi statistica più popolare e potente, R offre funzioni specifiche per leggere i dati in data frame organizzati da un file CSV.


Lettura del file CSV in un DataFrame

In questo breve esempio, vedremo come possiamo leggere un file CSV in frame dati organizzati.

La prima cosa in questo processo è ottenere e impostare la directory di lavoro. È necessario scegliere il percorso di lavoro del file CSV.

1. Impostazione della directory di lavoro

Qui puoi verificare la directory di lavoro predefinita utilizzando la funzione getwd() e puoi anche cambiarla utilizzando la funzione setwd().

>getwd() # Mostra la directory di lavoro predefinita

---->   "C:/Users/Dell/Documents"

> setwd("C:\Users\Dell\Documents\R-test data") # per impostare la nuova directory di lavoro

> getwd() # puoi vedere la directory di lavoro aggiornata

---> "C:/Users/Dell/Documents/R-test data"

2. Importazione e lettura del dataset / file CSV

Dopo l’impostazione del percorso di lavoro, è necessario importare il set di dati o un file CSV come mostrato di seguito.

> readfile <- read.csv("testdata.txt")

Esegui il seguente codice in R Studio per ottenere il frame dei dati come mostrato di seguito.

Per verificare la classe della variabile ‘readfile’, esegui il codice seguente.

> class(readfile)

---> "data.frame"            

Nell’immagine sopra puoi vedere il frame dei dati che include le informazioni sui nomi degli studenti, i loro ID, i dipartimenti, il genere e i voti.

3. Estrarre le informazioni degli studenti dal file CSV

Dopo aver ottenuto il frame dei dati, puoi ora analizzare i dati. Puoi estrarre informazioni particolari dal frame dei dati.

Per estrarre i voti più alti ottenuti dagli studenti,

>marks <- max(data$Marks.Scored) # questo ti darà i voti più alti

# Per estrarre i dettagli di uno studente che ha ottenuto i voti più alti,

> data <- read.csv("traindata.csv")

> Marks <- max(data$Marks.Scored)

> retval <- subset(data, Marks.Scored == max(Marks.Scored))   # Questo fornirà
 extract the details of the student who secured highest marks 

> View(retval)

Per estrarre i dettagli degli studenti che studiano nel Dipartimento di ‘Chimica’,

> readfile <- read.csv("traindata.csv")

> retval <- subset( data, Department == "chemistry")  # Questo estrarrà i dettagli degli studenti che frequentano il dipartimento di Biochimica
 
> View(retval)


Conclusione

Attraverso questo processo puoi leggere i file csv in R utilizzando la funzione read.csv(“ “). Questo tutorial illustra come importare il file csv, leggere il file csv ed estrarre alcune informazioni specifiche dal data frame.

I used R studio for this project. RStudio offers great features like console, editor, and environment as well. Anyhow you are free to use other editors like Thinn-R, Crimson editor, etc. I hope this tutorial will help you in understanding the reading of CSV files in R and extracting some information from the data frame.

Per ulteriori informazioni, consulta: https://cran.r-project.org/manuals.html

Source:
https://www.digitalocean.com/community/tutorials/r-read-csv-file-into-data-frame