Avec l’aide de fonctions spécifiques offertes par R, lire les fichiers CSV dans des data frames est beaucoup plus facile.
Qu’est-ce qu’un fichier CSV ?
CSV est l’acronyme de Comma Separated Values. Dans ce fichier, les valeurs stockées sont séparées par une virgule. Ce processus de stockage des données est beaucoup plus simple.
Pourquoi CSV est-il le format de fichier le plus utilisé pour le stockage de données ?
Stocker les données dans une feuille de calcul Excel est la pratique la plus courante dans de nombreuses entreprises. Dans la majorité des entreprises, les gens stockent les données sous forme de valeurs séparées par des virgules (CSV), car le processus est plus simple que de créer des feuilles de calcul normales. Ensuite, ils peuvent utiliser les packages intégrés de R pour lire et analyser les données.
Étant le langage de programmation d’analyse statistique le plus populaire et le plus puissant, R propose des fonctions spécifiques pour lire les données dans des data frames organisés à partir d’un fichier CSV.
Lecture du fichier CSV dans un DataFrame
Dans cet exemple succinct, nous verrons comment nous pouvons lire un fichier CSV dans des cadres de données organisés.
La première étape de ce processus consiste à obtenir et à configurer le répertoire de travail. Vous devez choisir le chemin de travail du fichier CSV.
1. Configuration du répertoire de travail
Ici, vous pouvez vérifier le répertoire de travail par défaut en utilisant la fonction getwd() et vous pouvez également changer le répertoire en utilisant la fonction setwd().
>getwd() #Montre le répertoire de travail par défaut
----> "C:/Users/Dell/Documents"
> setwd("C:\Users\Dell\Documents\R-test data") #pour définir le nouveau répertoire de travail
> getwd() #vous pouvez voir le répertoire de travail mis à jour
---> "C:/Users/Dell/Documents/R-test data"
2. Importation et lecture de l’ensemble de données / fichier CSV
Après avoir défini le chemin de travail, vous devez importer l’ensemble de données ou un fichier CSV comme indiqué ci-dessous.
> readfile <- read.csv("testdata.txt")
Exécutez la ligne de code ci-dessus dans R Studio pour obtenir le data frame comme indiqué ci-dessous.
Pour vérifier la classe de la variable ‘readfile’, exécutez le code ci-dessous.
> class(readfile)
---> "data.frame"
Dans l’image ci-dessus, vous pouvez voir le data frame qui inclut les informations des noms des étudiants, leurs identifiants, départements, genres et notes.
3. Extraction des informations des étudiants à partir du fichier CSV
Après avoir obtenu le data frame, vous pouvez maintenant analyser les données. Vous pouvez extraire des informations particulières du data frame.
Pour extraire les notes les plus élevées obtenues par les étudiants,
>marks <- max(data$Marks.Scored) #Cela vous donnera les notes les plus élevées
#Pour extraire les détails d'un étudiant ayant obtenu les notes les plus élevées,
> data <- read.csv("traindata.csv")
> Marks <- max(data$Marks.Scored)
> retval <- subset(data, Marks.Scored == max(Marks.Scored)) #Cela
extract the details of the student who secured highest marks
> View(retval)
Pour extraire les détails des étudiants qui étudient au département de ‘chimie’,
> readfile <- read.csv("traindata.csv")
> retval <- subset( data, Department == "chemistry") # Cela extraira les détails des étudiants qui sont dans le département de biochimie
> View(retval)
Conclusion
En utilisant ce processus, vous pouvez lire les fichiers CSV en R à l’aide de la fonction read.csv(“ ”). Ce tutoriel explique comment importer le fichier CSV, le lire et extraire certaines informations spécifiques du data frame.
I used R studio for this project. RStudio offers great features like console, editor, and environment as well. Anyhow you are free to use other editors like Thinn-R, Crimson editor, etc. I hope this tutorial will help you in understanding the reading of CSV files in R and extracting some information from the data frame.
Pour en savoir plus, consultez : https://cran.r-project.org/manuals.html
Source:
https://www.digitalocean.com/community/tutorials/r-read-csv-file-into-data-frame