Lesen der CSV-Datei in Datenrahmen in R

Mit Hilfe spezifischer Funktionen, die von R angeboten werden, ist das Einlesen von CSV-Dateien in Datenrahmen viel einfacher.

Was ist eine CSV-Datei?

CSV steht für „Comma Separated Values“. In dieser Datei sind die gespeicherten Werte durch ein Komma getrennt. Dieser Prozess der Datenspeicherung ist viel einfacher.


Warum ist CSV das am häufigsten verwendete Dateiformat zur Speicherung von Daten?

Das Speichern von Daten in einer Excel-Tabelle ist in vielen Unternehmen gängige Praxis. In den meisten Unternehmen speichern die Mitarbeiter die Daten als CSV (durch Kommas getrennte Werte), da dieser Prozess einfacher ist als das Erstellen normaler Tabellenkalkulationen. Später können sie die eingebauten Pakete von R verwenden, um die Daten zu lesen und zu analysieren.

Als die beliebteste und leistungsstärkste statistische Analyse-Programmiersprache bietet R spezifische Funktionen zum Lesen von Daten in organisierte Datenrahmen aus einer CSV-Datei.


Lesen der CSV-Datei in ein Datenrahmen

In diesem kurzen Beispiel werden wir sehen, wie wir eine CSV-Datei in organisierte Datenrahmen einlesen können.

Das Erste in diesem Prozess ist das Abrufen und Einrichten des Arbeitsverzeichnisses. Sie müssen den Arbeitspfad der CSV-Datei auswählen.

1. Einrichten des Arbeitsverzeichnisses

Hier können Sie das Standard-Arbeitsverzeichnis mit der Funktion getwd() überprüfen und das Verzeichnis auch mit der Funktion setwd() ändern.

>getwd() # Zeigt das Standard-Arbeitsverzeichnis an

---->   "C:/Users/Dell/Documents"

> setwd("C:\Users\Dell\Documents\R-test data") # Um das neue Arbeitsverzeichnis festzulegen

> getwd() # Sie können das aktualisierte Arbeitsverzeichnis sehen

---> "C:/Users/Dell/Documents/R-test data"

2. Importieren und Lesen des Datensatzes / der CSV-Datei

Nachdem der Arbeitspfad festgelegt wurde, müssen Sie den Datensatz oder eine CSV-Datei wie unten gezeigt importieren.

> readfile <- read.csv("testdata.txt")

Führen Sie den obigen Code in R Studio aus, um das Datenrahmen wie unten gezeigt zu erhalten.

Um die Klasse der Variable „readfile“ zu überprüfen, führen Sie den folgenden Code aus.

> class(readfile)

---> "data.frame"            

Im obigen Bild sehen Sie den Datenrahmen, der die Informationen zu den Namen der Studenten, ihren IDs, Abteilungen, Geschlechtern und Noten enthält.

3. Extrahieren der Studenteninformationen aus der CSV-Datei

Nachdem Sie den Datenrahmen erhalten haben, können Sie die Daten analysieren. Sie können bestimmte Informationen aus dem Datenrahmen extrahieren.

Um die höchsten Noten der Studenten zu extrahieren,

>marks <- max(data$Marks.Scored) # Dies gibt Ihnen die höchsten Noten

# Um die Details eines Studenten zu extrahieren, der die höchsten Noten erzielt hat,

> data <- read.csv("traindata.csv")

> Marks <- max(data$Marks.Scored)

> retval <- subset(data, Marks.Scored == max(Marks.Scored))   # Dies wird
 extract the details of the student who secured highest marks 

> View(retval)

Um die Details der Studenten zu extrahieren, die im Fach „Chemie“ studieren,

> readfile <- read.csv("traindata.csv")

> retval <- subset( data, Department == "chemistry")  # Dies extrahiert die Studentendetails, die im Fach Biochemie studieren 
 
> View(retval)


Fazit

Durch diesen Prozess können Sie die CSV-Dateien in R mit der Verwendung der Funktion read.csv(„“) lesen. In diesem Tutorial wird erläutert, wie man die CSV-Datei importiert, die CSV-Datei liest und einige spezifische Informationen aus dem Datenrahmen extrahiert.

I used R studio for this project. RStudio offers great features like console, editor, and environment as well. Anyhow you are free to use other editors like Thinn-R, Crimson editor, etc. I hope this tutorial will help you in understanding the reading of CSV files in R and extracting some information from the data frame.

Weitere Informationen finden Sie unter: https://cran.r-project.org/manuals.html

Source:
https://www.digitalocean.com/community/tutorials/r-read-csv-file-into-data-frame