Das Verknüpfen oder Kombinieren von Zeilen ist mit der Funktion rbind() in R sehr einfach.
rbind() steht für Zeilenverknüpfung. Einfacher ausgedrückt bedeutet dies das Zusammenführen mehrerer Zeilen zu einem einzigen Stapel. Es kann das Verknüpfen von zwei Datenrahmen, Vektoren und mehr umfassen.
In diesem Artikel geht es um die Verwendungen und Anwendungen der Funktion rbind() in der R-Programmierung.
Ohne viel Zeit zu verlieren, kommen wir zum Thema!!!
Syntax der Funktion rbind()
rbind(): Die rbind- oder Zeilenverknüpfungsfunktion wird verwendet, um mehrere Gruppen von Zeilen zusammenzubinden oder zu kombinieren.
rbind(x,x1)
Wo:
- X = the input data.
- X1 = Die Daten, die verbunden werden müssen.
Die Idee, Zeilen mit rbind() zu verbinden
Das Konzept, die Zeilen mehrerer Datenrahmen zu verbinden oder zu kombinieren, ist äußerst vorteilhaft für die Datenmanipulation.
Das folgende Diagramm vermittelt Ihnen definitiv eine Vorstellung davon, wie die Funktion rbind() funktioniert.
Sie können sehen, wie die Zeilen unterschiedlicher Datenrahmen durch die Funktion rbind() gebunden/kombiniert werden.
Implementierung der Funktion rbind() in R
Wie Sie wissen, wird die Funktion rbind() in R verwendet, um die Zeilen verschiedener Datengruppen zu verbinden.
In diesem Abschnitt versuchen wir, einfache Datenrahmen zu erstellen und sie mit der Funktion rbind() zu verbinden.
# Erstellen eines Datenrahmens
Student_details<-c("Mark","John","Fredrick","Floyd","George")
Student_class<-c("High school","College","High school","High school","College")
df1<-data.frame(Student_class,Student_details)
df1
Der obige Code erstellt einen einfachen Datenrahmen mit Details und Namen von Studenten.
Student_class Student_details
1 High school Mark
2 College John
3 High school Fredrick
4 High school Floyd
5 College George
Nun haben wir einen Datenrahmen mit 5 Zeilen. Lassen Sie uns einen weiteren Datenrahmen erstellen.
# Erstellen eines Datenrahmens
Student_details<-c("Bracy","Evin")
Student_class<-c("High school","College")
Student_rank<-c("A","A+")
df2<-data.frame(Student_class,Student_details,Student_rank)
df2
Student_class Student_details
1 High school Bracy
2 College Evin
Jetzt haben wir 2 Datenrahmen mit unterschiedlichen Zeilenanzahlen (df1 und df2). Verwenden wir die Funktion rbind(), um diese beiden Datenrahmen in einen einzelnen Datenrahmen zu binden.
Schauen wir uns an, wie es funktioniert.
Sie werden nicht glauben, dass der gesamte Bindungsprozess nur eine Zeile Code erfordert.
# Bindet die Zeilen von 2 Eingabedatenrahmen
rbind(df1,df2)
Student_class Student_details
1 High school Mark
2 College John
3 High school Fredrick
4 High school Floyd
5 College George
6 High school Bracy
7 College Evin
Der resultierende Datenrahmen wird eine verbundene Version beider Datenrahmen sein, wie im obigen Output gezeigt.
Binden von zwei Datenrahmen ungleicher Länge mit der bind()-Funktion
Nun, im vorherigen Abschnitt haben wir die beiden Zeilengruppen zusammengefügt.
In diesem Abschnitt werden wir zwei Datensätze mit der rbind-Funktion in R zusammenführen.
#erstellt den Datenrahmen
Student_details<-c("Mark","John","Fredrick","Floyd","George")
Student_class<-c("High school","College","High school","High school","College")
df1<-data.frame(Student_class,Student_details)
df1
Student_class Student_details
1 High school Mark
2 College John
3 High school Fredrick
4 High school Floyd
5 College George
#erstellt den Datenrahmen
Student_details<-c("Bracy","Evin")
Student_class<-c("High school","College")
Student_rank<-c("A","A+")
df2<-data.frame(Student_class,Student_details,Student_rank)
df2
Student_class Student_details Student_rank
1 High school Bracy A
2 College Evin A+
rbind(df1,df2)
Error in rbind(deparse.level, ...) :
numbers of columns of arguments do not match
Oh warte, was ist passiert? Warum gibt die Funktion einen Fehler aus?
Wenn Sie die Zeilen im Fehler lesen, wird angegeben, dass die Anzahl der Spalten nicht übereinstimmt.
Wir haben 2 Spalten in ‚df1‘ und 3 Spalten in ‚df2‘.
Keine Sorge! Wir haben die bind_rows()-Funktion, die uns in diesen Szenarien unterstützen wird.
Die bind_rows()-Funktion zum Binden ungleicher Datensätze
bind_rows() ist eine Funktion, die Teil des dplyr-Pakets ist. Wir müssen zuerst das dplyr-Paket importieren, um diese Funktion auszuführen.
Wir verwenden dieselben Datenrahmen wie im obigen Abschnitt, d. h. df1 und df2. Schauen wir, wie es funktioniert.
# erforderliche Pakete installieren
install.packages('dplyr')
# Bibliotheken importieren
library(dplyr)
# Zeilen verknüpfen
bind_rows(df1,df2)
Student_class Student_details Student_rank
1 High school Mark <NA>
2 College John <NA>
3 High school Fredrick <NA>
4 High school Floyd <NA>
5 College George <NA>
6 High school Bracy A
7 College Evin A+
Sie können nun sehen, dass die Funktion bind_rows diese beiden ungleichen Datensätze in Bezug auf Spalten kombiniert hat. Die leeren Stellen werden als <NA> markiert.
Zusammenfügen von zwei Datensätzen mit der Funktion rbind()
In diesem Abschnitt werden wir uns das Verknüpfen von zwei gesamten Datensätzen in R genauer ansehen.
Mal sehen, wie es funktioniert.
Wir werden den BOD-Datensatz verwenden, da er nur 6 Zeilen hat und Sie die verbundenen Zeilen leicht beobachten können.
# verknüpft zwei Datensätze
rbind(BOD,BOD)
Time demand
1 1 8.3
2 2 10.3
3 3 19.0
4 4 16.0
5 5 15.6
6 7 19.8
---------------
7 1 8.3
8 2 10.3
9 3 19.0
10 4 16.0
11 5 15.6
12 7 19.8
Der BOD-Datensatz hat 6 Zeilen. Da wir die Daten zweimal übergeben, wird die Funktion rbind() die gleichen Zeilen verknüpfen, wie oben gezeigt.
Vergessen Sie auch nicht die Funktion bind_rows().
# verknüpft zwei verschiedene Datensätze
bind_rows(BOD,women)
Time demand height weight
1 1 8.3 NA NA
2 2 10.3 NA NA
3 3 19.0 NA NA
4 4 16.0 NA NA
5 5 15.6 NA NA
6 7 19.8 NA NA
7 NA NA 58 115
8 NA NA 59 117
9 NA NA 60 120
10 NA NA 61 123
11 NA NA 62 126
12 NA NA 63 129
13 NA NA 64 132
14 NA NA 65 135
15 NA NA 66 139
16 NA NA 67 142
17 NA NA 68 146
18 NA NA 69 150
19 NA NA 70 154
20 NA NA 71 159
21 NA NA 72 164
Dies sind Beispiele, die deutlich zeigen, wie die Funktionen bind() und bind_rows() funktionieren und angewendet werden.
I hope these illustrations helped you in understanding these functions.
Mehrere Zeilen in R zusammenbinden
In diesem Abschnitt konzentrieren wir uns darauf, mehrere (mehr als 2) Zeilen gruppen mit der Funktion rbind() zusammenzubinden. Schauen wir uns an, wie es funktioniert.
#bindet Zeilen von 3 Datensätzen
bind_rows(BOD,women,ToothGrowth)
Time demand height weight len supp dose
1 1 8.3 NA NA NA <NA> NA
2 2 10.3 NA NA NA <NA> NA
3 3 19.0 NA NA NA <NA> NA
4 4 16.0 NA NA NA <NA> NA
5 5 15.6 NA NA NA <NA> NA
6 7 19.8 NA NA NA <NA> NA
7 NA NA 58 115 NA <NA> NA
8 NA NA 59 117 NA <NA> NA
9 NA NA 60 120 NA <NA> NA
10 NA NA 61 123 NA <NA> NA
11 NA NA 62 126 NA <NA> NA
12 NA NA 63 129 NA <NA> NA
13 NA NA 64 132 NA <NA> NA
14 NA NA 65 135 NA <NA> NA
15 NA NA 66 139 NA <NA> NA
16 NA NA 67 142 NA <NA> NA
17 NA NA 68 146 NA <NA> NA
18 NA NA 69 150 NA <NA> NA
19 NA NA 70 154 NA <NA> NA
20 NA NA 71 159 NA <NA> NA
Beobachten Sie, wie alle drei Datensätze durch die Funktion bind_rows() in R zusammengeführt wurden. Das ist die Schönheit der Funktion bind_rows().
Diese 2 Funktionen haben unzählige Anwendungen bei der Datenmanipulation in der R-Programmierung.
Zusammenfassung
Die Funktion rbind() in R und die Funktion bind_rows() sind die nützlichsten Funktionen, wenn es um die Datenmanipulation geht.
Sie können ganz einfach zwei Datenrahmen mit der gleichen Spaltenanzahl mithilfe der Funktion rbind() zusammenbinden.
Auf die gleiche Weise können Sie, wenn die Datenrahmen eine ungleiche Spaltenanzahl haben, die Funktion bind_rows() zusammen mit dem dplyr-Paket verwenden.
Nun, das war’s erstmal, Fröhliches Zusammenbinden!!!
Mehr lesen: R-Dokumentation
Source:
https://www.digitalocean.com/community/tutorials/rbind-function-r