Die Funktion rbind() in R – Das Verknüpfen von Zeilen leicht gemacht

Das Verknüpfen oder Kombinieren von Zeilen ist mit der Funktion rbind() in R sehr einfach.

rbind() steht für Zeilenverknüpfung. Einfacher ausgedrückt bedeutet dies das Zusammenführen mehrerer Zeilen zu einem einzigen Stapel. Es kann das Verknüpfen von zwei Datenrahmen, Vektoren und mehr umfassen.

In diesem Artikel geht es um die Verwendungen und Anwendungen der Funktion rbind() in der R-Programmierung.

Ohne viel Zeit zu verlieren, kommen wir zum Thema!!!


Syntax der Funktion rbind()

rbind(): Die rbind- oder Zeilenverknüpfungsfunktion wird verwendet, um mehrere Gruppen von Zeilen zusammenzubinden oder zu kombinieren.

rbind(x,x1)

Wo:

  • X = the input data.
  • X1 = Die Daten, die verbunden werden müssen.

Die Idee, Zeilen mit rbind() zu verbinden

Das Konzept, die Zeilen mehrerer Datenrahmen zu verbinden oder zu kombinieren, ist äußerst vorteilhaft für die Datenmanipulation.

Das folgende Diagramm vermittelt Ihnen definitiv eine Vorstellung davon, wie die Funktion rbind() funktioniert.

Sie können sehen, wie die Zeilen unterschiedlicher Datenrahmen durch die Funktion rbind() gebunden/kombiniert werden.


Implementierung der Funktion rbind() in R

Wie Sie wissen, wird die Funktion rbind() in R verwendet, um die Zeilen verschiedener Datengruppen zu verbinden.

In diesem Abschnitt versuchen wir, einfache Datenrahmen zu erstellen und sie mit der Funktion rbind() zu verbinden.

# Erstellen eines Datenrahmens 

Student_details<-c("Mark","John","Fredrick","Floyd","George")
Student_class<-c("High school","College","High school","High school","College")
df1<-data.frame(Student_class,Student_details)

df1

Der obige Code erstellt einen einfachen Datenrahmen mit Details und Namen von Studenten.

   Student_class    Student_details
1   High school            Mark
2       College            John
3   High school        Fredrick
4   High school           Floyd
5       College          George

Nun haben wir einen Datenrahmen mit 5 Zeilen. Lassen Sie uns einen weiteren Datenrahmen erstellen.

# Erstellen eines Datenrahmens

Student_details<-c("Bracy","Evin")
Student_class<-c("High school","College")
Student_rank<-c("A","A+")
df2<-data.frame(Student_class,Student_details,Student_rank)

df2
    Student_class      Student_details
1   High school           Bracy
2       College            Evin

Jetzt haben wir 2 Datenrahmen mit unterschiedlichen Zeilenanzahlen (df1 und df2). Verwenden wir die Funktion rbind(), um diese beiden Datenrahmen in einen einzelnen Datenrahmen zu binden.

Schauen wir uns an, wie es funktioniert.

Sie werden nicht glauben, dass der gesamte Bindungsprozess nur eine Zeile Code erfordert.

# Bindet die Zeilen von 2 Eingabedatenrahmen

rbind(df1,df2)
    Student_class     Student_details
1   High school            Mark
2       College            John
3   High school        Fredrick
4   High school           Floyd
5       College          George
6   High school           Bracy
7       College            Evin

Der resultierende Datenrahmen wird eine verbundene Version beider Datenrahmen sein, wie im obigen Output gezeigt.


Binden von zwei Datenrahmen ungleicher Länge mit der bind()-Funktion

Nun, im vorherigen Abschnitt haben wir die beiden Zeilengruppen zusammengefügt.

In diesem Abschnitt werden wir zwei Datensätze mit der rbind-Funktion in R zusammenführen.

#erstellt den Datenrahmen

Student_details<-c("Mark","John","Fredrick","Floyd","George")
Student_class<-c("High school","College","High school","High school","College")
df1<-data.frame(Student_class,Student_details)

df1
   Student_class    Student_details
1   High school            Mark
2       College            John
3   High school        Fredrick
4   High school           Floyd
5       College          George
#erstellt den Datenrahmen

Student_details<-c("Bracy","Evin")
Student_class<-c("High school","College")
Student_rank<-c("A","A+")
df2<-data.frame(Student_class,Student_details,Student_rank)
df2
   Student_class   Student_details   Student_rank
1   High school           Bracy            A
2       College            Evin           A+
rbind(df1,df2)
Error in rbind(deparse.level, ...) : 
  numbers of columns of arguments do not match

Oh warte, was ist passiert? Warum gibt die Funktion einen Fehler aus?

Wenn Sie die Zeilen im Fehler lesen, wird angegeben, dass die Anzahl der Spalten nicht übereinstimmt.

Wir haben 2 Spalten in ‚df1‘ und 3 Spalten in ‚df2‘.

Keine Sorge! Wir haben die bind_rows()-Funktion, die uns in diesen Szenarien unterstützen wird.


Die bind_rows()-Funktion zum Binden ungleicher Datensätze

bind_rows() ist eine Funktion, die Teil des dplyr-Pakets ist. Wir müssen zuerst das dplyr-Paket importieren, um diese Funktion auszuführen.

Wir verwenden dieselben Datenrahmen wie im obigen Abschnitt, d. h. df1 und df2. Schauen wir, wie es funktioniert.

# erforderliche Pakete installieren
install.packages('dplyr')
# Bibliotheken importieren
library(dplyr)
# Zeilen verknüpfen
bind_rows(df1,df2)
   Student_class    Student_details   Student_rank
1   High school            Mark         <NA>
2       College            John         <NA>
3   High school        Fredrick         <NA>
4   High school           Floyd         <NA>
5       College          George         <NA>
6   High school           Bracy          A
7       College            Evin          A+

Sie können nun sehen, dass die Funktion bind_rows diese beiden ungleichen Datensätze in Bezug auf Spalten kombiniert hat. Die leeren Stellen werden als <NA> markiert.


Zusammenfügen von zwei Datensätzen mit der Funktion rbind()

In diesem Abschnitt werden wir uns das Verknüpfen von zwei gesamten Datensätzen in R genauer ansehen.

Mal sehen, wie es funktioniert.

Wir werden den BOD-Datensatz verwenden, da er nur 6 Zeilen hat und Sie die verbundenen Zeilen leicht beobachten können.

# verknüpft zwei Datensätze
rbind(BOD,BOD)
  Time demand
1     1    8.3
2     2   10.3
3     3   19.0
4     4   16.0
5     5   15.6
6     7   19.8
---------------
7     1    8.3
8     2   10.3
9     3   19.0
10    4   16.0
11    5   15.6
12    7   19.8

Der BOD-Datensatz hat 6 Zeilen. Da wir die Daten zweimal übergeben, wird die Funktion rbind() die gleichen Zeilen verknüpfen, wie oben gezeigt.

Vergessen Sie auch nicht die Funktion bind_rows().

# verknüpft zwei verschiedene Datensätze

bind_rows(BOD,women)
    Time  demand  height  weight
1     1    8.3     NA     NA
2     2   10.3     NA     NA
3     3   19.0     NA     NA
4     4   16.0     NA     NA
5     5   15.6     NA     NA
6     7   19.8     NA     NA
7    NA     NA     58    115
8    NA     NA     59    117
9    NA     NA     60    120
10   NA     NA     61    123
11   NA     NA     62    126
12   NA     NA     63    129
13   NA     NA     64    132
14   NA     NA     65    135
15   NA     NA     66    139
16   NA     NA     67    142
17   NA     NA     68    146
18   NA     NA     69    150
19   NA     NA     70    154
20   NA     NA     71    159
21   NA     NA     72    164

Dies sind Beispiele, die deutlich zeigen, wie die Funktionen bind() und bind_rows() funktionieren und angewendet werden.

I hope these illustrations helped you in understanding these functions.


Mehrere Zeilen in R zusammenbinden

In diesem Abschnitt konzentrieren wir uns darauf, mehrere (mehr als 2) Zeilen gruppen mit der Funktion rbind() zusammenzubinden. Schauen wir uns an, wie es funktioniert.

#bindet Zeilen von 3 Datensätzen
bind_rows(BOD,women,ToothGrowth)
     Time demand height weight len supp  dose
1     1    8.3     NA     NA   NA  <NA>   NA
2     2   10.3     NA     NA   NA  <NA>   NA
3     3   19.0     NA     NA   NA  <NA>   NA
4     4   16.0     NA     NA   NA  <NA>   NA
5     5   15.6     NA     NA   NA  <NA>   NA
6     7   19.8     NA     NA   NA  <NA>   NA
7    NA     NA     58    115   NA  <NA>   NA
8    NA     NA     59    117   NA  <NA>   NA
9    NA     NA     60    120   NA  <NA>   NA
10   NA     NA     61    123   NA  <NA>   NA
11   NA     NA     62    126   NA  <NA>   NA
12   NA     NA     63    129   NA  <NA>   NA
13   NA     NA     64    132   NA  <NA>   NA
14   NA     NA     65    135   NA  <NA>   NA
15   NA     NA     66    139   NA  <NA>   NA
16   NA     NA     67    142   NA  <NA>   NA
17   NA     NA     68    146   NA  <NA>   NA
18   NA     NA     69    150   NA  <NA>   NA
19   NA     NA     70    154   NA  <NA>   NA
20   NA     NA     71    159   NA  <NA>   NA

Beobachten Sie, wie alle drei Datensätze durch die Funktion bind_rows() in R zusammengeführt wurden. Das ist die Schönheit der Funktion bind_rows().

Diese 2 Funktionen haben unzählige Anwendungen bei der Datenmanipulation in der R-Programmierung.


Zusammenfassung

Die Funktion rbind() in R und die Funktion bind_rows() sind die nützlichsten Funktionen, wenn es um die Datenmanipulation geht.

Sie können ganz einfach zwei Datenrahmen mit der gleichen Spaltenanzahl mithilfe der Funktion rbind() zusammenbinden.

Auf die gleiche Weise können Sie, wenn die Datenrahmen eine ungleiche Spaltenanzahl haben, die Funktion bind_rows() zusammen mit dem dplyr-Paket verwenden.

Nun, das war’s erstmal, Fröhliches Zusammenbinden!!!

Mehr lesen: R-Dokumentation

Source:
https://www.digitalocean.com/community/tutorials/rbind-function-r