Hoe de sink() functie gebruiken in R

Je kunt de sink() functie in R gebruiken om gegevens naar externe verbindingen te sturen.

Hallo allemaal, vandaag gaan we kijken naar de toepassingen van de sink() functie in R. We gaan proberen verbindingen te maken in meerdere formaten, zoals tekst en csv-bestandstypen.

Met de sink() functie kun je gegevens afdrukken of de gegevens of de R-uitvoer exporteren naar tekst- of CSV-bestandstypen.

Laten we kijken hoe het werkt!


De syntaxis van de sink() functie in R

Sink(): De sink-functie wordt gebruikt om de output verkregen in R naar de externe verbinding te sturen.

sink(file = NULL, type = c("output", "message"),split = FALSE)

Waar:

  • Bestand = De bewerkbare verbinding of het bestandstype.
  • Toevoegen = De logische functie die wordt gebruikt om de gegevens aan het bestand toe te voegen om overschrijven te voorkomen.
  • Splitsen = De uitvoer wordt omgeleid naar een nieuwe verbinding of link.

1. Het instellen van de werkmap

Met behulp van de sink() functie kun je eenvoudig de uitvoer naar het tekstbestand afdrukken als een verbinding. We kunnen dit proces starten door de werkmap in te stellen.

Om de huidige werkmap te controleren:

# geeft de huidige werkmap terug
getwd()
"C:/Users/Dell/Desktop/rfiles"

Goed. We hebben nu de werkmap. En je kunt ook de werkmap wijzigen met behulp van,

# stelt de nieuwe werkmap in
setwd("The directory path here")

Plak het pad in de setwd() functie om de nieuwe werkmap in te stellen. Vergeet daarna niet de wijzigingen te bevestigen met het ‘getwd()’ commando zoals hierboven getoond.


2. De gegevens afdrukken naar het tekstbestand

I hope you are ready with your working path now. Now we are going to create a file connection and print some data into it.

Laten we eens kijken hoe het werkt.

# drukt de gegevens af naar de verbinding als tekstbestand
sink("my_first_sink.txt")

# drukt getallen af van 1 tot 20
for (i in 1:20)
print(i)
sink()

Nu kun je zien hoe netjes onze R-gegevens worden afgedrukt in het tekstbestand. Geweldig toch?


3. De gegevens exporteren naar een tekstbestand

In de vorige sectie hebben we de gegevens of de output naar het tekstbestand afgedrukt. In deze sectie gaan we de volledige dataset exporteren die standaard beschikbaar is in R.

Laten we eens kijken hoe het werkt.

# exporteert de gegevens als tekstbestand
sink('export_dataframe.txt')
airquality
sink()

Je kunt zien dat de gegevens van de dataset “luchtkwaliteit” worden weggeschreven naar het tekstbestand als een externe verbinding.

Zo kun je gemakkelijk de gegevens in R naar verbindingen sturen. Je kunt ook exporteren als een CSV-bestand zoals hieronder wordt getoond.


4. Het data frame exporteren naar een CSV-bestand

In deze sectie gaan we de gegevens exporteren naar een CSV-bestand door gebruik te maken van de sink() functie in R.

Laten we eens kijken hoe het werkt.

# exporteer de gegevens als CSV-bestand
sink('export_dataframe_1.csv')
iris
sink()

Dit is een CSV-bestand dat de geëxporteerde gegevens vanuit de R-console bevat. De sink() functie in R biedt de eenvoudigste manier om de gegevens naar externe verbindingen zoals een bestand te sturen.


Exporteren van de samenvatting van de gegevens naar verbinding

Tot nu toe, zo goed. Laten we nu proberen toe te passen wat we hebben geleerd of begrepen uit de bovenstaande secties allemaal samen.

De probleemstelling is eenvoudig.

=> Lees een dataset naar keuze en krijg een samenvatting van de gegevens met behulp van de functie summary(). Nadat je dat hebt gedaan, leidt je het resultaat naar het tekstbestand als verbinding.

Laten we gaan!!!


1. Laten we de gegevens lezen

#leest de gegevens in
df<-datasets::airquality
df
View(df)

De eerste stap in de probleemstelling is hier. Je kunt het luchtkwaliteitsdataset zien in de bovenstaande afbeelding.


2. De samenvatting() van de gegevens

De samenvatting van de gegevens met behulp van de functie summary() kan hieronder worden gezien.

#geeft de belangrijkste inzichten van de gegevens weer
summary(airquality)
  Ozone           Solar.R           Wind             Temp           Month      
 Min.   :  1.00   Min.   :  7.0   Min.   : 1.700   Min.   :56.00   Min.   :5.000  
 1st Qu.: 18.00   1st Qu.:115.8   1st Qu.: 7.400   1st Qu.:72.00   1st Qu.:6.000  
 Median : 31.50   Median :205.0   Median : 9.700   Median :79.00   Median :7.000  
 Mean   : 42.13   Mean   :185.9   Mean   : 9.958   Mean   :77.88   Mean   :6.993  
 3rd Qu.: 63.25   3rd Qu.:258.8   3rd Qu.:11.500   3rd Qu.:85.00   3rd Qu.:8.000  
 Max.   :168.00   Max.   :334.0   Max.   :20.700   Max.   :97.00   Max.   :9.000  
 NA's   :37       NA's   :7                                                       
      Day      
 Min.   : 1.0  
 1st Qu.: 8.0  
 Median :16.0  
 Mean   :15.8  
 3rd Qu.:23.0  
 Max.   :31.0  

Dit is de samenvatting van de gegevens die de minimum- en maximumwaarden, kwartielen, mediaan, gemiddelde en meer inzichten laat zien.

3. Het uitvoer naar de verbinding sturen

Alles wat je nu hoeft te doen is het exporteren naar een tekstbestand en het als een externe verbinding maken.

#de uitvoergegevens naar een txt-bestand sturen
sink('problem-solution.txt')
summary(airquality)
sink()


4. De verbinding beëindigen

Je hebt alle stappen correct uitgevoerd en de gegevens succesvol in een tekstbestand als externe verbinding geplaatst.

Het is nu tijd om de verbinding te beëindigen.

#de verbinding beëindigen
unlink('problem-solution.txt')

De bovenstaande opdracht zal de bestandsverbinding verwijderen.

Om alle stappen samen te vatten,

  • Lees de gegevens in de R-console.
  • Pas de summary() functie toe op de gegevens.
  • Krijg belangrijke inzichten over de gegevens.
  • Stuur de bevindingen naar het tekstbestand met behulp van de sink() functie in R.

Afronden

De sink() functie in R stuurt de R-uitvoer naar de externe verbinding. U kunt de gegevens exporteren in meerdere vormen zoals tekst- en CSV-bestanden. U kunt de gegevens afdrukken in de verbinding of rechtstreeks de volledige gegevens ernaar exporteren.

Na de gegevensoverdracht kunt u de verbinding loskoppelen om het bestand te beëindigen.

De sink() functie in R is op vele manieren nuttig omdat het tijdelijke verbindingen biedt om met gegevens te werken.

Meer lezen: R documentatie

Source:
https://www.digitalocean.com/community/tutorials/sink-function-in-r