Con la ayuda de funciones específicas ofrecidas por R, la lectura de archivos CSV en marcos de datos es mucho más fácil.
¿Qué es un archivo CSV?
CSV se expande como Valores Separados por Comas. En este archivo, los valores almacenados están separados por comas. Este proceso de almacenamiento de datos es mucho más fácil.
¿Por qué CSV es el formato de archivo más utilizado para almacenar datos?
Almacenar los datos en una hoja de cálculo de Excel es la práctica más común en muchas empresas. En la mayoría de las empresas, las personas almacenan datos como valores separados por comas (CSV), ya que el proceso es más fácil que crear hojas de cálculo normales. Más tarde, pueden usar los paquetes integrados de R para leer y analizar los datos.
Siendo el lenguaje de programación de análisis estadístico más popular y potente, R ofrece funciones específicas para leer datos en marcos de datos organizados desde un archivo CSV.
Leyendo Archivo CSV a Marco de Datos
En este breve ejemplo, veremos cómo podemos leer un archivo CSV en marcos de datos organizados.
Lo primero en este proceso es obtener y configurar el directorio de trabajo. Debes elegir la ruta de trabajo del archivo CSV.
1. Configurando el directorio de trabajo
Aquí puedes verificar el directorio de trabajo predeterminado usando la función getwd() y también puedes cambiar el directorio con la función setwd().
>getwd() # Muestra el directorio de trabajo predeterminado
----> "C:/Users/Dell/Documents"
> setwd("C:\Users\Dell\Documents\R-test data") # para establecer el nuevo directorio de trabajo
> getwd() # puedes ver el directorio de trabajo actualizado
---> "C:/Users/Dell/Documents/R-test data"
2. Importando y leyendo el conjunto de datos/archivo CSV
Después de configurar la ruta de trabajo, necesitas importar el conjunto de datos o un archivo CSV como se muestra a continuación.
> readfile <- read.csv("testdata.txt")
Ejecuta la línea de código anterior en R Studio para obtener el data frame como se muestra a continuación.
Para verificar la clase de la variable ‘readfile’, ejecuta el siguiente código.
> class(readfile)
---> "data.frame"
En la imagen anterior puedes ver el data frame que incluye la información de los nombres de los estudiantes, sus ID, departamentos, género y notas.
3. Extracción de la información de los estudiantes del archivo CSV
Después de obtener el data frame, ahora puedes analizar los datos. Puedes extraer información particular del data frame.
Para extraer la nota más alta obtenida por los estudiantes,
>marks <- max(data$Marks.Scored) #esto te dará la nota más alta
#Para extraer los detalles de un estudiante que obtuvo la nota más alta,
> data <- read.csv("traindata.csv")
> Marks <- max(data$Marks.Scored)
> retval <- subset(data, Marks.Scored == max(Marks.Scored)) #Esto
extract the details of the student who secured highest marks
> View(retval)
Para extraer los detalles de los estudiantes que están estudiando en el departamento de ‘química’,
> readfile <- read.csv("traindata.csv")
> retval <- subset( data, Department == "chemistry") #Esto extraerá los detalles de los estudiantes que están en el departamento de Bioquímica
> View(retval)
Conclusión
Por este proceso, puedes leer los archivos CSV en R con el uso de la función read.csv(“”). Este tutorial cubre cómo importar el archivo CSV, leerlo y extraer información específica del marco de datos.
I used R studio for this project. RStudio offers great features like console, editor, and environment as well. Anyhow you are free to use other editors like Thinn-R, Crimson editor, etc. I hope this tutorial will help you in understanding the reading of CSV files in R and extracting some information from the data frame.
Para obtener más información, consulta: https://cran.r-project.org/manuals.html
Source:
https://www.digitalocean.com/community/tutorials/r-read-csv-file-into-data-frame