Чтение CSV-файла в фреймы данных в R

С помощью конкретных функций, предлагаемых R, чтение CSV-файлов в виде данных становится намного проще.

Что такое CSV-файл?

CSV расшифровывается как Comma Separated Values. В этом файле значения разделены запятой. Этот процесс хранения данных намного удобнее.


Почему CSV – наиболее используемый формат файла для хранения данных?

Хранение данных в электронной таблице – наиболее распространенная практика во многих компаниях. В большинстве фирм люди хранят данные в формате, разделенном запятой (CSV), так как этот процесс проще, чем создание обычных электронных таблиц. Позднее они могут использовать встроенные пакеты R для чтения и анализа данных.

Будучи наиболее популярным и мощным языком программирования для статистического анализа, R предлагает конкретные функции для чтения данных в организованные фреймы данных из CSV-файла.


Чтение CSV файла в DataFrame

В этом небольшом примере мы увидим, как мы можем прочитать CSV файл в организованные таблицы данных.

Первое, что необходимо сделать в этом процессе, это выбрать и настроить рабочий каталог. Вам нужно выбрать рабочий путь к CSV файлу.

1. Настройка рабочего каталога

Здесь вы можете проверить текущий рабочий каталог с помощью функции getwd() и также изменить каталог с помощью функции setwd().

>getwd() # Показывает текущий рабочий каталог 

---->   "C:/Users/Dell/Documents"

> setwd("C:\Users\Dell\Documents\R-test data") # чтобы установить новый рабочий каталог

> getwd() # вы можете увидеть обновленный рабочий каталог

---> "C:/Users/Dell/Documents/R-test data"

2. Импорт и чтение набора данных / CSV файла

После установки рабочего пути вам нужно импортировать набор данных или CSV файл, как показано ниже.

> readfile <- read.csv("testdata.txt")

Выполните вышеприведенную строку кода в R Studio, чтобы получить следующую структуру данных.

Чтобы проверить класс переменной ‘readfile’, выполните следующий код.

> class(readfile)

---> "data.frame"            

На приведенном выше изображении вы можете увидеть структуру данных, которая включает информацию о именах студентов, их идентификаторах, отделах, поле и оценках.

3. Извлечение информации о студентах из файла CSV

Получив структуру данных, вы можете анализировать данные. Вы можете извлекать определенную информацию из структуры данных.

Чтобы извлечь наивысшие оценки, получите следующий код.

>marks <- max(data$Marks.Scored) #это даст вам наивысшие оценки

#Для извлечения данных о студенте, который получил наивысшие оценки

> data <- read.csv("traindata.csv")

> Marks <- max(data$Marks.Scored)

> retval <- subset(data, Marks.Scored == max(Marks.Scored))   #Это
 extract the details of the student who secured highest marks 

> View(retval)

Чтобы извлечь данные о студентах, которые учатся на факультете “химия”, используйте следующий код.

> readfile <- read.csv("traindata.csv")

> retval <- subset( data, Department == "chemistry")  #Это извлечет данные о студентах, которые обучаются на факультете биохимии 
 
> View(retval)


Заключение

Через этот процесс вы можете читать файлы csv в R с помощью функции read.csv(). Этот учебник охватывает способы импорта файла csv, чтения файла csv и извлечения некоторой конкретной информации из данных.

I used R studio for this project. RStudio offers great features like console, editor, and environment as well. Anyhow you are free to use other editors like Thinn-R, Crimson editor, etc. I hope this tutorial will help you in understanding the reading of CSV files in R and extracting some information from the data frame.

Более подробно можно почитать здесь: https://cran.r-project.org/manuals.html

Source:
https://www.digitalocean.com/community/tutorials/r-read-csv-file-into-data-frame