С помощью конкретных функций, предлагаемых R, чтение CSV-файлов в виде данных становится намного проще.
Что такое CSV-файл?
CSV расшифровывается как Comma Separated Values. В этом файле значения разделены запятой. Этот процесс хранения данных намного удобнее.
Почему CSV – наиболее используемый формат файла для хранения данных?
Хранение данных в электронной таблице – наиболее распространенная практика во многих компаниях. В большинстве фирм люди хранят данные в формате, разделенном запятой (CSV), так как этот процесс проще, чем создание обычных электронных таблиц. Позднее они могут использовать встроенные пакеты R для чтения и анализа данных.
Будучи наиболее популярным и мощным языком программирования для статистического анализа, R предлагает конкретные функции для чтения данных в организованные фреймы данных из CSV-файла.
Чтение CSV файла в DataFrame
В этом небольшом примере мы увидим, как мы можем прочитать CSV файл в организованные таблицы данных.
Первое, что необходимо сделать в этом процессе, это выбрать и настроить рабочий каталог. Вам нужно выбрать рабочий путь к CSV файлу.
1. Настройка рабочего каталога
Здесь вы можете проверить текущий рабочий каталог с помощью функции getwd() и также изменить каталог с помощью функции setwd().
>getwd() # Показывает текущий рабочий каталог
----> "C:/Users/Dell/Documents"
> setwd("C:\Users\Dell\Documents\R-test data") # чтобы установить новый рабочий каталог
> getwd() # вы можете увидеть обновленный рабочий каталог
---> "C:/Users/Dell/Documents/R-test data"
2. Импорт и чтение набора данных / CSV файла
После установки рабочего пути вам нужно импортировать набор данных или CSV файл, как показано ниже.
> readfile <- read.csv("testdata.txt")
Выполните вышеприведенную строку кода в R Studio, чтобы получить следующую структуру данных.
Чтобы проверить класс переменной ‘readfile’, выполните следующий код.
> class(readfile)
---> "data.frame"
На приведенном выше изображении вы можете увидеть структуру данных, которая включает информацию о именах студентов, их идентификаторах, отделах, поле и оценках.
3. Извлечение информации о студентах из файла CSV
Получив структуру данных, вы можете анализировать данные. Вы можете извлекать определенную информацию из структуры данных.
Чтобы извлечь наивысшие оценки, получите следующий код.
>marks <- max(data$Marks.Scored) #это даст вам наивысшие оценки
#Для извлечения данных о студенте, который получил наивысшие оценки
> data <- read.csv("traindata.csv")
> Marks <- max(data$Marks.Scored)
> retval <- subset(data, Marks.Scored == max(Marks.Scored)) #Это
extract the details of the student who secured highest marks
> View(retval)
Чтобы извлечь данные о студентах, которые учатся на факультете “химия”, используйте следующий код.
> readfile <- read.csv("traindata.csv")
> retval <- subset( data, Department == "chemistry") #Это извлечет данные о студентах, которые обучаются на факультете биохимии
> View(retval)
Заключение
Через этот процесс вы можете читать файлы csv в R с помощью функции read.csv(). Этот учебник охватывает способы импорта файла csv, чтения файла csv и извлечения некоторой конкретной информации из данных.
I used R studio for this project. RStudio offers great features like console, editor, and environment as well. Anyhow you are free to use other editors like Thinn-R, Crimson editor, etc. I hope this tutorial will help you in understanding the reading of CSV files in R and extracting some information from the data frame.
Более подробно можно почитать здесь: https://cran.r-project.org/manuals.html
Source:
https://www.digitalocean.com/community/tutorials/r-read-csv-file-into-data-frame