Lendo o arquivo CSV em quadros de dados no R

Com a ajuda das funções específicas oferecidas pelo R, a leitura de arquivos CSV em quadros de dados torna-se muito mais fácil.

O que é um arquivo CSV?

O CSV é a sigla para Comma Separated Values (Valores Separados por Vírgula). Nesse tipo de arquivo, os valores armazenados são separados por vírgulas. Esse processo de armazenamento de dados é bastante simples.


Por que o CSV é o formato de arquivo mais utilizado para armazenar dados?

O armazenamento de dados em uma planilha do Excel é a prática mais comum em muitas empresas. Na maioria das empresas, as pessoas estão armazenando dados no formato de valores separados por vírgula (CSV), pois o processo é mais fácil do que criar planilhas normais. Mais tarde, elas podem usar os pacotes integrados do R para ler e analisar os dados.

Sendo a linguagem de programação mais popular e poderosa para análise estatística, o R oferece funções específicas para ler dados em quadros de dados organizados a partir de um arquivo CSV.


Lendo Arquivo CSV para Data Frame

Neste exemplo breve, veremos como podemos ler um arquivo CSV em quadros de dados organizados.

A primeira coisa neste processo é obter e configurar o diretório de trabalho. Você precisa escolher o caminho de trabalho do arquivo CSV.

1. Configurando o diretório de trabalho

Aqui você pode verificar o diretório de trabalho padrão usando a função getwd() e também pode alterar o diretório usando a função setwd().

>getwd() #Mostra o diretório de trabalho padrão 

---->   "C:/Users/Dell/Documents"

> setwd("C:\Users\Dell\Documents\R-test data") #para definir o novo diretório de trabalho

> getwd() #você pode ver o diretório de trabalho atualizado

---> "C:/Users/Dell/Documents/R-test data"

2. Importando e Lendo o conjunto de dados / arquivo CSV

Após a configuração do caminho de trabalho, você precisa importar o conjunto de dados ou um arquivo CSV conforme mostrado abaixo.

> readfile <- read.csv("testdata.txt")

Execute a linha de código acima no R Studio para obter o quadro de dados conforme mostrado abaixo.

Para verificar a classe da variável ‘readfile’, execute o código abaixo.

> class(readfile)

---> "data.frame"            

Na imagem acima, você pode ver o quadro de dados que inclui as informações dos nomes dos alunos, seus IDs, departamentos, gênero e notas.

3. Extraindo as informações dos alunos do arquivo CSV

Depois de obter o quadro de dados, agora você pode analisar os dados. Você pode extrair informações específicas do quadro de dados.

Para extrair as notas mais altas obtidas pelos alunos,

>marks <- max(data$Marks.Scored) #isso lhe dará as notas mais altas

#Para extrair os detalhes de um aluno que obteve as notas mais altas,

> data <- read.csv("traindata.csv")

> Marks <- max(data$Marks.Scored)

> retval <- subset(data, Marks.Scored == max(Marks.Scored))   #Isso vai
 extract the details of the student who secured highest marks 

> View(retval)

Para extrair os detalhes dos alunos que estão estudando no departamento de ‘química’,

> readfile <- read.csv("traindata.csv")

> retval <- subset( data, Department == "chemistry")  # Isso vai extrair os detalhes dos alunos que estão no departamento de Bioquímica
 
> View(retval)


Conclusão

Por meio desse processo, você pode ler os arquivos csv no R com o uso da função read.csv(“”). Este tutorial abrange como importar o arquivo csv, ler o arquivo csv e extrair algumas informações específicas do data frame.

I used R studio for this project. RStudio offers great features like console, editor, and environment as well. Anyhow you are free to use other editors like Thinn-R, Crimson editor, etc. I hope this tutorial will help you in understanding the reading of CSV files in R and extracting some information from the data frame.

Para mais informações, leia: https://cran.r-project.org/manuals.html

Source:
https://www.digitalocean.com/community/tutorials/r-read-csv-file-into-data-frame