Com a ajuda das funções específicas oferecidas pelo R, a leitura de arquivos CSV em quadros de dados torna-se muito mais fácil.
O que é um arquivo CSV?
O CSV é a sigla para Comma Separated Values (Valores Separados por Vírgula). Nesse tipo de arquivo, os valores armazenados são separados por vírgulas. Esse processo de armazenamento de dados é bastante simples.
Por que o CSV é o formato de arquivo mais utilizado para armazenar dados?
O armazenamento de dados em uma planilha do Excel é a prática mais comum em muitas empresas. Na maioria das empresas, as pessoas estão armazenando dados no formato de valores separados por vírgula (CSV), pois o processo é mais fácil do que criar planilhas normais. Mais tarde, elas podem usar os pacotes integrados do R para ler e analisar os dados.
Sendo a linguagem de programação mais popular e poderosa para análise estatística, o R oferece funções específicas para ler dados em quadros de dados organizados a partir de um arquivo CSV.
Lendo Arquivo CSV para Data Frame
Neste exemplo breve, veremos como podemos ler um arquivo CSV em quadros de dados organizados.
A primeira coisa neste processo é obter e configurar o diretório de trabalho. Você precisa escolher o caminho de trabalho do arquivo CSV.
1. Configurando o diretório de trabalho
Aqui você pode verificar o diretório de trabalho padrão usando a função getwd() e também pode alterar o diretório usando a função setwd().
>getwd() #Mostra o diretório de trabalho padrão
----> "C:/Users/Dell/Documents"
> setwd("C:\Users\Dell\Documents\R-test data") #para definir o novo diretório de trabalho
> getwd() #você pode ver o diretório de trabalho atualizado
---> "C:/Users/Dell/Documents/R-test data"
2. Importando e Lendo o conjunto de dados / arquivo CSV
Após a configuração do caminho de trabalho, você precisa importar o conjunto de dados ou um arquivo CSV conforme mostrado abaixo.
> readfile <- read.csv("testdata.txt")
Execute a linha de código acima no R Studio para obter o quadro de dados conforme mostrado abaixo.
Para verificar a classe da variável ‘readfile’, execute o código abaixo.
> class(readfile)
---> "data.frame"
Na imagem acima, você pode ver o quadro de dados que inclui as informações dos nomes dos alunos, seus IDs, departamentos, gênero e notas.
3. Extraindo as informações dos alunos do arquivo CSV
Depois de obter o quadro de dados, agora você pode analisar os dados. Você pode extrair informações específicas do quadro de dados.
Para extrair as notas mais altas obtidas pelos alunos,
>marks <- max(data$Marks.Scored) #isso lhe dará as notas mais altas
#Para extrair os detalhes de um aluno que obteve as notas mais altas,
> data <- read.csv("traindata.csv")
> Marks <- max(data$Marks.Scored)
> retval <- subset(data, Marks.Scored == max(Marks.Scored)) #Isso vai
extract the details of the student who secured highest marks
> View(retval)
Para extrair os detalhes dos alunos que estão estudando no departamento de ‘química’,
> readfile <- read.csv("traindata.csv")
> retval <- subset( data, Department == "chemistry") # Isso vai extrair os detalhes dos alunos que estão no departamento de Bioquímica
> View(retval)
Conclusão
Por meio desse processo, você pode ler os arquivos csv no R com o uso da função read.csv(“”). Este tutorial abrange como importar o arquivo csv, ler o arquivo csv e extrair algumas informações específicas do data frame.
I used R studio for this project. RStudio offers great features like console, editor, and environment as well. Anyhow you are free to use other editors like Thinn-R, Crimson editor, etc. I hope this tutorial will help you in understanding the reading of CSV files in R and extracting some information from the data frame.
Para mais informações, leia: https://cran.r-project.org/manuals.html
Source:
https://www.digitalocean.com/community/tutorials/r-read-csv-file-into-data-frame