Com a ajuda de funções específicas oferecidas pelo R, a leitura dos arquivos CSV em quadros de dados é muito mais fácil.
O que é um arquivo CSV?
CSV significa Valores Separados por Vírgula. Neste arquivo, os valores armazenados são separados por uma vírgula. Este processo de armazenamento de dados é muito mais fácil.
Por que o CSV é o formato de arquivo mais usado para armazenamento de dados?
Armazenar os dados em uma planilha do Excel é a prática mais comum em muitas empresas. Na maioria das empresas, as pessoas estão armazenando dados como valores separados por vírgula (CSV), pois o processo é mais fácil do que criar planilhas normais. Mais tarde, elas podem usar os pacotes incorporados do R para ler e analisar os dados.
Sendo a linguagem de programação de análise estatística mais popular e poderosa, o R oferece funções específicas para ler dados em quadros de dados organizados a partir de um arquivo CSV.
Lendo Arquivo CSV para Data Frame
Neste breve exemplo, veremos como podemos ler um arquivo CSV em quadros de dados organizados.
A primeira coisa neste processo é obter e configurar o diretório de trabalho. Você precisa escolher o caminho de trabalho do arquivo CSV.
1. Configurando o diretório de trabalho
Aqui você pode verificar o diretório de trabalho padrão usando a função getwd() e também pode alterar o diretório usando a função setwd().
>getwd() #Mostra o diretório de trabalho padrão
----> "C:/Users/Dell/Documents"
> setwd("C:\Users\Dell\Documents\R-test data") #para definir o novo diretório de trabalho
> getwd() #você pode ver o diretório de trabalho atualizado
---> "C:/Users/Dell/Documents/R-test data"
2. Importando e Lendo o conjunto de dados / arquivo CSV
Após a configuração do caminho de trabalho, você precisa importar o conjunto de dados ou um arquivo CSV conforme mostrado abaixo.
> readfile <- read.csv("testdata.txt")
Execute a linha de código acima no R Studio para obter o data frame conforme mostrado abaixo.
Para verificar a classe da variável ‘readfile’, execute o código abaixo.
> class(readfile)
---> "data.frame"
Na imagem acima, você pode ver o data frame que inclui as informações dos nomes dos alunos, seus IDs, departamentos, gênero e notas.
3. Extraindo as informações dos alunos do arquivo CSV
Após obter o data frame, agora você pode analisar os dados. Você pode extrair informações específicas do data frame.
Para extrair as notas mais altas obtidas pelos alunos,
>marks <- max(data$Marks.Scored) # isso lhe dará as notas mais altas
# Para extrair os detalhes de um aluno que obteve as notas mais altas,
> data <- read.csv("traindata.csv")
> Marks <- max(data$Marks.Scored)
> retval <- subset(data, Marks.Scored == max(Marks.Scored)) # Isso irá
extract the details of the student who secured highest marks
> View(retval)
Para extrair os detalhes dos alunos que estão estudando no departamento de ‘química’,
> readfile <- read.csv("traindata.csv")
> retval <- subset( data, Department == "chemistry") # Isso extrairá os detalhes dos alunos que estão no departamento de Bioquímica
> View(retval)
Conclusão
Por meio desse processo, você pode ler os arquivos CSV no R com o uso da função read.csv(” “). Este tutorial abrange como importar o arquivo CSV, ler o arquivo CSV e extrair algumas informações específicas do quadro de dados.
I used R studio for this project. RStudio offers great features like console, editor, and environment as well. Anyhow you are free to use other editors like Thinn-R, Crimson editor, etc. I hope this tutorial will help you in understanding the reading of CSV files in R and extracting some information from the data frame.
Para mais informações, consulte: https://cran.r-project.org/manuals.html
Source:
https://www.digitalocean.com/community/tutorials/r-read-csv-file-into-data-frame