Como abrir diferentes tipos de arquivos na linguagem R
O R é uma linguagem poderosa para análise de dados e estatística, e uma de suas maiores vantagens é a flexibilidade para importar dados de diversos formatos. A seguir, descrevemos os principais tipos de arquivos que podem ser lidos no R e exemplos práticos de como fazer isso.
1. Arquivos CSV (Comma-Separated Values)
O formato mais comum para dados tabulares.
- Arquivos de texto simples, separados por vírgulas.
- Muito usado para troca de dados entre sistemas.
arquivo_csv = read.csv("vendas.csv")
head(arquivo_csv)
2. Arquivos TSV (Tab-Separated Values)
Semelhante ao CSV, mas usa tabulação como separador.
- Útil quando os dados contêm vírgulas em campos de texto.
arquivo_tsv = read.delim("vendas.tsv")
head(arquivo_tsv)
3. Arquivos Excel (.xlsx / .xls)
R consegue ler planilhas diretamente, mantendo múltiplas abas.
- Necessita do pacote readxl.
install.packages("readxl")
library(readxl)
arquivo_excel = read_excel("vendas.xlsx")
head(arquivo_excel)
4. Arquivos JSON (JavaScript Object Notation)
Formato amplamente usado em APIs e dados web.
- Estruturado em objetos e listas.
- Necessita do pacote jsonlite.
install.packages("jsonlite")
library(jsonlite)
arquivo_json = fromJSON("vendas.json")
head(arquivo_json)
5. Arquivos XML (eXtensible Markup Language)
Formato de marcação hierárquico, comum em sistemas legados ou APIs.
- Necessita do pacote XML.
install.packages("XML")
library(XML)
arquivo_xml = xmlToDataFrame("vendas.xml")
head(arquivo_xml)
6. Arquivos Web (HTML / Tabelas online)
R consegue ler diretamente tabelas de páginas web.
- Necessita do pacote rvest.
- Útil para scraping ou coleta de dados públicos.
install.packages("rvest")
library(rvest)
pagina = read_html(vendas.html")
arquivos_web = html_table(pagina)[[1]]
head(arquivo_web)
Conclusão.
A flexibilidade do R em ler diferentes formatos torna a linguagem extremamente versátil para análise de dados. Aprender a manipular arquivos CSV, Excel, JSON, XML e web é essencial para quem quer trabalhar com dados reais de diferentes fontes. Muito obrigado e até a próxima.
Repositório para estudo: https://github.com/jcarlossc/open-files-r
Comentários
Postar um comentário