Como abrir diferentes tipos de arquivos na linguagem R

O R é uma linguagem poderosa para análise de dados e estatística, e uma de suas maiores vantagens é a flexibilidade para importar dados de diversos formatos. A seguir, descrevemos os principais tipos de arquivos que podem ser lidos no R e exemplos práticos de como fazer isso.


1. Arquivos CSV (Comma-Separated Values)

O formato mais comum para dados tabulares.

  • Arquivos de texto simples, separados por vírgulas.
  • Muito usado para troca de dados entre sistemas.

arquivo_csv = read.csv("vendas.csv")   	
head(arquivo_csv)                            


2. Arquivos TSV (Tab-Separated Values)

Semelhante ao CSV, mas usa tabulação como separador.

  • Útil quando os dados contêm vírgulas em campos de texto.

arquivo_tsv = read.delim("vendas.tsv")     
head(arquivo_tsv)						  


3. Arquivos Excel (.xlsx / .xls)

R consegue ler planilhas diretamente, mantendo múltiplas abas.

  • Necessita do pacote readxl.

install.packages("readxl") 

library(readxl)
arquivo_excel = read_excel("vendas.xlsx")
head(arquivo_excel)						  


4. Arquivos JSON (JavaScript Object Notation)

Formato amplamente usado em APIs e dados web.

  • Estruturado em objetos e listas.
  • Necessita do pacote jsonlite.

install.packages("jsonlite")

library(jsonlite)
arquivo_json = fromJSON("vendas.json")
head(arquivo_json)					  


5. Arquivos XML (eXtensible Markup Language)

Formato de marcação hierárquico, comum em sistemas legados ou APIs.

  • Necessita do pacote XML.

install.packages("XML")

library(XML)
arquivo_xml = xmlToDataFrame("vendas.xml")
head(arquivo_xml)				  


6. Arquivos Web (HTML / Tabelas online)

R consegue ler diretamente tabelas de páginas web.

  • Necessita do pacote rvest.
  • Útil para scraping ou coleta de dados públicos.

install.packages("rvest")

library(rvest)
pagina = read_html(vendas.html")
arquivos_web = html_table(pagina)[[1]]
head(arquivo_web)				  


Conclusão.

A flexibilidade do R em ler diferentes formatos torna a linguagem extremamente versátil para análise de dados. Aprender a manipular arquivos CSV, Excel, JSON, XML e web é essencial para quem quer trabalhar com dados reais de diferentes fontes. Muito obrigado e até a próxima.

Repositório para estudo: https://github.com/jcarlossc/open-files-r

Comentários

Postagens mais visitadas deste blog