Visualização de Dados com ggplot2 em R
Se você trabalha com análise de dados em R, certamente já ouviu falar do ggplot2, um dos pacotes mais poderosos e versáteis para criação de gráficos e visualizações de alta qualidade. Nesta postagem, você vai aprender o que é o ggplot2, como ele funciona e verá exemplos práticos de gráficos mais usados no dia a dia de quem analisa dados.
O que é o ggplot2?
O ggplot2 foi criado por Hadley Wickham e faz parte do Tidyverse, um conjunto de pacotes voltados para manipulação e visualização de dados. O nome vem de Grammar of Graphics (Gramática dos Gráficos), um conceito criado por Leland Wilkinson que propõe que todo gráfico é formado por camadas, como dados, mapeamentos estéticos, geometrias e temas.
Essa ideia permite que o usuário monte gráficos de forma declarativa, ou seja, descrevendo o que quer visualizar, e não como desenhar cada parte.
Estrutura básica de um gráfico
A estrutura básica de um gráfico em ggplot2 segue a forma:
ggplot(data = dados, aes(x = variavel_x, y = variavel_y)) +
geom_tipo() +
theme_minimal()
- data → o conjunto de dados usado
- aes() → define os mapeamentos estéticos (x, y, cor, tamanho, forma etc.)
- geom_ → indica o tipo de geometria (barras, pontos, linhas...)
- theme_ → define o estilo visual
Instalação e carregamento do pacote
# Instalação do pacote.
install.packages("ggplot2")
# Carregamento do pacote.
library(ggplot2)
Conjunto de dados fictício
Criação de um dataframe completo e variado para testar os gráficos do ggplot2.
dados <- data.frame(
Ano = rep(2018:2023, each = 12), # anos
Mês = rep(month.abb, times = 6), # meses abreviados (Jan, Feb, ...)
Categoria = rep(c("Eletrônicos", "Roupas", "Alimentos"), each = 24), # 3 categorias
Região = rep(c("Norte", "Sul", "Leste", "Oeste"), times = 18), # 4 regiões
Vendas = round(runif(72, 1000, 5000), 0), # vendas aleatórias
Lucro = round(runif(72, 200, 1500), 0), # lucro aleatório
Clientes = round(runif(72, 50, 300), 0) # número de clientes
)
Gráfico de Dispersão
Mostra a relação entre duas variáveis numéricas (correlação). Cada ponto representa uma observação.
ggplot(dados, aes(x = Vendas, y = Lucro, color = Categoria, size = Clientes)) +
geom_point(alpha = 0.7) +
labs(title = "Relação entre Vendas, Lucro e Clientes", x = "Vendas", y = "Lucro") +
theme_bw()

Gráfico de Linhas
Conecta valores consecutivos, geralmente para representar mudanças no tempo. Pode ser usado com múltiplas linhas (uma por grupo).
ggplot(dados, aes(x = Ano, y = Vendas, color = Categoria, group = Categoria)) +
geom_line(linewidth = 1) +
geom_point(size = 2) +
labs(title = "Evolução das Vendas por Categoria", x = "Ano", y = "Vendas") +
theme_light()









Comentários
Postar um comentário