Tabela de Frequência em linguagem R
A tabela de frequência é uma das ferramentas mais básicas e importantes da estatística descritiva. Ela organiza os dados de forma resumida, mostrando quantas vezes cada valor aparece (frequência absoluta), como essa quantidade se acumula ao longo dos dados (frequência acumulada) e qual a proporção percentual que cada valor representa (frequência relativa e relativa acumulada). Nesta postagem, você vai entender o conceito de cada tipo de frequência e aprender a criar uma tabela de frequência completa em R, com tabela e gráfico ilustrativos.
Tipos de Frequência
- Frequência Absoluta (f):
- Número de vezes que um valor aparece nos dados.
- Frequência Acumulada (F):
- Soma acumulada das frequências absolutas até aquele ponto.
- Frequência Relativa (f%):
- Percentual que representa cada valor em relação ao total de observações.
- Frequência Relativa Acumulada (F%):
- Soma acumulada dos percentuais até aquele valor.
O que é uma Tabela de Frequência?
Quando temos um conjunto de dados, é comum haver repetições de valores. Em vez de listar todos os números, podemos resumir as ocorrências em uma tabela. Por exemplo, imagine as idades de um grupo de pessoas:
18, 19, 19, 20, 22, 22, 22, 22, 23, 23, 23, 24, 25, 25, 26, 26, 27, 27, 27
Conjunto de frequências individuais
1. Vetor com idades.
idades <- c(18, 19, 19, 20, 22, 22, 22, 22, 23, 23, 24, 25, 25, 26, 26, 27, 27, 27)
2. Frequência Absoluta (f):
freq_absoluta <- table(idades)
freq_absoluta
# Saída:
# 18 19 20 22 23 24 25 26 27
# 1 2 1 4 2 1 2 2 3
3. Frequência acumulada (F):
freq_acumulada <- cumsum(as.vector(freq_absoluta))
freq_acumulada
# Saída:
# [1] 1 3 4 8 10 11 13 15 18
4. Frequência relativa (f%):
freq_relativa <- prop.table(freq_absoluta) * 100
round(freq_relativa, 2)
# Saída:
# 18 19 20 22 23 24 25 26 27
# 5.56 11.11 5.56 22.22 11.11 5.56 11.11 11.11 16.67
5. Frequência relativa acumulada (F%):
freq_rel_acumulada <- cumsum(as.vector(freq_relativa))
round(freq_rel_acumulada, 2)
# Saída:
# [1] 5.56 16.67 22.22 44.44 55.56 61.11 72.22 83.33 100.00
Calcula distribuição de frequências(tudo em um)
Instala pacote dplyr:
install.packages("dplyr")
# Executar o pacote dplyr:
library(dplyr)
# Criar tabela de frequência
tabela_freq <- data.frame(idades) %>%
group_by(idades) %>%
summarise(frequencia = n()) %>%
mutate(
freq_acumulada = cumsum(frequencia),
freq_relativa = round((frequencia / sum(frequencia)) * 100, 1),
freq_rel_Acumulada = cumsum(freq_relativa)
)
# Visualizar tabela
tabela_freq
# Saída
# idades frequencia freq_acumulada freq_relativa freq_rel_Acumulada
#
# 1 18 1 1 5.6 5.6
# 2 19 2 3 11.1 16.7
# 3 20 1 4 5.6 22.3
# 4 22 4 8 22.2 44.5
# 5 23 2 10 11.1 55.6
# 6 24 1 11 5.6 61.2
# 7 25 2 13 11.1 72.3
# 8 26 2 15 11.1 83.4
# 9 27 3 18 16.7 100.
Gráfico de frequência absoluta.
# Gráfico de frequência absoluta.
barplot(
tabela_freq$frequencia,
names.arg = tabela_freq$idades,
main = "Gráfico de Frequência Absoluta",
xlab = "Idades",
ylab = "Frequência",
col = "skyblue",
border = "darkblue"
)
Imagem do gráfico de frequência absoluta:
Conclusão
As tabelas de frequência são uma das formas mais eficazes de resumir e visualizar dados. Com elas, é possível identificar:
- Quais valores aparecem com maior frequência (moda);
- Como os dados se acumulam;
- Qual a proporção percentual de cada categoria.
Em R, a criação dessas tabelas é simples, rápida e totalmente automatizável — ideal para análises exploratórias e relatórios estatísticos. Muito obrigado e até a próxima.
Repositório de exemplo: https://github.com/jcarlossc/tabela_frequencia
Comentários
Postar um comentário