Postagens

Mostrando postagens de outubro, 2025
Imagem
Manipulação de Dados com o Pacote dplyr Repositório de exemplo: https://github.com/jcarlossc/dplyr-functions-r O pacote dplyr é uma das ferramentas mais poderosas e populares para manipulação e transformação de dados na linguagem R. Ele faz parte do ecossistema tidyverse e oferece uma sintaxe simples, expressiva e eficiente para trabalhar com data frames (ou tibbles). Nesta postagem, você vai aprender os principais conceitos e funções do dplyr. O que é o dplyr? O dplyr foi criado para simplificar o trabalho com conjuntos de dados tabulares. Ele permite selecionar, filtrar, ordenar, agrupar e resumir informações de forma clara e performance otimizada. Para começar, basta instalar e carregar o pacote: # Instalar. install.packages("dplyr") # Carregar library(dplyr) 1. As seis funções básicas. Função Descrição Exemplo select() Seleciona colunas select(dados, nome, idade) filter() Filtra lin...
Imagem
Distribuição de Frequência com intevalo de classe em linguagem R A distribuição de frequência é uma das ferramentas mais básicas e importantes da estatística descritiva. Ela organiza os dados de forma resumida, mostrando o número de classes, o ponto médios das classes, quantas vezes cada valor aparece (frequência absoluta), como essa quantidade se acumula ao longo dos dados (frequência absoluta acumulada), e qual a proporção percentual que cada valor representa (frequência relativa e relativa acumulada). Nesta postagem, você vai entender o conceito de cada tipo de frequência e aprender a criar uma distribuição de frequência completa em R, com tabela e gráficos ilustrativos. Tipos de Frequência Classes (K): São intervalos de valores que agrupam os dados. Ponto médio (pm): São os valores que representam o centro do intervalo das classes. Frequência Absoluta (f): Número de vezes ...
Imagem
Explorando o ecossistema tidyverse na linguagem R Quando pensamos em ciência de dados com R, um dos nomes que mais aparece é o tidyverse. Mas afinal, o que é esse conjunto de pacotes e por que ele se tornou tão popular entre analistas, cientistas de dados e pesquisadores? O que é o tidyverse? O tidyverse é um ecossistema de pacotes no R criado para facilitar o trabalho com dados. A ideia central é seguir a filosofia do tidy data, onde: cada variável é uma coluna, cada observação é uma linha,, cada valor é uma célula. Essa padronização torna os dados mais fáceis de manipular, analisar e visualizar. O tidyverse cobre todo o fluxo de ciência de dados: Importar dados Organizar dados Transformar dados Visualizar resultadoss Modelar dados Comunicar resultados Modo de utilizar: A instalação deve ser executada no console do RStudio. install.packages("tidyverse") Após a instalação, quando você execut...