Eliminação regressiva automática

Em Machine Learning, é muito comum realizarmos o processo de eliminação regressiva (Backward Elimination) em Regressões Lineares, a fim de diminuir o conjunto de variáveis independentes x que influenciam a variável dependente y, criando um modelo bom e simples.

Esse processo pode ser feito de forma automática, e abaixo compartilho um trecho de código para fazer a eliminação regressiva em R.

Repare que o nome da variável dependente está fixo no algoritmo (Profit). No caso você deve substituí-la pelo nome da sua variável dependente y.

backwardElimination <- function(x, sl) {
  
  numVars = length(x)
  
  for (i in c(1:numVars)){
    regressor <- lm(formula = Profit ~ ., data = x)
    maxVar <- max(coef(summary(regressor))[c(2:numVars), "Pr(>|t|)"])
    if (maxVar > sl){
      j = which(coef(summary(regressor))[c(2:numVars), "Pr(>|t|)"] == maxVar)
      x = x[, -j]
    }
    numVars <- numVars - 1
  }
  return(summary(regressor))
}
dataset = ...

SL = 0.05 
training_set = ...
backwardElimination(training_set, SL)

....

Dinheiro em Circulação no Brasil

Esse  documento rmarkdown foi desenvolvido para explorar dados referentes à circulação de dinheiro em espécie no Brasil. Em uma breve jornada vemos valores, tipos e raridade das moedas e cédulas em circulação, e também mostramos a substituição das mesmas ao longo dos anos.

Visualização online

O documento rmarkdown pode ser visualizado no link http://www.decifrandodados.com.br:81/DinheiroCirculacao.

Ler maisDinheiro em Circulação no Brasil

Criptocurrency Market Capitalization

Esse  documento rmarkdown foi desenvolvido com o objetivo de explorar no R dados referentes às principais Criptomoedas do mercado, utilizando dados do website CoinMarketCap.

Visualização online

O documento rmarkdown pode ser visualizado no link http://www.decifrandodados.com.br:81/CryptoMarket.

Ler maisCriptocurrency Market Capitalization

Estimativas Populacionais do Brasil

Esse  documento rmarkdown foi desenvolvido com o objetivo de explorar as estimativas populacionais do Brasil, utilizando dados do IBGE de 2017. Aqui fazemos uma jornada explorando os extremos de população e densidades nas diversas unidades federativas do país, destacando contrastes encontrados neste grande país.

Visualização online

O documento rmarkdown pode ser visualizado no link http://www.decifrandodados.com.br:81/EstimativasPopulacionais.

Ler maisEstimativas Populacionais do Brasil