Backward Elimination

O processo de Eliminação Regressiva, ou Backward Elimination, é uma abordagem para escolha das variáveis de um modelo, que envolve iniciar com todas as variáveis candidatas, eliminando uma a uma as variáveis estatisticamente insignificantes para o modelo, encerrando o processo somente quando mais nenhuma variável possa ser eliminada sem que cause perda estatisticamente significativa.

BCB

É o Banco Central do Brasil.

É possível encontrar dados disponibilizados pelo BCB no próprio website, no Portal Brasileiro de Dados Abertos, ou através da biblioteca rbcb, que oferece centenas de indicadores do BCB prontos para consumo no R.

Projetos

O projeto Criptocurrency Market Capitalization busca as cotações de moedas do BCB através da biblioteca rbcb, para cotar as Criptomoedas em Real, visto que o site CoinMarketCap retorna cotações em dólar americano.

Já o projeto Dinheiro em Circulação no Brasil utiliza dados do BCB disponibilizados no Portal Brasileiro de Dados Abertos.

Ciência de Dados

Ciência de Dados, ou Data Science, refere-se ao estudo e análise de dados, visando a extração de conhecimento e ideias para apoio à tomada de decisão nos negócios.

Ciência de dados é uma área interdisciplinar que alia Big Data e Machine Learning, além de técnicas de estatística, economia, engenharia e áreas da computação como bancos de dados.

A área ganhou destaque com a popularização do Big Data e do Machine Learning. A Ciência de Dados vem sendo amplamente utilizada para apoio à tomada de decisão.

Machine Learning

Machine Learning, ou Aprendizado de Máquina, é um conjunto de algoritmos que permitem que computadores possam tomar decisões baseados em dados, ao invés de serem explicitamente programados para realizar alguma tarefa específica.

Abaixo uma lista de algoritmos utilizados em Machine Learning.

Algoritmos de Regressão

  1. Regressão Linear Simples (Simple Linear Regression)
  2. Regressão Linear Múltipla (Multiple Linear Regression)
  3. Regressão Polinomial (Polynomial Regression)
  4. Support Vector Regression – SVR
  5. Decision Tree Regression
  6. Random Forest Regression

Algoritmos de Classificação

  1. Logistic Regression
  2. K-Nearest Neighbors (K-NN)
  3. Support Vector Machine (SVM)
  4. Kernel SVM
  5. Naive Bayes
  6. Decision Tree Classification
  7. Random Forest Classification

Algoritmos de Agrupamento (Clustering)

  1. K-Means Clustering
  2. Hierarchical Clustering