MÉTODOS BAYESIANOS DE SELEÇÃO DE VARIÁVEIS
KM, GVS, SSVS
Inferência bayesiana
OpenBUGS
Inferência bayesiana
Regressão linear múltipla
Análise estatística
Carneiro, Denise de Oliveira Alves | Publicado en:
2017
Resumen
A quantidade de dados gerados no dia a dia tem aumentado demasiadamente e com isso o interesse em se explicar um determinado desfecho tem-se tornado mais difícil, muitas vezes pela presença da multicolinearidade. Então surge a necessidade de métodos de seleção de variáveis que além de serem eficientes sejam mais rápidos e mais fáceis de se utilizar. Existem vários métodos de seleção de variáveis disponíveis na literatura. Dentre os mais utilizados estão o critério de informação de Akaike, AIC, de informação bayesiana, BIC, e o de informação do desvio, DIC, porém estes métodos são divididos em dois passos, ajustar todos os modelos possíveis e posteriormente calcular uma das medidas citadas para cada modelo e compará-los a fim de saber qual o melhor modelo. Como pode-se observar estes métodos podem ser bastante trabalhosos ou até mesmo inviáveis em alguns cenários. Uma possível alternativa aos métodos clássicos é a utilização de métodos de seleção de variáveis com o enfoque bayesiano. Os métodos bayesianos de seleção de variáveis baseiam-se em um único ajuste e utilizam uma variável indicadora responsável por determinar se uma variável é selecionada ou não e com isso torna possível quantificar a probabilidade de cada variável ser selecionada e a probabilidade de um determinado modelo ser escolhido. Neste trabalho é apresentado um estudo voltado para modelos de regressão linear múltiplo com três métodos bayesianos de seleção de variáveis: método de seleção de variáveis de Kuo & Mallick, métodos de seleção de variáveis de Gibbs e método de seleção de variáveis via busca estocástica. O objetivo é comparar tais métodos, através de um estudo de simulação de dois cenários (com presença/ausência de multicolinearidade) e modificando o valor inicial das variáveis indicadoras. Os três métodos estudados apresentaram bons resultados em ambos os cenários. Para os dois cenários observados o método de seleção de variáveis via busca estocástica se mostrou o mais rápido e o melhor por apresentar a maior probabilidade de o modelo correto ser visitado, sendo visitado 100% das vezes no cenário dependente quando as 4 primeiras variáveis indicadoras assumiram como valor inicial 1. Os valores iniciais adotados para todos os métodos nos dois cenários não influenciaram no ajuste do modelo para a probabilidade a posteriori, com exceção do método de seleção de variáveis via busca estocástica que sofreu influência quando se inicializava as quatro primeiras covariáveis em zero, caindo absurdamente a probabilidade. Este trabalho utilizou uma abordagem completamente bayesiana e os resultados computacionais foram obtidos por meio do R e BUGS (Bayesian inference Using Gibbs Sampling)
[Texto sem Formatação]
[Texto sem Formatação]
Tipo de documento
Trabalho de conclusão de cursoFuente
CARNEIRO, Denise de Oliveira Alves. Métodos bayesianos de seleção de variáveis. 2017. 44 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2017.Sujeta/Sujeto(s)
Métodos de seleção de variáveisKM, GVS, SSVS
Inferência bayesiana
OpenBUGS
Inferência bayesiana
Regressão linear múltipla
Análise estatística
Término de licencia
CC-BY-SAEl ítem tiene asociados los siguientes ficheros de licencia: