Meu IV é ordinal (escala de Likert 1 a 5), meu DV é binário (sim contra No.). Eu calculado GLM com testes de diferença subseqüentes (glht). Primeiro eu estava tratando o IV como numérico contínuo para um efeito global: datasetIV. num lt - as. numeric (datasetIV) datasetDV. fac lt - as. factor (datasetDV) glmmodel lt - glm (DV. fac IV. num, datadataset, Family binomial (linklogit)) resumo (glmmodel) Então eu calculei o modelo nulo: glmmodel. null lt - glm (DV. fac 1, datadataset, binomial da família (linklogit)) resumo (glmmodel. null) anova (glmmodel, glmmodel. null , TestChisq) De AIC-diferença e anova () eu posso ver, que o IV tem um efeito global significativo sobre o modelo. (Correto) Agora eu comecei a tratar o IV como fator ordenado para o glht (), a fim de procurar diferenças de nível no IV. DatasetIV. ord lt - as. ordered (datasetIV) glmmodel. ord lt - glm (DV. fac IV. ord, datadataset, binomial da família (linklogit)) resumo (glmmodel. ord, linfctmcp (IV. ordTukey)) (Glhtresults) Este último resultado que eu não entendo. Na minha opinião, não corresponde aos dados brutos. Quando eu tenho um olhar para os dados brutos traçados (ver abaixo), não posso acreditar que existia uma diferença significativa, e. Entre os níveis 4 e 5 do IV, mas não entre os níveis 1 e 5. Alguém pode apontar a culpa que eu faço É o procedimento glht a escolha certa Muito obrigado, FlorianGeneralized Modelos lineares em R, Parte 1: Calculando a probabilidade prevista em binário Regressão Logística por David Lillis, Ph. D. A regressão de mínimos quadrados ordinários fornece modelos lineares de variáveis contínuas. No entanto, muitos dados de interesse para estatísticos e pesquisadores não são contínuos e, portanto, outros métodos devem ser usados para criar modelos preditivos úteis. O comando glm () é projetado para executar modelos lineares generalizados (regressões) em dados de resultado binários, dados de contagem, dados de probabilidade, dados de proporção e muitos outros tipos de dados. Nesta postagem do blog, exploramos o uso do comando Rs glm () em um desses tipos de dados. Vamos dar uma olhada em um exemplo simples onde nós modelar dados binários. No conjunto de dados mtcars, a variável vs indica se um carro tem um motor V ou um motor reto. Queremos criar um modelo que nos ajude a prever a probabilidade de um veículo ter um motor V ou um motor reto dado um peso de 2100 lbs e deslocamento do motor de 180 polegadas cúbicas. Primeiro, ajustamos o modelo: Usamos a função glm (), incluímos as variáveis da maneira usual e especificamos uma distribuição de erro binomial, como segue: Vemos a partir das estimativas dos coeficientes que o peso influencia positivamente, enquanto o deslocamento tem um Ligeiramente negativo. O modelo de saída é um pouco diferente daquele de um modelo de mínimos quadrados ordinário. Vou explicar a saída em mais detalhes no próximo artigo, mas por agora, vamos continuar com os nossos cálculos. Lembre-se, nosso objetivo aqui é calcular uma probabilidade predita de um motor V, para valores específicos dos preditores: um peso de 2100 libras e deslocamento do motor de 180 polegadas cúbicas. Para fazer isso, criamos um quadro de dados chamado newdata, no qual incluímos os valores desejados para a nossa previsão. Agora usamos a função predict () para calcular a probabilidade prevista. Incluímos o argumento type8221response8221 para obter nossa previsão. A probabilidade prevista é 0,24. Isso não foi tão difícil no nosso próximo artigo. Vou explicar mais sobre a saída que temos da função glm (). Sobre o autor: David Lillis ensinou R a muitos pesquisadores e estatísticos. Sua empresa, Sigma Statistics and Research Limited. Fornece instrução on-line e oficinas presenciais em R, e serviços de codificação em R. David é doutorado em estatística aplicada. Quer aprender a função GLs Rs Nesta oficina de seis horas. Você aprenderá a usar glm () para especificar regressões probit logísticas, regressões binárias negativas de poisson e regressões gama ... e incluir as opções específicas para cada uma delas. Related PostsGeneralized Linear Models Consulte a ajuda (glm) para outras opções de modelagem. Consulte a ajuda (família) para obter outras funções de link permitidas para cada família. Três subtipos de modelos lineares generalizados serão abordados aqui: regressão logística, regressão de poisson e análise de sobrevivência. Regressão logística A regressão logística é útil quando você está prevendo um resultado binário a partir de um conjunto de variáveis preditoras contínuas. É freqüentemente preferido sobre a análise de função discriminante por causa de suas suposições menos restritivas. Regressão logística onde F é um fator binário e x1-x3 são preditores contínuos que se encaixam lt - glm (F x1x2x3, datamydata, familybinomial ()) resumo (ajuste) display results confint (fit) 95 IC para os coeficientes exp (coef (fit) ) Coeficientes exponenciados exp (confint (ajuste)) 95 IC para coeficientes exponenciais predizer (ajuste, tipoquotresponsequot) valores preditos residuals (ajuste, tipoquotdeviancequot) residuais x, dados mydata) exibirá o gráfico de densidade condicional do resultado binário F no x contínuo variável. Regressão de Poisson A regressão de Poisson é útil para predizer uma variável de resultado representando contagem de um conjunto de variáveis preditoras contínuas. Poisson Regressão onde contagem é uma contagem e x1-x3 são preditores contínuos que se encaixam lt - glm (contagem x1x2x3, datamydata, familypoisson ()) resumo (ajuste) exibir resultados Se você tem overdispersion (veja se o desvio residual é muito maior do que graus de liberdade ), Você pode querer usar quasipoisson () em vez de poisson (). Análise de sobrevivência A análise de sobrevivência (também chamada análise de histórico de eventos ou análise de confiabilidade) abrange um conjunto de técnicas para modelar o tempo de um evento. Os dados podem ser censurados corretamente - o evento pode não ter ocorrido até o final do estudo ou podemos ter informações incompletas sobre uma observação, mas sabemos que até certo tempo o evento não tinha ocorrido (por exemplo, o participante deixou de estudar na semana 10, mas estava vivo naquela época). Enquanto os modelos lineares generalizados são tipicamente analisados usando a função glm (), a análise de sobrevivência é tipicamente realizada usando funções do pacote de sobrevivência. O pacote de sobrevivência pode lidar com um e dois problemas de amostra, modelos paramétricos de falha acelerada e o modelo de riscos proporcionais de Cox. Normalmente, os dados são inseridos na hora de início do formato. pare o tempo . E status (1evento ocorreu, 0evento não ocorreu). Alternativamente, os dados podem estar no formato de tempo para evento e status (1evento ocorreu, 0evento não ocorreu). Um status0 indica que a observação está correta. Os dados são empacotados em um objeto Surv através da função Surv () antes de outras análises. Sobrevivência () é usado para estimar uma distribuição de sobrevivência para um ou mais grupos. Survdiff () testes para diferenças nas distribuições de sobrevivência entre dois ou mais grupos. Coxph () modela a função hazard em um conjunto de variáveis preditoras. Mayo Clinic Câncer de pulmão Biblioteca de dados (sobrevivência) aprender sobre o conjunto de dados ajuda (pulmão) criar um Surv objeto sobreviver lt - com (pulmão, Surv (tempo, estado)) Plot sobrevivência distribuição da amostra total Kaplan-Meier estimador fit0 lt - (Survobj 1, datalung) resumo (fit0) parcela (fit0, xlabquotSurvival Time em Daysquot, ylabquot Survivingquot, yscale100, mainquotSurvival Distribution (Overall) quot) Compare as distribuições de sobrevivência de homens e mulheres fit1 lt - survit (Quottoprightquot, titlequotGenderquot, c (quotMalequot, quotbluequot), fillc (quotredquot, quotbluequot)) teste de diferença (fit1, xlabquotSurvival Time em Daysquot, ylabquot Survivingquot, yscale100, colc (quotredquot, quotbluequot) Entre as curvas de sobrevivência masculina e feminina (teste logarítmico), sobrevivência (sobrevivência) predizem a sobrevivência masculina a partir da idade e pontuações médicas MaleMod lt-coxph (survobj ageph. ecogph. karnopat. karno, datalung, sub Setsex1) exibir resultados MaleMod avaliar a hipótese de riscos proporcionais cox. zph (MaleMod) Veja Thomas Lumleys R artigo de notícias sobre o pacote de sobrevivência para obter mais informações. Outras boas fontes incluem Mai Zhous Use R Software para fazer Análise de Sobrevivência e Simulação e M. J. Crawleys capítulo sobre Análise de Sobrevivência. Praticar
No comments:
Post a Comment