Generaliserte lineære modeller - kurs 3600 gni. fra Åpen utdanning, opplæring 3 uker, ca 6 timer pr uke, Dato 29. november 2023.
Miscellanea / / December 01, 2023
En av betingelsene for anvendeligheten av konvensjonelle lineære modeller er uavhengigheten av observasjoner fra hverandre, på grunnlag av hvilken modellen er valgt. Imidlertid er det i praksis ofte situasjoner hvor utformingen av materialsamlingen er slik at brudd på denne betingelsen er uunngåelig. Tenk deg at du bestemte deg for å bygge en modell som beskriver forholdet mellom prestasjoner i kroppsøving og IQ-testresultater blant elever. For å løse dette problemet tok du en rekke prøver ved flere institusjoner. Er det mulig å kombinere slike data til én analyse, bygget etter det tradisjonelle opplegget? Selvfølgelig ikke. Studenter ved hvert universitet kan være like hverandre på noen måter. Selv arten av forholdet mellom mengdene som studeres kan være noe annerledes. Denne typen data, der det er intragruppekorrelasjoner, bør analyseres ved hjelp av lineære blandede modeller. Vi vil vise at noen prediktorer bør inkluderes i modellen som såkalte «tilfeldige faktorer». Du vil lære at tilfeldige faktorer kan være hierarkisk underordnet. Vi skal diskutere hvordan slike blandede modeller kan bygges for avhengige variabler som følger ulike typer fordelinger. I tillegg vil vi vise at den tilfeldige delen av modellen kan være enda mer kompleks – den kan ha en komponent som modellerer oppførselen til variansen som respons på påvirkningen av en kovariat. På slutten av kurset finner du et prosjekt der du kan øve deg på å bygge blandede modeller ved å velge ett av flere datasett. Basert på analysen av disse dataene kan du lage en rapport i tradisjonen med reproduserbar forskning.
Førsteamanuensis, Institutt for invertebratzoologi, Biologisk fakultet, St. Petersburg State University, Ph.D.
Vitenskapelige interesser: struktur og dynamikk i marine bentossamfunn, romlige skalaer, suksesjon, interspesifikke og intraspesifikke biotiske interaksjoner, vekst og reproduksjon av marine virvelløse dyr, demografisk struktur av populasjoner, mikroevolusjon, biostatistikk.
Kurset består av 4 moduler:
1) Introduksjon til generaliserte lineære modeller
Generaliserte lineære modeller (GLM) lar deg modellere oppførselen til mengder som ikke følger en normalfordeling. For å gjøre dine første steg i GLM-verdenen enklere, vil vi analysere strukturen deres ved å bruke eksemplet med GLM for normalfordelte mengder - på denne måten kan du trekke paralleller med enkle lineære modeller. Du vil lære hva en lenkefunksjon er, hvordan maksimal sannsynlighet fungerer, og hvordan du tester GLM-hypoteser ved hjelp av Wald-tester og sannsynlighetsforholdstester.
2) Problem med modellvalg
I denne modulen skal vi snakke om metodiske problemstillinger knyttet til å bygge modeller. En modell er en forenklet fremstilling av virkeligheten, og å velge mellom ulike konkurrerende metoder for slik forenkling er en hyppig oppgave for analytikeren. I denne modulen lærer du å sammenligne modeller ved hjelp av informasjonskriterier. Vi vil diskutere hovedalternativene for analysen ved valg av modeller og snakke om vanskelighetene som oppstår i forbindelse med det skjulte mangfoldet av modeller. Til slutt vil vi lære deg å gjenkjenne hovedtypene for misbruk av modellvalg (datafiske, p-hacking).
3) Generaliserte lineære modeller for telling av data
I denne modulen vil vi diskutere grunnleggende metoder for modellering av tellbare mengder. Først vil vi diskutere hvorfor konvensjonelle lineære modeller ikke er egnet for å telle data. Egenskapene til tellbare distribusjoner vil hjelpe deg å forstå forskjellene mellom typene GLM for tellbare data og funksjonene til diagnostikken deres. Du vil se lenkefunksjonen på jobb når du visualiserer GLM-spådommer på lenkefunksjonsskalaen og på responsvariabelskalaen.
4) Generaliserte lineære modeller med binær respons
Noen ganger er det behov for å simulere om en hendelse har skjedd eller ikke, om fotballag eller tapt, enten pasienten kom seg etter behandling eller ikke, om klienten forpliktet seg kjøp eller ikke. Konvensjonelle lineære modeller er ikke egnet for modellering av slike binære data (hendelser med to utfall), men dette kan enkelt gjøres ved å bruke generaliserte lineære modeller. I denne modulen vil du lære å modellere sannsynlighetene for hendelser som skjer ved å representere dem som odds. Vi skal se på hvordan logit link-funksjonen fungerer og hvordan GLM-koeffisienter tolkes når den brukes. Til slutt vil du kunne trene på å analysere generaliserte lineære modeller med ulike fordelinger ved å gjennomføre et dataanalyseprosjekt. Resultatene av denne analysen må presenteres som en rapport i html-format, skrevet med rmarkdown/knitr.
• Lær hvilke ferdigheter som trengs for å komme i gang innen analyse og datavitenskap • Lær å bruke Excel, SQL, Power BI, Google Data Studio til å jobbe med data og skriv din første kode i Python• Få en trinn-for-trinn-guide og lær hvordan du går inn i datavitenskapsfeltet og velger en rolle i Data Science
4,4
1 490 ₽