Lineær regresjon - kurs 4900 gni. fra Åpen utdanning, opplæring 5 uker, ca 2 timer pr uke, Dato 29. november 2023.
Miscellanea / / November 29, 2023
Dersom korrelasjonsanalyse gjør det mulig å kvantifisere styrken og retningen til sammenhengen mellom to størrelser, så gir konstruksjonen av regresjonsmodeller større muligheter. Ved hjelp av regresjonsanalyse er det mulig å kvantitativt beskrive oppførselen til de studerte mengdene avhengig av prediktorvariabler og få prediksjoner på nye data. Du vil lære hvordan du bygger enkle og flere lineære modeller ved å bruke R-språket. Hver metode har sine begrensninger, så vi hjelper deg å forstå i hvilke situasjoner lineær regresjon kan og kan ikke brukes, og vi vil lære deg metoder for å diagnostisere utvalgte modeller. En spesiell plass i kurset er gitt til den dyptgående anatomien i regresjonsanalyse: du vil mestre operasjoner med matriser som er grunnlaget for lineær regresjon for å kunne forstå mer komplekse varianter av lineær modeller.
Hvis du står overfor behovet for å søke og beskrive sammenhengene mellom visse fenomener som kan måles kvantitativt, da er dette kurset en god mulighet til å forstå hvordan enkel og multippel lineær regresjon fungerer, lære om mulighetene og begrensningene til disse metoder.
Kurset er laget for de som allerede er kjent med de grunnleggende teknikkene for dataanalyse ved bruk av R-språket og med opprettelsen av enkle .html-dokumenter ved hjelp av rmarkdown og knitr.
Vitenskapelige interesser: struktur og dynamikk i marine bentossamfunn, romlige skalaer, suksesjon, interspesifikke og intraspesifikke biotiske interaksjoner, vekst og reproduksjon av marine virvelløse dyr, demografisk struktur av populasjoner, mikroevolusjon, biostatistikk.
Kurset består av 5 moduler:
1. Korrelasjonsanalyse. Enkel lineær regresjon
Vi vil begynne vår samtale om metoder for numerisk å beskrive sammenhenger mellom kvantitative størrelser med kovarians og korrelasjonskoeffisienter, som lar oss estimere styrken og retningen til sammenhengen. Deretter vil du lære hvilken tilleggsinformasjon om sammenhenger som kan fås ved å konstruere en lineær modell av sammenhengen mellom størrelser. Du vil lære å tolke regresjonskoeffisienter og lære når og hvordan lineære modeller kan brukes til å lage spådommer på nye data. Ved slutten av denne modulen vil du lære hvordan du tilpasser en lineær modellligning og plotter den med et konfidensområde.
2. Testing av signifikans og validitet av lineære modeller
Å bygge en lineær modell og skrive ned ligningen er bare begynnelsen på analysen. I denne modulen vil du lære hvordan du beskriver resultatene av regresjonsanalyse: hvordan du tester den statistiske signifikansen til den overordnede modellen eller koeffisientene, og vurderer kvaliteten på tilpasningen. Lineære modeller (eller rettere sagt, de statistiske testene som brukes for dem), som enhver metode, har sine begrensninger. Du vil lære hva disse begrensningene er og hvor de kommer fra. De grafiske diagnostiske metodene som vi vil bruke er universelle for ulike lineære modeller - mer øvelse vil hjelpe deg med å ta beslutninger mer selvsikker. Når du forstår alt dette, kan du skrive et komplett skript i R for å tilpasse, diagnostisere og presentere resultatene av en enkel lineær regresjon.
3. En kort introduksjon til verden av lineær algebra
I denne modulen skal vi dykke inn i hjertet av lineære modeller. For å gjøre dette, må du lære eller huske det grunnleggende om lineær algebra. Vi vil diskutere de forskjellige typene matriser, hvordan du lager dem i R, og grunnleggende operasjoner med dem. Vi trenger alt dette for å forstå hvordan lineær regresjon fungerer fra innsiden. Du vil lære hva en modellmatrise er, lære å skrive en lineær regresjonsligning i form av matriser og finne koeffisientene for den. Du vil med egne øyne se hattematrisen, som lar deg få predikerte verdier, og du vil til og med kunne beregne den manuelt. Til slutt vil du lære å beregne restvariansen, varians-kovariansmatrisen, og bruke alt dette til å bygge en regresjonskonfidensone. Da vil denne kunnskapen hjelpe deg å forstå strukturen til mer komplekse modeller: med diskrete prediktorer, med forskjellige fordelinger av residualer, med en annen struktur av variasjons-kovariansmatrisen.
4. Multippel lineær regresjon
Oftest er sammenhengene mellom størrelser mer komplekse enn det som kan beskrives ved hjelp av enkel lineær regresjon. Multippel lineær regresjon brukes til å beskrive hvordan en responsvariabel avhenger av flere prediktorer. Med utseendet til flere prediktorer i modellen, har lineær regresjon en ny betingelse for anvendbarhet - kravet om fravær av multikollinearitet. I denne modulen lærer du hvordan du identifiserer og unngår multikollinearitet. Til slutt er det ofte flere variabler i flere modeller enn det som kan avbildes på et plan, Derfor vil vi lære deg enkle teknikker som vil hjelpe deg å lage informativ grafikk selv i dette sak.
5. Sammenligning av lineære modeller
Flere lineære modeller er som et byggesett: mer komplekse modeller kan tas fra hverandre og forenkles. Du vil lære hvordan nestede modellsammenlikninger ved hjelp av den delvise F-testen brukes til å teste betydningen av individuelle prediktorer eller grupper av prediktorer. Mer komplekse modeller beskriver de opprinnelige dataene bedre, men overdreven komplikasjon er farlig, fordi slike modeller begynner å gi dårlige spådommer om nye data. Ved å bruke delvise F-tester kan du forenkle modeller ved gradvis å eliminere ikke-signifikante prediktorer. Forenklede modeller er lettere å bruke for å tolke og presentere resultater. Alt du har lært så langt om lineær regresjon kan brukes ved å fullføre et dataanalyseprosjekt der du må bygge en optimal multippel lineær modell og presentere resultatene i en rapport skrevet vha rmarkdown og strikk.