"Dataanalyse ved bruk av IBM SPSS Statistics" - kurs 42 000 RUB. fra MSU, opplæring (2 måneder), dato 3. desember 2023.
Miscellanea / / December 06, 2023
I en veldig komprimert form er dette kurset en del av det populære fjernundervisningskurset "Hvordan gjøre vitenskapelig forskning: metodikk, verktøy, metoder" ved E. Foundation Open University. Gaidar (omtrent 2 tusen. lyttere per år). Det økonomiske fakultetet ved Moscow State University gir studentene muligheten til å bruke en utstyrt datamaskinklasse med SPSS installert studer i detalj metodene for å jobbe med data ansikt til ansikt med en lærer, jobb med programmet med dine egne "hender" SPSS. Det er mulig å jobbe ikke bare med databaser foreslått av læreren, men også med elevdata; læreren vil gi råd om hvilke metoder og hvordan du kan bruke for å analysere dataene dine.
Dette kurset har blitt testet ved Open University of the E. Foundation. Gaidar.
Doktor i økonomi, professor ved fakultetet for økonomi ved Moscow State University, spesialist i kvantitativ forskning i sosial sfære, leder for mer enn 30 forskningsprosjekter, har erfaring med å undervise i analytiske kurs ved National Research University HMS, REU im. V.G. Plekhanov.
E-post: [e-postbeskyttet]
1 Essensen og hovedretningene for utvalgsundersøkelser av befolkningen. Muligheter for å bruke spesielle OPS for behandling av data fra utvalgsundersøkelser
Metoder for innsamling av kvantitativ informasjon. Eksempelstudier. Eksempel på sosiodemografiske undersøkelser i Russland. Grunnleggende statistiske programvarepakker for samfunnsforskning. Funksjoner til spesiell programvare (Statistica, SPSS) i behandling av data fra prøvestudier. Struktur, SPSS-moduler. Områder for databehandling. Dataforberedelse. Legge inn og lagre data. Måleskalaer (kvantitative, ordinale, nominelle). Egenskaper til vekter og deres tillatte transformasjoner. Typer datakategorisering.
2 Dataforberedelse. Datavalg og modifikasjon
Utvalg av observasjoner. Sortering av observasjoner. Inndeling av observasjoner i grupper. Datamodifisering. Beregning av nye variabler. Beregning av nye variabler etter visse forutsetninger. Formulering av forhold. Dataaggregering. Ranger transformasjoner. Vekter. Årsaker og mekanismer for å generere datahull. Mulighet for å ignorere utelatelser. Metoder for å fylle ut manglende verdier. Metoder for å identifisere unormale verdier. Anvendelse av robuste vurderingsprosedyrer. Multiple Response Analyse
3 Beskrivende statistikk. Beredskapstabeller
Statistikkens rolle i behandlingen av resultatene fra utvalgsundersøkelser. Mikro og metadata. Bruksområder og anvendelighetsgrenser for matematiske og statistiske metoder. Oppsummering av observasjoner. Beskrivende statistikk. Univariate fordelinger. Variasjonsindikatorer. Dispersjon, variasjonsområde, gjennomsnittlig absolutt avvik, kvantitområde. Konstruksjon av beredskapstabeller. Grafisk fremstilling av beredskapstabeller.
4 Parametriske og ikke-parametriske tester
Analyse av forholdet mellom egenskaper. Uavhengighet av variabler. Grunnleggende egenskaper ved kommunikasjon. Ikke-parametriske og parametriske tester. Uavhengighetstest (goodness-of-fit test χ2). Sammenligning av to og flere utvalg (avhengig og uavhengig). t-test. Statistiske tester for beredskapstabeller. Korrelasjonskoeffisienter (for nominelle og rangeringsskalaer). Mål for nærhet til sammenhengen mellom variabler. De enkleste målene for tilkoblingsnærhet (for dikotome variabler). Sammenhengsmål for tabeller med ordinære data. Kendal t-mål og deres egenskaper. Somers d-mål. Goodman-Kruskal-målet og dets egenskaper. Analyse av varianter
5 Korrelasjons- og regresjonsanalyse
Essensen og målene for korrelasjonsanalyse. Spredningsplott. Parede korrelasjonskoeffisienter. Måling av graden av nærhet til et statistisk forhold, "ryddet" for påvirkning av fremmede egenskaper ved bruk av partielle korrelasjonskoeffisienter. Sjekke betydningen av forholdet mellom tegn. Konfidensintervaller for korrelasjonskoeffisienter. Multippel korrelasjonskoeffisient. Bestemmelseskoeffisient. Todimensjonal regresjonsanalysemodell: lineære og ikke-lineære regresjonsmodeller. Vekstkurver i prognoseproblemer, "dummy"-variabler og deres applikasjoner. Multippel lineær regresjonsmodell. Ikke-lineær regresjon (binær logistisk regresjon, multinomial logistisk regresjon, ordinal regresjon, probitanalyse, kurvetilpasning).
6 Metoder for dimensjonsreduksjon
Statistisk tilnærming i hovedkomponentmetoden. Beregning av hovedkomponenter og deres grafiske tolkning. Informasjonsinnhold i den reduserte funksjonsplassen. Hovedkomponenter regresjon. Rollen og plassen til ikke-parametriske metoder i strukturell modellering. Hierarkisk klyngeanalyse. Beregninger for funksjonsplass. Prinsipper for å måle avstand mellom grupper av objekter. Algoritmer for rask klyngeanalyse, k-means metode. To-trinns klyngeanalyse. Bygge et måltre