4 måter å ligge i å bruke statistikk
Livet / / December 19, 2019
En av de mest effektive måtene å løgner - feil tolkning av statistikk. Å vite hvordan å sjonglere med tall, kan du legge merke til hvis du prøver å jukse.
Samle informasjon som vil gjøre dine konklusjoner enda mer partisk
Det første trinnet i innsamling av statistiske data - for å finne ut hva du ønsker å analysere. informasjon statistikere samtale på dette stadiet forelder befolkningen. Deretter må du definere en underklasse av data, som i analysen skal representere befolkningen som helhet. Jo større og mer nøyaktig prøvetaking, jo mer sannsynlig vil være resultatet av studien.
Selvfølgelig, det er forskjellige måter å ødelegge et statistisk utvalg uhell eller med vilje:
- Utvalgsskjevhet. Denne feilen oppstår når folk som deltar i studien selv identifiserer seg som en gruppe, ikke som representerer hele befolkningen.
- Stikkprøvekontroll. Det skjer når analysert lett tilgjengelig informasjon, og ikke prøve å samle representative data. For eksempel kan en nyhetskanal holde en politisk undersøkelse blant sine seere. Ikke spør folk som ser andre kanaler (eller ikke se på TV), kan du ikke si at resultatene av slik forskning vil gjenspeile virkeligheten.
- Avslaget av respondentene til å delta. Slike statistiske feilen skjer når folk ikke svare på spørsmålene i en statistisk studie. Dette fører til feil visning av resultater. For eksempel, hvis studien stiller spørsmålet: "Har du endret noen gang mann / kone?", Noen bare ikke vil innrømme det. Som et resultat, vil det synes at utroskap er sjelden.
- Avstemninger med fri tilgang. I slike undersøkelser kan delta noen. ofte ikke sjekket hvor mange ganger den samme personen svarte på spørsmålene. Eksempler er ulike undersøkelser på Internett. Pass dem svært interessante, men de kan ikke anses objektiv.
Det fine med prøvetaking feilen er at noen sted trolig har en uvitenskapelig undersøkelse som vil bekrefte noen av din teori. Så bare se etter riktig undersøkelse på nettet eller lage dine egne.
Velg de resultatene som bekrefter dine ideer
Siden statistikken med tall, mener vi at det beviser noen ide. Statistikk basert på komplekse matematiske databehandlingNoe som kan føre til ganske motsatte resultater hvis de ikke håndteres riktig.
For å demonstrere feil dataanalyse, engelske matematikeren Francis Anscombe opprettet Anscombes kvartett. Den består av fire sett med numeriske data i grafene ser ganske annerledes.
Figuren X1 - et standard scatterplot; X2 - den kurve som innledningsvis stiger og deretter faller ned; X3 - linje stiger litt opp til ett utgivelse på Y-aksen; X4 - data om aksen X, men en utgang, som ligger høyt oppe på begge aksler.
For hver av de følgende utsagn er sant for grafer:
- Den gjennomsnittlige verdien av variabelen x for hvert sett av data er lik 9.
- Den gjennomsnittlige verdien av variabelen y for hvert datasettet er lik til 7,5.
- Dispersjonen (scatter) variabel x - 11 variable y — 4,12.
- Korrelasjonen mellom variablene x og y for hvert sett av data er lik 0.816.
Hvis vi ser dataene kun i form av tekst, vil vi tro at situasjonen er helt det samme, selv om grafikken benekte dette.
Derfor foreslått Anscombe første visualisere data, og bare da trekke konklusjoner. Selvfølgelig, hvis du ønsker å introdusere noen inn feil, hopper du over dette trinnet.
Figur, som vil understreke de ønskede resultater
De fleste mennesker har ikke tid til å gjennomføre sin egen statistisk analyse. De forventer at du viser dem diagrammer som oppsummerer all forskning. Riktig planlegging bør reflektere de ideer som svarer til virkeligheten. Men de kan også understreke dataene du ønsker å vise.
Senk navnene på noen parametere litt endre skalaen på aksene, ikke forklare sammenhengen. Så vil du være i stand til å overbevise alle av sin rightness.
For all del skjule kilder
Hvis du åpner oppgir sine kilder, folk enkelt teste dine konklusjoner. Selvfølgelig, hvis du sikter til sirkel rundt fingeren din, ikke ville fortelle meg hvordan du kom til konklusjoner.
Vanligvis, i artikler og studier alltid oppgi kildehenvisning. I dette tilfellet kan det opprinnelige arbeidet gis ikke helt. Det viktigste er at kilden svarte på følgende spørsmål:
- Hvordan samle inn data? Folk intervjuet på telefonen? Eller stoppet på gaten? Eller var det en avstemning i Twitter? datainnsamlingsmetoden kan indikere en viss utvalgsbias.
- Da de skulle? Studier har raskt blitt foreldet, som trender endres, så tid til å samle inn informasjon rammer påvirke konklusjonene.
- Som samlet dem? Studier på sikkerheten til røyking, som tok tobakk selskap, er en liten tillit.
- Som intervjuet? Dette er spesielt viktig for de offentlige meningsmålingene. Hvis en politiker er å gjennomføre en undersøkelse blant de som liker det, vil resultatene ikke gjenspeiler den oppfatning av hele befolkningen.
Nå som du vet hvordan å manipulere tall og bruke statistikk for å bevise nesten hva som helst. Dette vil hjelpe deg å gjenkjenne og tilbakevise løgnene fabrikkert teori.