Hvorfor tallene ikke er så objektive som vi tror
Miscellanea / / July 29, 2022
Faktisk er de enkle å manipulere.
Enhver tvilsom påstand kan oppfattes som sann hvis den støttes av statistikk, tabeller, grafer og vitenskapelige termer. For ikke å falle for slike triks er det viktig å kunne gjenkjenne tull og generelt forstå hva det er. En ny bok fra MIF-forlaget "Fullstendig tull!" vil hjelpe med dette. Den ble skrevet av evolusjonsbiolog professor Carl Bergstrom og assisterende professor ved University of Washington School of Information, Jevin West. Og Lifehacker publiserer et utdrag fra det femte kapittelet.
Vår verden er bokstavelig talt digitalisert. Alt blir beregnet, målt, analysert og evaluert. Internett-selskaper sporer oss på nettet og bruker algoritmer for å forutsi hva vi vil kjøpe. Smarttelefoner teller skrittene våre, måler varigheten på samtalene og sporer bevegelsene våre gjennom dagen. Smarte enheter kontrollerer hvordan vi bruker dem og vet mer om vår daglige rutine enn vi kan forestille oss. Implantert medisinsk utstyr mater en kontinuerlig strøm av pasientinformasjon og overvåker for tegn på fare i sanntid. Under vedlikehold laster bilene våre opp data om ytelsen og kjørestilen vår. Mylden av sensorer og kameraer installert i byer overvåker alt fra trafikkstrømmer til luftkvalitet, og er til og med i stand til å stille inn
personligheter til forbipasserende.I stedet for å samle inn data om forbrukeratferd gjennom kostbare undersøkelser og undersøkelser, lar bedrifter folk komme til dem på egenhånd og deretter registrere alt de gjør. Facebook* vet hvem vi kjenner. Google - hva vi ønsker å finne ut. Uber - hvor vi har tenkt å dra. Amazon - hva vi ønsker å kjøpe. Match - hvem vi planlegger å opprette en familieforening med. knusk - som vi venter på en invitasjon til å kommunisere fra.
Data kan hjelpe oss å forstå verden i form av objektive fakta, men data er ikke på langt nær så objektive som vi tror. En gammel vits dukker opp her. En matematiker, en ingeniør og en regnskapsfører får jobb. De blir ført inn på et kontor og gitt en matteeksamen. Den første oppgaven, for oppvarming: hvor mye er to pluss to? Matematikeren himler med øynene, skriver «fire» og går videre til de neste oppgavene. Ingeniøren tenker seg om et sekund, og skriver så «omtrent fire». Regnskapsføreren ser seg bekymret rundt, reiser seg så fra stolen, går bort til personen som tester, og spør med lav stemme: «Før jeg skriver noe, fortell meg hva du vil få?"
Tall er perfekte for å snakke tull. De virker objektive, men kan lett manipuleres for å fortelle den rette historien.
Ord produseres definitivt av menneskesinnet, men hva med tall? Tall ser ut til å være gitt oss av naturen selv. Vi vet at ord er subjektive. Vi vet at de er vant til å vri og forvrenge sannheten. Ord gjenspeiler intuisjon, følelser, lidenskap. Tall ser ut til å eksistere separat fra personen som snakker om dem.
Folks tro på tall er utrolig sterk. Skeptikere hevder at de «bare vil se dataene» eller krever å bli vist «grunnlinjedata» eller insisterer på at «tallene skal tale for seg selv». Vi er overbevist om at "data aldri å ligge». Men denne utsikten kan være farlig. Selv om verdiene eller tallene er riktige, kan de fortsatt brukes til å lure hodet […]. For at tall skal være forståelige, må de stå i en passende kontekst. De må demonstreres på en slik måte at en ærlig sammenligning er tilgjengelig for oss.
La oss først tenke på hvor disse tallene kommer fra. Noen av dem får vi direkte, ved nøyaktig telling eller måling. Det er 50 stater i USA. Det er 25 primtall mindre enn 100. Empire State Building har 102 etasjer. Baseballlegenden Tony Gwin slo 3 141 treff av 9 288 balltre for et slaggjennomsnitt i Major League på 0,388. I prinsippet bør en nøyaktig telling være ganske rett frem. Det er et sikkert svar, og det er vanligvis en viss beregning eller måleprosedyre som kan brukes for å komme frem til det. Men denne prosessen er ikke alltid lett. Det er fullt mulig å gjøre feil i beregninger, målinger, eller i hva vi vurderer akkurat. Ta planeter for eksempel. solsystemet. Fra Neptun ble oppdaget i 1846 til Pluto ble oppdaget i 1930, trodde vi det var åtte planeter i solsystemet. Etter oppdagelsen av Pluto sa vi at vi har ni planeter. Så, i 2006, ble den uheldige "nykommeren" degradert til status som en dvergplanet, og det var åtte fullverdige planeter som kretset rundt Solen igjen.
Oftere er imidlertid nøyaktige tellinger eller uttømmende målinger ikke mulig.
Vi er ikke i stand til å telle hver stjerne separat i det observerte Universå komme frem til den nåværende tilnærmingen for trillioner billioner.
På samme måte stoler vi på grove estimater når vi ser på indikatorer som høyden til en voksen i et bestemt land. Menn fra Nederland regnes som de høyeste i verden - et gjennomsnitt på 183 centimeter. Men for å få disse dataene målte de ikke alle innbyggerne i landet og beregnet ikke gjennomsnittet av alle de oppnådde verdiene. I stedet brukte forskerne et tilfeldig utvalg av lokale menn, målte hvem som falt i det, og ekstrapolerte funnene til hele befolkningen.
Hvis man skulle måle et halvt dusin menn og beregne gjennomsnittshøyden deres, ville resultatet bare ved en tilfeldighet bli feil. Anta at noen av dem var uvanlig høye. Det heter prøvetakingsfeil. Heldigvis vil et stort utvalg vanligvis jevne ut variansene, slik at en slik feil har minimal effekt på resultatet.
Det kan også oppstå problemer med måleprosedyren. La oss si at forskerne ba deltakerne om å rapportere høyden deres, men menn har en tendens til å blåse opp tallene, med lave menn som gjør det oftere enn høye menn.
En annen feilkilde, skjevheten til selve prøven, er enda farligere. Anta at du bestemmer deg for å bestemme høyden på folk, gikk til den lokale basketballbanen og begynte å måle spillerne. basketballspillereer vanligvis over gjennomsnittlig høyde, så utvalget ditt vil ikke være representativt for den generelle befolkningen og ende opp med å være for høyt. De fleste feil av denne typen er ikke så åpenbare. […]
I disse eksemplene så vi på grupper av mennesker over en rekke verdier – for eksempel en rekke høyder – og aggregerte deretter informasjonen til et enkelt tall, kalt en oppsummeringsstatistikk. For eksempel, når vi beskriver en høy nederlender, snakker vi om gjennomsnittlig høyde.
Sammendragsstatistikk kan være en praktisk måte å oppsummere informasjon på, men hvis den ikke er korrekt, kan du lett villede publikum.
Politikere bruker dette trikset når de foreslår å innføre skattefradrag, som vil spare hundretusenvis av dollar for den rikeste 1% av innbyggerne, men på ingen måte vil lette skattebyrden for alle andre. De tar det gjennomsnittlige skattefradraget og hevder at deres skatteplan vil spare familier i gjennomsnitt $4000 i året. Kanskje det, men gjennomsnittsfamilien – hvis vi mener den som er midt i inntektsfordelingen – sparer ingenting. De fleste av oss vil finne det mye mer nyttig å vite hva fradraget for en familie med medianinntekt blir. I dette tilfellet er medianen «median» inntekt mellom halvparten av familiene som tjener mer enn denne verdien og halvparten av familiene som tjener mindre enn denne verdien. Dermed vil ikke medianfamilien få noe fradrag i det hele tatt, fordi det kun er nyttig for den øverste 1 % av befolkningen med høyest inntekt.
Noen ganger kan vi ikke direkte måle indikatoren som interesserer oss. Carl kom nylig under radaren til Highway Patrol på en rett og flat strekning av motorveien i Utah-ørkenen, hvor det av en eller annen uforklarlig grunn ble satt en fartsgrense på femti miles i timen. Han trakk over til siden av veien og så på de kjente blinkene fra rødt og blått lys i bakspeilet. "Vet du hvor fort du kjørte?" spurte patrulje. "Jeg tror ikke det, offiser," svarte Carl. "Åttitre miles i timen."
Åttitre er et alvorlig tall, som potensielt truer med store problemer. Men hvor kom det fra? Noen trafikkkameraer beregner hastigheten din ved å måle avstanden du reiser på en viss tid, men de statlige motorveiene gjør det annerledes. Trooperen målte noe annet – Doppler-skiftet i radiobølgene som sendes ut av den bærbare radaren hans da de spratt av Carls fartsbil. Programvaren som er innebygd i radaren bruker en matematisk modell basert på bølgemekanikk for å beregne hastigheten til kjøretøyet ved å bruke målingene det mottar. Siden patruljemannen ikke måler direkte hastighet Carla, radaren må kalibreres regelmessig. Standardmåten for å bli kvitt en fartsbot er å kreve at offiseren viser rettidige kalibreringsposter. Riktignok trengte ikke Carl det. Han visste at han hadde overskredet fartsgrensen, og var glad for at han for hastverket slapp av med bare en bot, om enn en stor.
Radarer er avhengige av svært robuste fysiske prinsipper, men modellene som brukes til å beregne andre beregninger kan være mer komplekse og involvere flere forutsetninger. Den internasjonale hvalfangstkommisjonen publiserer data om antall bestander av enkelte hvalarter. Når hun rapporterer at det er 2300 blåhval i vannet på den sørlige halvkule, kommer hun til dette tallet, ikke fordi alle er funnet og talt. dyr. Og de har ikke kammet fra og til en del av havet. Hvaler står ikke stille, og mesteparten av tiden er de ikke synlige fra vannoverflaten. Derfor trenger forskere indirekte måter å bestemme størrelsen på befolkningen på. For eksempel teller de møter med unike individer som kan identifiseres ved markeringer på halefinnene og halen. Så deres bestemmelse av hvaltallet er like unøyaktig som denne teknikken er.
I beregninger og fakta som virker helt åpenbare, sniker det seg inn feil av ulike årsaker. Du kan bli forvirret av tallene. Du kan bruke et for lite utvalg, som feilaktig gjenspeiler egenskapene til hele gruppen. Metodene vi utleder tall fra annen informasjon på kan vise seg å være feil. Og til slutt kan tallene rett og slett være fullstendig tull, oppfunnet fra bunnen av i et forsøk på å gi overtalelsesevne patetiske argumenter. Dette må vi huske på når vi blir vist noe med tall. Det sies at tall aldri lyver, men man bør huske at de ofte er misvisende.
"Fullstendig tull!" snakker om hvordan feilinformasjon sprer seg, hvorfor vi tror på det og hvordan man lærer hvordan man kan vurdere årsakssammenhenger korrekt. Denne boken beviser at du ikke trenger å være ekspert på statistikk for å gjenkjenne forfalskninger og skiftende konsepter. Nok logikk og kritisk tenkning.
Kjøp en bok
Les også🧐
- Persepsjonsfeller: hvordan sansene forvrenger virkeligheten
- Gjentar historien seg? Er det mulig å trekke paralleller mellom tidligere og nåværende hendelser?
- Bekreftelsesskjevhet: Hvorfor vi aldri er objektive
- Hvorfor objektiv virkelighet ikke eksisterer
- Hvorfor tror vi mer på gjetninger og rykter enn statistikk
*Meta Platforms Inc. aktiviteter. og dets sosiale nettverk Facebook og Instagram er forbudt på den russiske føderasjonens territorium.