Spesialisering "Data Analyst" - kurs 2900 gni. fra Stepik, trening 36 leksjoner, Dato: 29. oktober 2023.
Miscellanea / / December 05, 2023
Dataanalytiker, produktanalytiker, kundebaseanalytiker, CRM-analytiker, dataforsker - alle disse yrkene er relatert til dataanalyse.
🎯 TOP krav til disse yrkene:
- Kjennskap til SQL og erfaring med å jobbe med databaser;
- Kunnskap om grunnleggende Python-syntaks og kunnskap om Pandas-biblioteket;
- Kunnskap om statistikk og evne til å anvende den i dataanalyse;
- Analytisk tenkning.
Dette er ikke en fullstendig liste. Nettanalytikere trenger for eksempel å kjenne til Google Analytics og Yandex. Beregninger, og for dataforskere - maskinlæring. Men jeg ga de grunnleggende kravene som finnes i 70-80% av ledige stillinger.
Dataanalytikerspesialiseringen består for tiden av to kurs:
1️⃣ SQL for alle
I løpet av kurset vil du mestre SQL til nivået med å skrive komplekse SQL-spørringer og øve deg på å bruke data fra et handelsselskap i et av de mest populære databasestyringssystemene.
Kurset er laget for nybegynnere som ønsker å mestre SQL, samt de som kan SQL på et grunnleggende nivå, men ønsker å fylle hullene og konsolidere kunnskapen i praksis.
2️⃣ Python: Dataanalyse med pandaer
Kurset er viet praktisk arbeid med pandaer. Du vil motta den nødvendige teorien og forsterke den med et stort antall praktiske problemer.
Kurset passer for de som allerede er kjent med den grunnleggende Python-syntaksen:
- Kjenner grunnleggende datatyper (inkludert lister og ordbøker) og operasjoner på dem;
- Har forståelse for hva en funksjon og en metode er.
Kurset kan tas selv av nybegynnere som selvstendig kan finne ut hvordan de installerer Python og Pandas-biblioteket. Men hvis du nettopp har begynt med Python, må du ta igjen noen grunnleggende ting på egen hånd etter hvert som kurset skrider frem. Du kan forresten få grunnleggende kunnskap om Python-syntaks i dette kurset. Da blir det mye lettere å lære Pandaer.
Konseptet med kursene er basert på tre prinsipper:
Enkelhet
Presentasjonen av materialet er tilgjengelig og konsistent - dette vil tillate deg å danne den nødvendige kunnskapsbasen trinn for trinn.
Øve på
Mye oppmerksomhet rettes mot praksis – slik at du ikke bare løser kursproblemene, men også kan anvende kunnskap i fremtiden, på reelle prosjekter.
Brukerstøtte
Still gjerne spørsmål i kommentarfeltet, det er viktig for meg at alt stoffet er lært. Jeg svarer på kommentarer innen en dag.
Rekkefølgen kursene tas i er ikke viktig.
1. SQL for alle
Operasjoner på ett bord
1. Introduksjon til databasen
2. Filtrering av WHERE-rader. Regelmessige uttrykk LIKER. OG og ELLER
3. Sortering av strenger BESTILL ETTER
4. Aggregeringsfunksjoner: COUNT, SUM, MIN, MAX, AVG. Aliaser
5. Gruppering av GROUP BY og HAVING linjer. Genererer rapporter
6. Øv basert på resultatene fra 1. modul
Operasjoner på flere bord
1. Begreper primærnøkkel og fremmednøkkel. Typer relasjoner i databasen
2. Generer spørringer fra flere tabeller. INDRE JOIN og Aliaser
3. LEFT JOIN og andre typer JOINs
4. Bli med flere bord ved å bruke UNION og UNION ALL
5. Undersøk
6. Øv basert på resultatene fra 2. modul
Andre viktige emner
1. CASE uttrykk
2. Populære funksjoner for arbeid med strenger
Praktiske oppgaver for å forsterke kursmateriell
1. Enkle spørsmål
2. Komplekse spørsmål
3. Konklusjon
2. Python: Dataanalyse med pandaer
Analysere datarammer individuelt
1. Lese data fra filer
2. Express introduksjon til data
3. Kolonneutgang
4. Datatyper
5. Filtrering av rader
6. Vanlig uttrykk
7. Sortering av strenger
8. Aggregasjonsfunksjoner
9. Radgruppering
Analyse av flere relaterte datarammer
1. Slå sammen a. k. en bli med
2. Sammenkobling
Ekstra nødvendig modul
1. Jobber med datoer og klokkeslett
2. Pivottabeller
3. Nye måter å lage datarammer på
4. Kategorisering av nominelle egenskaper
5. Erstatte verdier i en dataramme
6. Visualisering i pandaer
7. Skjæring
8. Konklusjon