Data Scientist fra bunnen til PRO - kurs 233 640 RUB. fra SkillFactory, trening 24 måneder, Dato 15. august 2023.
Miscellanea / / November 29, 2023
Etter grunnkurset vil du kunne velge en smalere fordypning i Datavitenskap - ML-ingeniør, CV-ingeniør eller NLP-ingeniør
M.L. Ingeniør — Maskinlæringsutvikler
Utvikle en prediksjonsmodell for kredittvurdering
Løs problemet med å klassifisere spam-SMS-meldinger
Utvikle et system for å anbefale egnede produkter ved kjøp
Bygg en modell for å øke salget i detaljhandelen
Lag bilder basert på tekstbeskrivelse ved hjelp av DALL-E nevrale nettverk
CV-ingeniør — Datasynsspesialist
Lær å løse alle de grunnleggende problemene innen datasyn
Du vil tilegne deg kunnskap om den virkelige flyten av arbeid med CV-modeller, gjeldende tilnærminger og avanserte verktøy som er nødvendige for å lage CV-tjenester
I sluttprosjektet lager du en virtuell trener som er i stand til å vurdere riktigheten av øvelser på video
NLP ingeniør — Spesialist på naturlig språkbehandling
Bli kjent med naturlig språkbehandling
Få en forståelse av NLP-oppgaver - klassifisering, oppsummering og tekstgenerering, lage systemer for maskinoversettelse og spørsmålssvarssystemer
I sluttprosjektet vil du selvstendig utvikle verktøy for automatisert søk av kontekster på gitte emner.
UTGANGSPUNKT
På dette stadiet vil du lære det grunnleggende om programmering i Python, lære å forhåndsbehandle og analysere data, og også bli kjent med hovedoppgavene til en dataforsker.
Introduksjon - 1 uke
Du vil være i stand til å formulere reelle læringsmål for deg selv, finne ut hva verdien av DS er for virksomheten, bli kjent med hovedoppgavene til en dataforsker og forstå hvordan utviklingen av evt DS-prosjektet.
INTRO-1. Hvordan studere effektivt - onboarding i trening
INTRO-2. Yrkesoversikt. Typer problemer i datavitenskap. Stadier og tilnærminger til å utvikle et Data Science-prosjekt
Utviklingsdesign - 5 uker
Du vil lære å jobbe med grunnleggende datatyper ved hjelp av Python og være i stand til å bruke looping-konstruksjoner, betingede utsagn og funksjoner i ditt daglige arbeid.
PYTHON-1. Grunnleggende om Python
PYTHON-2. Dykk inn i datatyper
PYTHON-3. Betingede uttalelser
PYTHON-4. Sykluser
PYTHON-5. Funksjoner og funksjonell programmering
PYTHON-6. Øve på
PYTHON-7. Python-stilguide (bonus)
Grunnleggende matematikk - 7 uker
MATTE-1. Tall og uttrykk
MATTE-2. Ligninger og ulikheter
MATTE-3. Grunnleggende begreper i funksjonsteori
MATH-4. Grunnleggende om geometri: planimetri, trigonometri og stereometri
MATH-5. Sett, logikk og elementer av statistikk
MATH-6. Kombinatorikk og grunnleggende om sannsynlighetsteori
MATH-7. Problemløsning
Arbeid med data - 8 uker
På dette stadiet vil du mestre grunnleggende dataferdigheter: hvordan forberede, rense og transformere data slik at de er egnet for analyse. Apropos analyse: du vil analysere data ved å bruke de populære bibliotekene Matplotlib, Seaborn, Plotly.
PYTHON-8. Datavitenskapsverktøy
PYTHON-9. NumPy bibliotek
PYTHON-10. Introduksjon til pandaer
PYTHON-11. Grunnleggende teknikker for å arbeide med data i Pandas
PYTHON-12. Avanserte datateknikker i pandaer
PYTHON-13. Datarensing
PYTHON-14. Datavisualisering
PYTHON-15. Prinsipper for OOP i Python og feilsøkingskode (valgfri modul)
Prosjekt 1. Datasettanalyse på lukkede problemer
Datainnlasting - 6 uker
Du vil kunne laste ned data fra forskjellige formater og kilder. Og SQL, et strukturert spørringsspråk, vil hjelpe deg med dette. Du vil lære å bruke aggregerte funksjoner, tabellsammenføyninger og komplekse sammenføyninger.
PYTHON-16. Hvordan laste ned data fra filer i forskjellige formater
PYTHON-17. Henter data fra nettkilder og APIer
SQL-0. Hei SQL!
SQL-1. Grunnleggende om SQL
SQL-2. Aggregerte funksjoner
SQL-3. Sammenføyning av bord
SQL-4. Komplekse skjøter
Prosjekt 2. Laster inn nye data. Avgrense analysen
Statistisk dataanalyse - 7 uker
Intelligence Data Analysis (EDA) er det som vil være ditt fokus. Du vil bli kjent med alle stadier av slik analyse og lære hvordan du utfører den ved å bruke bibliotekene Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. I tillegg vil du kunne jobbe med Kaggle, en populær tjeneste for å delta i konkurranser.
EDA-1. Introduksjon til etterretningsdataanalyse. EDA-algoritmer og metoder
EDA-2. Matematisk statistikk i sammenheng med EDA. Typer funksjoner
EDA-3. Funksjonsteknikk
EDA-4. Statistisk dataanalyse i Python
EDA-5. Statistisk dataanalyse i Python. Del 2
EDA-6. Design av eksperimenter
EDA-7. Kaggle plattform
Prosjekt 2
Introduksjon til maskinlæring - 9 uker
Du vil bli kjent med ML-biblioteker for modellering av dataavhengigheter. Du vil kunne trene hovedtypene av ML-modeller, utføre validering, tolke resultatene av arbeidet og velge viktige funksjoner (funksjonsviktighet).
ML-1. Maskinlæringsteori
ML-2. Veiledet læring: Regresjon
ML-3. Veiledet læring: Klassifisering
ML-4. Uovervåket læring: Clustering og dimensjonalitetsreduksjonsteknikker
ML-5. Datavalidering og modellevaluering
ML-6. Utvalg og utvalg av egenskaper
ML-7. Optimalisering av modellhyperparametre
ML-8. ML kokebok
Prosjekt 3. Klassifiseringsproblem
HOVEDENHET
Lineær algebra, matematisk analyse, diskret matematikk - det høres skummelt ut, men ikke vær redd: vi analyserer alle disse fagene og lærer deg hvordan du jobber med dem! I det andre trinnet vil du dykke ned i matematikk og det grunnleggende innen maskinlæring, lære mer om DS-yrker, og gjennom karriereveiledning velge et andreårs studiespor.
Matematikk og maskinlæring. Del 1 - 6 uker
Du vil kunne løse praktiske problemer ved hjelp av manuell beregning og Python (vektor- og matriseberegninger, arbeid med sett, studere funksjoner ved hjelp av differensialanalyse).
MATH&ML-1. Lineær algebra i sammenheng med lineære metoder. Del 1
MATH&ML-2. Lineær algebra i sammenheng med lineære metoder. Del 2
MATH&ML-3. Matematisk analyse i sammenheng med et optimaliseringsproblem Del 1
MATH&ML-4. Matematisk analyse i sammenheng med et optimaliseringsproblem. Del 2
MATH&ML-5. Matematisk analyse i sammenheng med et optimaliseringsproblem. Del 3
Prosjekt 4. Regresjonsproblem
Matematikk og maskinlæring. Del 2 - 6 uker
Du vil bli kjent med de grunnleggende begrepene sannsynlighetsteori og matematisk statistikk, algoritmer clustering, og også lære å evaluere kvaliteten på clustering utført og presentere resultatene i grafisk form.
MATH&ML-6. Sannsynlighetsteori i sammenheng med en naiv Bayes-klassifiserer
MATH&ML-7. Algoritmer basert på beslutningstrær
MATH&ML-8. Forsterkning og stabling
MATH&ML-9. Teknikker for gruppering og dimensjonalitetsreduksjon. Del 1
MATH&ML-10. Teknikker for gruppering og dimensjonalitetsreduksjon. Del 2
Prosjekt 5. Ensemblemetoder
Diskret matematikk - 4 uker
MATH&MGU-1-sett og kombinatorikk
MATH&MGU-2 logikk
MATH&MGU-3-grafer. Del 1
MATH&MGU-4-grafer. Del 2
ML i bedrift - 8 uker
Du vil lære å bruke ML-biblioteker til å løse tidsserieproblemer og anbefalingssystemer. Du vil kunne trene en ML-modell og validere den, samt lage en fungerende prototype og kjøre modellen i webgrensesnittet. Og få også ferdigheter i A/B-testing slik at du kan evaluere modellen.
MATH&ML-11. Tidsserier. Del 1
MATH&ML-12. Tidsserier. Del 2
MATH&ML-13. Anbefaler systemer. Del 1
MATH&ML-14. Anbefaler systemer. Del 2
PROD-1. Forbereder modellen for produksjon
PROD-2. PrototypeStreamlit+Heroku
PROD-3. Forretningsforståelse. Sak
Prosjekt 6. Emne å velge mellom: Tidsserier eller Anbefalingssystemer
PRONIVÅ
På tredje trinn vil du bli kjent med en av maskinlæringsmetodene – dyp læring (DL). Og også en fullverdig blokk av den valgte spesialiseringen venter på deg: du kan mestre maskinlæringsferdigheter (ML), bli kjent med rutinen for CV (datasyn) eller forbedre i NLP*, naturlig prosessering Språk.
Andre studieår - 3 fordypninger å velge mellom
Karriereveiledning
ML, CV eller NLP: på dette stadiet må du endelig velge hvilken vei du skal ta videre. Vi vil fortelle deg om hver spesialisering og tilby deg å løse flere praktiske problemer for å gjøre det lettere for deg å bestemme.
Spor ML - ingeniør
I ML-sporet vil du lære å løse dybdegående maskinlæringsproblemer, mestre kompetansen til en dataingeniør og finpusse ferdighetene dine i å jobbe med Python-biblioteker. Du vil også lære hvordan du lager en MVP (minimum levedyktig versjon av et produkt), lære alle vanskelighetene ved å sende ut en ML-modell til produksjon, og lære hvordan ML-ingeniører jobber i det virkelige liv.
Introduksjon til dyp læring
Grunnleggende datateknikk
Ytterligere Python- og ML-kapitler
Økonomisk evaluering av effekter og MVP-utvikling
ML til produksjon
Fordypning i ML utviklings- og avgangsprosjekt på et valgt tema
Spor CV - ingeniør
På CV-sporet vil du lære å løse datasynsproblemer som bildeklassifisering, segmentering og deteksjon, bildegenerering og stilisering, restaurering og kvalitetsforbedring fotografier. I tillegg vil du lære hvordan du ruller ut nevrale nettverk til produksjon.
Introduksjon til dyp læring
Grunnleggende datateknikk
Ytterligere Python- og ML-kapitler
Økonomisk evaluering av effekter og MVP-utvikling
ML til produksjon
Fordypning i ML utviklings- og avgangsprosjekt på et valgt tema
Spor NLP - ingeniør
Under opplæring på NLP-sporet vil du lære hvordan du løser hovedproblemene ved naturlig språkbehandling, i inkludert klassifisering, oppsummering og tekstgenerering, maskinoversettelse og opprettelse av dialog systemer
Introduksjon til dyp læring
Neural Network Mathematics for NLP
Hard og programvare for å løse NLP-problemer
NLP-oppgaver og algoritmer
Nevrale nettverk i produksjon
Fordypning i NLP utvikling og avgangsprosjekt om et valgt tema
Velger du CV- eller ML-spesialiseringen kan du ta NLP-kurset uten mentorstøtte gratis.
Deep Learning og nevrale nettverk
Hvor brukes nevrale nettverk? Hvordan trene et nevralt nettverk? Hva er dyp læring? Du finner svarene på disse spørsmålene i bonusdelen av DL.
Introduksjon til datateknikk
Du vil lære forskjellen mellom rollene til en dataforsker og en dataingeniør, hvilke verktøy sistnevnte bruker i sitt arbeid, og hvilke oppgaver han løser på daglig basis. Ordene "snøfnugg", "stjerne" og "innsjø" vil få nye betydninger :)