Matematikk og maskinlæring for datavitenskap - kurs RUB 50 040. fra SkillFactory, trening 5,5 måneder, Dato: 13. august 2023.
Miscellanea / / November 29, 2023
Du vil kunne studere fra hvor som helst i verden. Nye moduler vil bli åpnet en gang i uken. Spesialdesignet innhold og tilleggsmateriell vil hjelpe deg å forstå emnet.
Praksis består av tre deler: utføre enkle regneøvelser; utføre Python-baserte øvelser; løse livsproblemer innen dataanalyse, prognoser og optimalisering.
Du vil hele tiden kommunisere med medstudentene dine i private Slack-kanaler. Hvis du ikke forstår noe eller ikke kan takle en oppgave, hjelper vi deg med å finne ut av det.
På slutten av kurset vil du få en spesiell oppgave der du vil kunne bruke alle ferdighetene du har tilegnet deg og bekrefte din vellykkede læring av materialet.
Matematikk kursprogram
Del 1 - Lineær algebra
- Vi studerer vektorer og typer matriser
- Lære å utføre operasjoner på matriser
- Bestemme lineær avhengighet ved hjelp av matriser
- Vi studerer inverse, entalls- og ikke-singulære matriser
- Vi studerer systemer av lineære ligninger, egen- og komplekse tall
- Mestring av matrise og singular dekomponering
- Løse lineære avhengighetsproblemer ved hjelp av matriser
- Optimalisering ved hjelp av hovedkomponentmetoden
- Forsterker det matematiske grunnlaget for lineær regresjon
Del 2 - Grunnleggende om matematisk analyse
- Vi studerer funksjoner til én og mange variabler og deriverte
- Mestre konseptet med gradient og gradientnedstigning
- Opplæring i optimaliseringsproblemer
- Vi studerer Lagrange multiplikatormetoden, Newtons metode og simulert gløding
- Vi løser problemer med å forutsi og søke etter en vinnende strategi ved å bruke avledede og numeriske optimaliseringsmetoder
- Forsterker matematikken bak gradientnedstigning og simulert gløding
Del 3 - Grunnleggende om sannsynlighet og statistikk
- Vi studerer de generelle begrepene deskriptiv og matematisk statistikk
- Mestring av kombinatorikk
- Vi studerer hovedtyper av fordelinger og korrelasjoner
- Forstå Bayes' teorem
- Lære en naiv Bayes-klassifiser
- Vi løser problemer med kombinatorikk, validitet og prognoser ved hjelp av statistikk og sannsynlighetsteori
- Vi konsoliderer det matematiske grunnlaget for klassifisering og logistisk regresjon
Del 4 - Tidsserier og andre matematiske metoder
- Vi introduserer tidsserieanalyse
- Mestring av mer komplekse typer regresjoner
- Prognose budsjettet ved hjelp av tidsserier
- Forsterker det matematiske grunnlaget for klassiske maskinlæringsmodeller
Kort kursprogram om maskinlæring
Veilederhjelp under opplæring
Modul 1 - Introduksjon til maskinlæring
Vi blir kjent med hovedoppgavene og metodene for maskinlæring, studerer praktiske caser og bruker den grunnleggende algoritmen for å jobbe med et ML-prosjekt
Vi løser 50+ problemer for å forsterke temaet
Modul 2 - Dataforbehandlingsmetoder
Vi studerer datatyper, lærer å rense og berike data, bruker visualisering for forbehandling og mestrer funksjonsteknikk
Vi løser 60+ problemer for å forsterke temaet
Modul 3 - Regresjon
Vi behersker lineær og logistisk regresjon, studerer grensene for anvendelighet, analytisk slutning og regularisering. Trening av regresjonsmodeller
Vi løser 40+ problemer for å forsterke temaet
Modul 4 - Klynger
Vi mestrer læring uten lærer, øver på de ulike metodene, jobber med tekster ved hjelp av ML
Vi løser 50+ problemer for å forsterke temaet
Modul 5 - Trebaserte algoritmer: introduksjon til trær
La oss bli kjent med beslutningstrær og deres egenskaper, mestre trær fra sklearn-biblioteket og bruke trær til å løse et regresjonsproblem
Vi løser 40+ problemer for å forsterke temaet
Modul 6 - Trebaserte algoritmer: ensembler
Vi studerer egenskapene til treensembler, øver på boosting, bruker ensemblet til å bygge logistisk regresjon
Vi løser 40+ problemer for å forsterke temaet
Vi deltar i en konkurranse om kaggle for opplæring av en trebasert modell
Modul 7 - Vurdering av kvaliteten på algoritmer
Vi studerer prinsippene for prøvedeling, under- og overtilpasning, evaluerer modeller ved hjelp av ulike kvalitetsmålinger, lærer å visualisere læringsprosessen
Evaluering av kvaliteten på flere ML-modeller
Vi løser 40+ problemer for å forsterke temaet
Modul 8 - Tidsserier i maskinlæring
La oss bli kjent med tidsserieanalyse i ML, mestre lineære modeller og XGBoost, studere prinsippene for kryssvalidering og parametervalg
Vi løser 50+ problemer for å forsterke temaet
Modul 9 - Anbefalingssystemer
Vi studerer metoder for å konstruere anbefalingssystemer, mestrer SVD-algoritmen, evaluerer kvaliteten på anbefalingene til den trente modellen
Vi løser 50+ problemer for å forsterke temaet
Modul 10 – Final Hackathon
Vi bruker alle de studerte metodene for å oppnå maksimal nøyaktighet av modellprediksjoner på Kaggle