Data Science - gratis kurs fra School of Data Analysis, opplæring 4 semestre, dato 2. desember 2023.
Miscellanea / / December 05, 2023
For de som ønsker å skape problemer ved hjelp av dataanalyse, foreslå løsninger og evaluer effektiviteten deres, ikke bare i et syntetisk eksperiment, men også under reelle forhold.
Statistikk, maskinlæring og arbeid med ulike typer data.
Data underbygger de fleste moderne tjenester og produkter, fra værvarslingsapper til selvkjørende biler. En dataforsker utfører eksperimenter, bygger beregninger, vet hvordan man optimerer driften av tjenester og forstår hvor vekstpunktene deres er.
Hver student må fullføre minst tre emner i løpet av semesteret. For eksempel, hvis det er to av dem i hovedprogrammet, må du velge ett av spesialkursene.
Kunnskap testes først og fremst gjennom lekser - eksamener og prøver gjennomføres kun i enkelte fag.
Første semester
Påbudt, bindende
Algoritmer og datastrukturer, del 1
01.Kompleksitet og beregningsmodeller. Analyse av regnskapsverdier (begynnelse)
02. Analyse av regnskapsverdier (slutt)
03.Merge-Sort og Quick-Sort-algoritmer
04. Ordinalstatistikk. Heaps (begynnelse)
05. Heaps (slutt)
06.Hashing
07.Søk i trær (begynnelse)
08.Søk i trær (fortsettelse)
09.Søk i trær (slutt). System av usammenhengende sett
10. RMQ og LCA oppgaver
11.Datastrukturer for geometrisk søk
12. Problemet med dynamisk tilkobling i en urettet graf
Python språk
01. Grunnleggende språk (del 1)
02. Grunnleggende språk (del 2)
03.Objektorientert programmering
04.Feilhåndtering
05. Kodedesign og testing
06. Arbeide med strenger
07.Minnemodell
08Funksjonell programmering
09. Biblioteksanmeldelse (del 1)
10. Biblioteksanmeldelse (del 2)
11.Parallell databehandling i Python
12.Avansert arbeid med objekter
Maskinlæring, del 1
01.Grunnleggende begreper og eksempler på anvendte problemer
02.Metriske klassifiseringsmetoder
03.Logiske klassifiseringsmetoder og beslutningstrær
04. Gradient lineære klassifiseringsmetoder
05.Support Vector Machine
06.Multivariat lineær regresjon
07. Ikke-lineær og ikke-parametrisk regresjon, ikke-standard tapsfunksjoner
08.Tidsserieprognoser
09.Bayesianske klassifiseringsmetoder
10.Logistisk regresjon
11.Søk etter foreningens regler
Andre termin
Påbudt, bindende
Grunnleggende om statistikk i maskinlæring
01.Introduksjon
02. Hovedoppgaver og metoder for teorien om statistisk slutning
03. Distribusjonsestimering og statistiske funksjoner
04.Monte Carlo simulering, bootstrap
05. Parametrisk estimering
06. Hypotesetesting
07. Redusere dimensjonaliteten til flerdimensjonale data
08.Vurdere modellens følsomhet
09.Lineær og logistisk regresjon
10. Metoder for design av eksperimenter
11.Ulike typer regularisering i lineær regresjon
12. Ikke-lineære metoder for å konstruere regresjonsavhengigheter
13.Ikke-parametrisk estimering
14. Bayesiansk tilnærming til estimering
15. Bayesiansk tilnærming til regresjon
16. Bayesiansk tilnærming til regresjon og optimalisering
17.Bruk av den tilfeldige Gaussiske feltmodellen i dataanalyseproblemer
18.Bruk av statistiske modeller og metoder i surrogatmodellering og optimaliseringsproblemer
Maskinlæring, del 2
01. Nevrale nettverksmetoder for klassifisering og regresjon
02.Komposisjonelle metoder for klassifisering og regresjon
03.Kriterier for valg av modeller og metoder for valg av funksjoner
04.Rangering
05.Forsterkende læring
06.Lære uten lærer
07.Problemer med deltrening
08.Samarbeidsfiltrering
09. Temamodellering
Tredje semester
Å velge fra
Automatisk tekstbehandling
01Kursmateriell
eller
Datamaskin syn
Kurset er viet metoder og algoritmer for datasyn, d.v.s. hente ut informasjon fra bilder og videoer. La oss se på det grunnleggende om bildebehandling, bildeklassifisering, bildesøk etter innhold, ansiktsgjenkjenning, bildesegmentering. Deretter skal vi snakke om videobehandling og analysealgoritmer. Den siste delen av kurset er viet 3D-rekonstruksjon. For de fleste problemer vil vi diskutere eksisterende nevrale nettverksmodeller. I kurset prøver vi kun å ta hensyn til de mest moderne metodene som for tiden brukes for å løse praktiske og forskningsmessige problemer. Kurset er stort sett praktisk fremfor teoretisk. Derfor er alle forelesninger utstyrt med laboratorie- og lekser, som lar deg prøve de fleste metodene som diskuteres i praksis. Arbeidet utføres i Python ved hjelp av ulike biblioteker.
01.Digitalt bilde og tonekorrigering.
02. Grunnleggende om bildebehandling.
03.Kombinering av bilder.
04. Klassifisering av bilder og søk etter lignende.
05. Konvolusjonelle nevrale nettverk for klassifisering og søk etter lignende bilder.
06. Gjenstandsgjenkjenning.
07. Semantisk segmentering.
08. Stiloverføring og bildesyntese.
09.Videogjenkjenning.
10. Sparsom 3D-rekonstruksjon.
11.Tett tredimensjonal rekonstruksjon.
12.Rekonstruksjon fra én ramme og punktskyer, parametriske modeller.
Fjerde semester
Anbefalte spesialkurs
Dyp læring
01.Kursmateriell
Forsterkende læring
01.Kursmateriell
Selvkjørende biler
Kurset dekker kjernekomponentene i selvkjørende teknologi: lokalisering, persepsjon, prediksjon, atferdsnivå og bevegelsesplanlegging. For hver komponent vil hovedtilnærmingene bli beskrevet. I tillegg vil studentene bli kjent med gjeldende markedsforhold og teknologiske utfordringer.
01.Oversikt over hovedkomponentene og sensorene til et ubemannet kjøretøy. Nivåer av autonomi. Drive by Wire. Selvkjørende biler som bedriftsprodukt. Måter å evaluere fremgang i å lage droner. Grunnleggende om lokalisering: gnss, hjulodometri, Bayesianske filtre.
02. Metoder for lidar lokalisering: ICP, NDT, LOAM. Introduksjon til visuell SLAM med ORB-SLAM som eksempel. Uttalelse av GraphSLAM-problemet. Redusere GraphSLAM-problemet til en ikke-lineær minste kvadraters metode. Velge riktig parameterisering. Systemer med en spesiell struktur i GraphSLAM. Arkitektonisk tilnærming: frontend og backend.
03. Gjenkjennelsesoppgave i selvkjørende bil. Statiske og dynamiske hindringer. Sensorer for gjenkjenningssystemet. Representasjon av statiske hindringer. Deteksjon av statiske hindringer ved hjelp av lidar (VSCAN, nevrale nettverksmetoder). Bruk av lidar i forbindelse med bilder for å oppdage statikk (semantisk bildesegmentering, dybdefullføring). Stereokamera og få dybde fra et bilde. Stixel verden.
04. Tenker på dynamiske hindringer i en selvkjørende bil. Nevrale nettverksmetoder for å oppdage objekter i 2D. Deteksjon basert på fugleperspektiv av lidar-skyrepresentasjon. Bruke lidar med bilder for å oppdage dynamiske hindringer. Bildeteksjon i 3D basert på bilder (3D-boksmontering, CAD-modeller). Radarbasert dynamisk hindringsdeteksjon. Objektsporing.
05. Bilkjøringsmønstre: bakhjul, forhjul. Veiplanlegging. Konseptet med konfigurasjonsrom. Grafiske metoder for å konstruere baner. Baner som minimerer rykk. Optimaliseringsmetoder for å konstruere baner.
06.Hastighetsplanlegging i et dynamisk miljø. ST planlegging. Forutsi adferden til andre trafikanter.