Maskinlæring i praksis - kurs 41 500 rub. fra IBS Training Center, trening 24 timer, dato 26. november 2023.
Miscellanea / / December 02, 2023
Kurset er bygget opp rundt flere praktiske caser som inneholder tabeller med startdata.
For hvert tilfelle går vi gjennom hele livssyklusen til et maskinlæringsprosjekt:
forskning, rensing og klargjøring av data,
velge en treningsmetode som passer for oppgaven (lineær regresjon for regresjon, tilfeldig skog for klassifisering, K-midler og DBSCAN for clustering),
trening med den valgte metoden,
resultatevaluering,
modelloptimalisering,
presentasjon av resultatet for kunden.
Under diskusjonsdelen av kurset diskuterer vi praktiske problemer studentene står overfor som kan løses ved hjelp av de diskuterte metodene.
Emner som dekkes:
1. Gjennomgang av oppgaven (teori – 1 time)
Hvilke problemer løses godt av maskinlæring, og hvilke problemer prøver de å løse?
Hva skjer hvis du i stedet for en Data Scientist ansetter en ikke-spesialist på området (bare en utvikler/analytiker/leder) med forventning om at de vil lære i prosessen.
2. Forberedelse, renhold, dataforskning (teori – 1 time, praksis – 1 time)
Hvordan forstå kildeforretningsdataene (og generelt oppdage enhver ordre i den).
Behandlingssekvens.
Hva kan og bør delegeres til domeneanalytikere, og hva gjøres best av Data Scientist selv.
Prioriteringer for å løse et spesifikt problem.
3. Klassifiserere og regressorer (teori – 2 timer, praksis – 2 timer)
Praktisk del - godt formaliserte oppgaver med forberedte data.
Forskjell mellom oppgaver (binær/ikke-binær/sannsynlighetsklassifisering, regresjon), omfordeling av oppgaver mellom klasser.
Eksempler på klassifisering av praktiske problemer.
4. Clustering (teori – 1 time, praksis – 2 timer)
Hvor og hvordan utføre klynging: dataundersøkelser, sjekke problemstillingen, sjekke resultatene.
Hvilke saker kan reduseres til klynging.
5. Modellevaluering (teori – 1 time, praksis – 1 time)
Forretningsmålinger og tekniske beregninger.
Beregninger for klassifiserings- og regresjonsproblemer, feilmatrise.
Interne og eksterne beregninger for klyngekvalitet.
Kryssvalidering.
Vurdere omskolering.
6. Optimalisering (teori – 5 timer, praksis – 3 timer)
Hva gjør en modell bedre enn en annen: parametere, funksjoner, ensembler.
Innstillingsbehandling.
Praksis for valg av funksjoner.
Gjennomgang av verktøy for å finne de beste parameterne, funksjonene og metodene.
7. Diagrammer, rapporter, arbeid med levende oppgaver (teori – 2 timer, praksis – 2 timer)
Hvordan forklare tydelig hva som skjer: til deg selv, til teamet, til klienten.
Flere vakre svar på meningsløse spørsmål.
Hvordan presentere tre terabyte med resultater på ett lysbilde.
Halvautomatiske tester, hvilke prosesskontrollpunkter som virkelig trengs.
Fra levende oppgaver til en full FoU-prosess ("FoU i praksis") - analyse og analyse av oppgaver fra publikum.