Machine learning og bioinformatik (matematik) – hent gratis undervisningsmateriale
Projektet Dataekspeditioner ved Datalogisk Institut, Københavns Universitet har i samarbejde med gymnasielærere udviklet informatikinspirerede undervisningsforløb til ungdomsuddannelserne, der tager udgangspunkt i virkelige problemstillinger. Med forløbene kan du tilgodese lærerplanernes krav om brug af data og digitale værktøjer.
Læs mere, og find undervisningsmaterialet her
Om undervisningsforløbet
Dette forløb er tænkt til at kunne bruges i matematik på A-niveau. I Bioteknologi studieretningen kan man bruge forløbet som en del af et tværfagligt forløb om Bioinformatik i MA og BT. Uafhængigt af hvilke fag, der indgår i forløbet, vil vi gerne vise eleverne, hvordan Machine Learning giver nye muligheder.
Forløbets relation til fagenes kernestof/faglige mål
Matematik
Plangeometri: Vi tager udgangspunkt i en ML model, som hedder K-nearest neigbours (K-nærmeste naboer, kNN). Den ligger lige i forlængelse af afstandsberegning i plangeometri, og kan udvides til afstandsberegning i 1, 2, 3 eller mange dimensioner.
Regression: når man laver ren regressionsmodel, kan man bagefter forudse funktionsværdier for nye x-værdier med funktionsforskriften fra regressionsmodellen. Denne forståelse af regression videreføres til at forklare, hvad man gør i ML: Data → ML-model → forudsigelse med ML-modellen ud fra nye data
Analyse af lineær regressionsmodel: Det tredje modul viser, hvordan man kan bruge konfidensinterval for hældningen og analyse af spredning af residualer, samt undersøgelse af om residualerne er normalfordelte, til at beskrive kvaliteten af den udviklede model til aldersbestemmelse. Modulet giver således et eksempel fra videnskabelig praksis på anvendelse af denne nye del af kernepensum.
Bioteknologi
Bruges forløbet i et tværfagligt forløb med bioteknologi dækkes dele af kernestoffet i bioinformatik.
Bioinformatik: eleverne får indblik i, hvordan brugen af computere i bioinformatik ændrer sig i disse år fra databaseopslag til brug af f.eks. DNA-data i Machine Learning modeller.