Studiegids

nl en

Inleiding statistiek voor Machine Learning

Vak
2024-2025

Toegangseisen

Niet van toepassing

Beschrijving

In de eerste twee decennia van de twintigste eeuw zijn er methoden ontwikkeld die onderzoekers in staat stellen om in meer detail levende processen te onderzoeken. De complexiteit van biotische processen, van moleculaire structuren tot hele ecosystemen, kan nu in steeds kleinere details worden bestudeerd. Deze metingen zijn vaak geautomatiseerd en leiden tot complexe datastructuren. Dit is een uitdaging voor klassieke statistische methoden die, onder toezicht van de onderzoeker, informatie uit de data proberen te onttrekken. Om deze complexe datasets te kunnen analyseren, is de statistische analyse ook geautomatiseerd; de supervisie van de analyse wordt nu uitgevoerd door de computer zelf. In deze cursus zullen we de uitdagingen die deze moderne statistische methodiek van Machine Learning (ML) genaamd, introduceren bespreken. We zullen verschillende technieken bespreken en met elkaar vergelijken in verschillende contexten.

Leerdoelen

  1. Het verschil tussen hypothese gedreven data acquisitie en data gedreven hypothese selectie herkennen.
  2. Controleren en vergroten van de kwaliteit van complexe data.
  3. Complexe data kunnen visualiseren met unsupervised ML methoden.
  4. Algoritmisch begrip van de verschillende methoden van ML methoden.
  5. Complexe data te kunnen analyseren en complexe supervised ML modellen interpreteren.
  6. Het toepassen van ML in predictie modellen.
  7. De onderliggende basisprincipes van de methoden begrijpen en verschillen te kunnen duiden.

Rooster

In MyTimetable kun je alle vak- en opleidingsroosters vinden, waarmee jij je persoonlijke rooster kunt samenstellen. Onderwijsactiviteiten waarvoor je je via MyStudyMap hebt ingeschreven, worden automatisch in je rooster getoond.

Daarnaast kun je My Timetable gemakkelijk koppelen aan een agenda-app op je telefoon en worden roosterwijzigingen automatisch in je agenda doorgevoerd; bovendien ontvang je desgewenst per e-mail een notificatie van de wijziging. Je kunt notificaties aanzetten bij Instellingen, nadat je bent ingelogd.

Vragen? Bekijk de video, lees de instructie of neem contact op met de ISSC helpdesk.

Let op: Joint Degree studenten Leiden/Delft dienen de informatie uit de Leidse en Delftse MyTimetables samen te voegen om een volledig rooster te zien. Deze video legt uit hoe dat werkt.

Onderwijsvorm

Het vak zal bestaan uit hoor- en werkcolleges.

Toetsing en weging

Het eindcijfer bestaat uit de volgende deelcijfers:

  • Groepsopdracht: 1/3

  • Tentamen 2/3

Bodemcijfer:
Voor vakken uit jaar 2 en 3 van de bachelor geldt een bodemcijfer van een onafgeronde 5,5.

Als een vak 2 of meer schriftelijke deeltentamens heeft, geldt het bodemcijfer alleen voor het gewogen gemiddelde van de tentamens.
Bij deelcijfers uit andere onderdelen dan tentamens (bijv. practica, werkcolleges, schrijfopdrachten) geldt wel voor de losse onderdelen het bodemcijfer.

Raadpleeg het Studentenstatuut voor een overzicht van alle richtlijnen (zie daarin Regels en Richtlijnen Examencommissie voor geldigheid van deelcijfers).

Literatuurlijst

"An Introduction to Statistical Learning with Applications in R", Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani, 2023, second edition. Te downloaden via de webpagina van de auteurs.

Inschrijven

Als student ben je zelf verantwoordelijk voor het tijdig inschrijven via MyStudyMap.

In deze korte video zie je stap voor stap hoe je je kunt inschrijven voor cursussen in MyStudyMap.
Uitgebreide informatie over de werking van MyStudyMap vind je hier.

Er zijn twee inschrijfperiodes per jaar:

  • de inschrijving voor het najaar opent in juli

  • de inschrijving voor het voorjaar opent in december

Zie deze pagina voor meer informatie over deadlines en inschrijven voor vakken en tentamens.

Let op:

  • Het is verplicht om je in te schrijven voor alle activiteiten die je gaat volgen van een vak.

  • Je inschrijving is pas voltooid wanneer je je cursusplanning indient in het tabblad ‘Klaar voor inschrijving’ door op ‘indienen’ te klikken.

  • Niet ingeschreven zijn voor een (her)tentamen betekent dat je niet mag deelnemen aan het (her)tentamen.

Contact

Coördinator: Dr. H.G.J. van Mil
Email: h.g.j.van.mil@math.leidenuniv.nl

Opmerkingen

Inzage en feedback op het tentamen: datum nog niet bekend.
Brightspace wordt gebruikt voor communicatie.

Software
Vanaf collegejaar 2024/2025 werkt de faculteit Wiskunde en Natuurwetenschappen met het software distributieplatform Academic Software. Via het platform kun je toegang krijgen tot de software die je nodig hebt voor bepaalde vakken in je studie. Voor sommige software moet je laptop aan bepaalde systeemeisen voldoen. Dit staat aangegeven bij de software. Belangrijk is dat je de software installeert voor de start van het vak. Meer informatie over het laptopprofiel vind je op de studentenwebsite.