Pārlekt uz galveno saturu

Kategoriju datu analīze

Studiju kursa apraksts

Kursa apraksta statuss:Apstiprināts
Kursa apraksta versija:5.00
Kursa apraksta apstiprināšanas datums:14.03.2024 11:48:07
Par studiju kursu
Kursa kods:SL_117LKI līmenis:7. līmenis
Kredītpunkti:2.00ECTS:3.00
Zinātnes nozare:Matemātika; Varbūtību teorija un matemātiskā statistikaMērķauditorija:Dzīvās dabas zinātnes
Studiju kursa vadītājs
Kursa vadītājs:Maksims Zolovs
Studiju kursa īstenotājs
Struktūrvienība:Statistikas mācību laboratorija
Struktūrvienības vadītājs:
Kontaktinformācija:Baložu iela 14, A korpuss, Rīga, statistikaatrsu[pnkts]lv, +371 67060897
Studiju kursa plānojums
Pilns laiks - 1. semestris
Lekcijas (skaits)7Lekciju ilgums (akadēmiskās stundas)2Kopā lekciju kontaktstundas14
Nodarbības (skaits)5Nodarbību ilgums (akadēmiskās stundas)2Kopā nodarbību kontaktstundas10
Kopā kontaktstundas24
Nepilns laiks - 1. semestris
Lekcijas (skaits)7Lekciju ilgums (akadēmiskās stundas)1Kopā lekciju kontaktstundas7
Nodarbības (skaits)5Nodarbību ilgums (akadēmiskās stundas)2Kopā nodarbību kontaktstundas10
Kopā kontaktstundas17
Studiju kursa apraksts
Priekšzināšanas:
• Pārzina varbūtību teoriju un matemātisko statistiku. • Pamatzināšanas „Jamovi” programmatūrā. • Pamatzināšanas datu analīzē.
Mērķis:
Ņemot vērā, ka lielākā daļa statistikas datu ir kategoriāli, kursa mērķis ir norādīt uz šādu datu īpašajām iezīmēm un iemācīt atbilstošās statistiskās analīzes metodes. Kurss galvenokārt koncentrēsies uz metodēm un pielietojumu, zināmā mērā apskatot matemātisko pamatu un metodoloģijas pamatojumu. Statistikas programmatūra „Jamovi” tiks izmantota datorklasēs, kur studenti analizēs lekcijās apskatītās reālās datu kopas, lai savienotu teoriju un praksi un studenti spētu pārliecināti pielietot metodoloģiju praktiskā datu analīzē.
Tēmu saraksts (pilna laika studijas)
Nr.TēmaĪstenošanas formaSkaitsNorises vieta
1Kategoriālu datu būtība. Klasifikācija pēc mērķa un skalas. Pētījumu veidi. Varbūtību sadalījumi. Overdispersion.Lekcijas1.00auditorija
2Kategorisku mainīgo kopējais sadalījums. Nosacītais un marginālais sadalījums. Maksimālās ticamības novērtējumi varbūtībām.Lekcijas1.00auditorija
3Neatkarība. Atkarības mērs, relatīvais risks, izredzes, izredžu attiecība. 2x2 biežumtabulas. Novērtējumi no biežumtabulas. Nosacītās varbūtības – jutīgums, specifiskums. Patiesi negatīvs, nepatiesi pozitīvs.Lekcijas1.00auditorija
4Ievads "Jamovi". Kategoriālu datu vizualizēšana. Sadalījumu salīdzināšana. Biežumtabulas. Nosacītie biežumi. Atkarības mērījumu aprēķināšana.Nodarbības1.00datorklase
5Tabulas, kas lielākas par 2 x 2. Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par iedzīvotāju sadalījumu. Hī kvadrāta kritērijs.Lekcijas1.00auditorija
6Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par neatkarību un nosacīto neatkarību.Nodarbības1.00datorklase
7Lielas izlases gadījums, hipotēze par neatkarību. Hī kvadrāta un iespējamības attiecības kritērijs. Mazas izlases gadījums, Fišera kritērijs.Lekcijas1.00auditorija
8Hipotēze par neatkarību un nosacīto neatkarību.Nodarbības1.00datorklase
9Multinomiālu biežumu asimptotiskais sadalījums. Ticamības intervāli izredžu attiecībai un relatīvajam riskam. Marginālā sadalījuma viendabīguma pārbaude sapārotu novērojumu gadījumā.Lekcijas1.00auditorija
10Atkarības mērījumu intervāla aprēķināšana. Maknemāra tests.Nodarbības1.00datorklase
11Binārā iznākuma mainīgā modeļi – loģistiskās regresijas un log lineārie modeļi. Retrospektīvo pētījumu modeļi. Lēmumu koki klasifikācijai.Lekcijas1.00auditorija
12Kategoriālu datu modelēšana. Klasificēti dati un neapstrādāti dati. Modelēšana un lēmumu pieņemšanas shēmas. Klasifikācijas kļūda.Nodarbības1.00datorklase
Tēmu saraksts (nepilna laika studijas)
Nr.TēmaĪstenošanas formaSkaitsNorises vieta
1Kategoriālu datu būtība. Klasifikācija pēc mērķa un skalas. Pētījumu veidi. Varbūtību sadalījumi. Overdispersion.Lekcijas1.00auditorija
2Kategorisku mainīgo kopējais sadalījums. Nosacītais un marginālais sadalījums. Maksimālās ticamības novērtējumi varbūtībām.Lekcijas1.00auditorija
3Neatkarība. Atkarības mērs, relatīvais risks, izredzes, izredžu attiecība. 2x2 biežumtabulas. Novērtējumi no biežumtabulas. Nosacītās varbūtības – jutīgums, specifiskums. Patiesi negatīvs, nepatiesi pozitīvs.Lekcijas1.00auditorija
4Ievads "Jamovi". Kategoriālu datu vizualizēšana. Sadalījumu salīdzināšana. Biežumtabulas. Nosacītie biežumi. Atkarības mērījumu aprēķināšana.Nodarbības1.00datorklase
5Tabulas, kas lielākas par 2 x 2. Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par iedzīvotāju sadalījumu. Hī kvadrāta kritērijs.Lekcijas1.00auditorija
6Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par neatkarību un nosacīto neatkarību.Nodarbības1.00baseins
7Lielas izlases gadījums, hipotēze par neatkarību. Hī kvadrāta un iespējamības attiecības kritērijs. Mazas izlases gadījums, Fišera kritērijs.Lekcijas1.00auditorija
8Hipotēze par neatkarību un nosacīto neatkarību.Nodarbības1.00datorklase
9Multinomiālu biežumu asimptotiskais sadalījums. Ticamības intervāli izredžu attiecībai un relatīvajam riskam. Marginālā sadalījuma viendabīguma pārbaude sapārotu novērojumu gadījumā.Lekcijas1.00auditorija
10Atkarības mērījumu intervāla aprēķināšana. Maknemāra tests.Nodarbības1.00datorklase
11Binārā iznākuma mainīgā modeļi – loģistiskās regresijas un log lineārie modeļi. Retrospektīvo pētījumu modeļi. Lēmumu koki klasifikācijai.Lekcijas1.00auditorija
12Kategoriālu datu modelēšana. Klasificēti dati un neapstrādāti dati. Modelēšana un lēmumu pieņemšanas shēmas. Klasifikācijas kļūda.Nodarbības1.00datorklase
Vērtēšana
Patstāvīgais darbs:
1. Patstāvīgais darbs ar kursa materiālu, gatavojoties lekcijām pēc plāna. 2. Patstāvīga mājasdarbu izpilde, praktizējot kursā apgūtās koncepcijas. Lai novērtētu studiju kursa kvalitāti kopumā, studentam jāaizpilda studiju kursa novērtēšanas anketa Studējošo portālā.
Vērtēšanas kritēriji:
Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • 2 Patstāvīgi izpildīti mājasdarbi – 50%. • Apmeklētība un aktīva iesaiste praktisko nodarbību laikā – 25%. • Rakstisks gala eksāmens – 25%.
Gala pārbaudījums (pilna laika studijas):Eksāmens (Rakstisks)
Gala pārbaudījums (nepilna laika studijas):Eksāmens (Rakstisks)
Studiju rezultāti
Zināšanas:• Pēc sekmīgas kursa apgūšanas studējošie pārzinās statistiskās analīzes metodoloģijas klāstu, kas pieejams kategoriāliem datiem. Viņi pārzinās un interpretēs lielās, kā arī mazās izlases pārbaudes. • Noteiks kategoriālo datu raksturu; kā izmērīt atkarību starp kategoriskajiem mainīgajiem, pamatojoties uz pētījuma veidu un mainīgo veidu (nominālais vai ordināls). • Studējošie parādīs, kā modelēt binārā iznākuma mainīgo, izmantojot nepārtrauktus vai kategoriskus mainīgos.
Prasmes:• Studējošie saprot un paskaidro dažāda veida datu vākšanas metožu ietekmi uz biežumtabulas nejaušību. Interpretē biežumtabulas, tās rindu un kolonnu sadalījuma modeļus. • Izskaidro atkarības mērījumus, kas definēti 2 kategorisku mainīgo (relatīvais risks, izredžu attiecība utt.) kopējā sadalījumā, spēj tos interpretēt un aprēķināt. • Prot pārbaudīt datu piemērotību ar pieņemto sadalījuma modeli, prot pārbaudīt kategorisko mainīgo neatkarību. • Prot modelēt kategorisko mainīgo (īpaši bināro) ar citiem mainīgajiem. • Prot patstāvīgi pielietot savas zināšanas darbā ar reāliem datiem.
Kompetences:• Pēc sekmīgas kursa apgūšanas studējošais būs kompetents lasīt un kritiski novērtēt zinātniskās publikācijas, kuru analīzē izmantoti kategoriāli dati. • Studējošais būs kompetents plānot kategoriālu datu analīzi un analizēt šādus datus.
Bibliogrāfija
Nr.Atsauce
Obligātā literatūra
1Agresti, Alan. Categorical Data Analysis. Wiley, 2012 (or 1990, 2002 editions).
Papildu literatūra
1Agresti, Alan. An Introduction to Categorical Data Analysis. Wiley, 2019 (or 1996, 2007 editions).