Pārlekt uz galveno saturu

Daudzdimensiju statistiskā analīze

Studiju kursa apraksts

Kursa apraksta statuss:Apstiprināts
Kursa apraksta versija:4.00
Kursa apraksta apstiprināšanas datums:14.03.2024 11:36:29
Par studiju kursu
Kursa kods:SL_119LKI līmenis:7. līmenis
Kredītpunkti:2.00ECTS:3.00
Zinātnes nozare:Matemātika; Varbūtību teorija un matemātiskā statistikaMērķauditorija:Dzīvās dabas zinātnes
Studiju kursa vadītājs
Kursa vadītājs:Andrejs Ivanovs
Studiju kursa īstenotājs
Struktūrvienība:Statistikas mācību laboratorija
Struktūrvienības vadītājs:
Kontaktinformācija:Kapseļu iela 23, 2.stāvs, Rīga, statistikaatrsu[pnkts]lv, +371 67060897
Studiju kursa plānojums
Pilns laiks - 1. semestris
Lekcijas (skaits)6Lekciju ilgums (akadēmiskās stundas)2Kopā lekciju kontaktstundas12
Nodarbības (skaits)6Nodarbību ilgums (akadēmiskās stundas)2Kopā nodarbību kontaktstundas12
Kopā kontaktstundas24
Nepilns laiks - 1. semestris
Lekcijas (skaits)6Lekciju ilgums (akadēmiskās stundas)1Kopā lekciju kontaktstundas6
Nodarbības (skaits)6Nodarbību ilgums (akadēmiskās stundas)2Kopā nodarbību kontaktstundas12
Kopā kontaktstundas18
Studiju kursa apraksts
Priekšzināšanas:
Augstākā matemātika, varbūtība, statistika, lineārie modeļi, pamatzināšanas par „R” programmēšanu.
Mērķis:
Kursa mērķis ir iepazīstināt ar daudzdimensiju datu analīzes rīkiem un koncepcijām, īpašu uzmanību pievēršot lietojumiem ar „R” programmu.
Tēmu saraksts (pilna laika studijas)
Nr.TēmaĪstenošanas formaSkaitsNorises vieta
1Ievads daudzdimensiju analīzē, daudzdimensiju datu kopu piemēri, kovariācija, korelācija, daudzdimensiju normālais sadalījums. Lineārās algebras pamatelementu atkārtošana: determinanti, inversija, īpašvērtības un īpašvektori, dekompozīcijas un kvadrātiskās formas.Lekcijas1.00auditorija
2Daudzdimensiju datu vizualizācija ar „R”. Praktiski matricu algebras aprēķini „R”.Nodarbības1.00datorklase
3Galveno komponentu (PC) analīze. Ģeometriska pieeja datu matricas izmēra samazināšanai. Galveno komponentu definīcija, interpretācija un secinājumi par tiem. Normalizēti galvenie komponenti.Lekcijas1.00auditorija
4Reālu datu piemēra analīze „R”: galveno komponentu aprēķināšana, statistiskās nozīmības noteikšana, grafiku sastādīšana galveno komponentu interpretācijai.Nodarbības1.00datorklase
5Faktoranalīze. Ortogonālais faktoru modelis. Faktoru interpretācija. Kopīgo faktoru skaita pārbaude. Salīdzinājums ar galveno komponentu analīzi.Lekcijas1.00auditorija
6Faktoru analīze „R”: faktoru modeļa novērtēšana, faktoru skaita pārbaude, diagrammu sastādīšana faktoru interpretācijai.Nodarbības1.00datorklase
7Diskriminantu analīze. Klases, iezīmes un klasifikācijas precizitātes mēri. Lineārā un kvadrātiskā diskriminantu analīze.Lekcijas1.00auditorija
8Diskriminantu analīze „R”: metožu novērtēšana, interpretācija, salīdzināšana.Nodarbības1.00datorklase
9Klasteranalīze. Objektu tuvums, attāluma funkcijas. Dažādi klasterizācijas algoritmi.Lekcijas1.00auditorija
10Klasteranalīze „R”: dažādu klasterizācijas algoritmu īstenošana un salīdzināšana. Optimālā klasteru skaita noteikšana.Nodarbības1.00datorklase
11Daudzdimensiju lineārā regresija. Daudzdimensiju normālā sadalījuma pārbaude.Lekcijas1.00auditorija
12Daudzdimensiju lineārā regresija „R”: novērtēšana, pārbaude un interpretācija.Nodarbības1.00datorklase
Tēmu saraksts (nepilna laika studijas)
Nr.TēmaĪstenošanas formaSkaitsNorises vieta
1Ievads daudzdimensiju analīzē, daudzdimensiju datu kopu piemēri, kovariācija, korelācija, daudzdimensiju normālais sadalījums. Lineārās algebras pamatelementu atkārtošana: determinanti, inversija, īpašvērtības un īpašvektori, dekompozīcijas un kvadrātiskās formas.Lekcijas1.00auditorija
2Daudzdimensiju datu vizualizācija ar „R”. Praktiski matricu algebras aprēķini „R”.Nodarbības1.00datorklase
3Galveno komponentu (PC) analīze. Ģeometriska pieeja datu matricas izmēra samazināšanai. Galveno komponentu definīcija, interpretācija un secinājumi par tiem. Normalizēti galvenie komponenti.Lekcijas1.00auditorija
4Reālu datu piemēra analīze „R”: galveno komponentu aprēķināšana, statistiskās nozīmības noteikšana, grafiku sastādīšana galveno komponentu interpretācijai.Nodarbības1.00datorklase
5Faktoranalīze. Ortogonālais faktoru modelis. Faktoru interpretācija. Kopīgo faktoru skaita pārbaude. Salīdzinājums ar galveno komponentu analīzi.Lekcijas1.00auditorija
6Faktoru analīze „R”: faktoru modeļa novērtēšana, faktoru skaita pārbaude, diagrammu sastādīšana faktoru interpretācijai.Nodarbības1.00datorklase
7Diskriminantu analīze. Klases, iezīmes un klasifikācijas precizitātes mēri. Lineārā un kvadrātiskā diskriminantu analīze.Lekcijas1.00auditorija
8Diskriminantu analīze „R”: metožu novērtēšana, interpretācija, salīdzināšana.Nodarbības1.00datorklase
9Klasteranalīze. Objektu tuvums, attāluma funkcijas. Dažādi klasterizācijas algoritmi.Lekcijas1.00auditorija
10Klasteranalīze „R”: dažādu klasterizācijas algoritmu īstenošana un salīdzināšana. Optimālā klasteru skaita noteikšana.Nodarbības1.00datorklase
11Daudzdimensiju lineārā regresija. Daudzdimensiju normālā sadalījuma pārbaude.Lekcijas1.00auditorija
12Daudzdimensiju lineārā regresija „R”: novērtēšana, pārbaude un interpretācija.Nodarbības1.00datorklase
Vērtēšana
Patstāvīgais darbs:
1. Obligātās un papildliteratūras izpēte, lekcijās un nodarbībās apgūto zināšanu paplašināšanai un nostiprināšanai 2. Studējošajiem jāizpilda pieci „R” balstīti mājasdarbi, kas saistīti ar katru no šīm tēmām: a. Galveno komponentu analīze (2. praktiskā nodarbība). b. Faktoranalīze (3. praktiskā nodarbība). c. Diskriminantu analīze (4. praktiskā nodarbība). d. Klasteranalīze (5. praktiskā nodarbība). e. Daudzdimensiju lineārā regresija (6. praktiskā nodarbība).
Vērtēšanas kritēriji:
Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • 5 iesniedzamie mājasdarbi – 70%. • rakstisks eksāmens – 30%.
Gala pārbaudījums (pilna laika studijas):Eksāmens (Rakstisks)
Gala pārbaudījums (nepilna laika studijas):Eksāmens (Rakstisks)
Studiju rezultāti
Zināšanas:Studējošais: • ir ieguvis padziļinātas zināšanas par teorētiskajiem varbūtības jēdzieniem, kas saistīti ar daudzdimensiju analīzi; • ilustrē vizualizācijas paņēmienus, aprakstot daudzdimensiju datus; • novērtē svarīgākās daudzdimensiju metodes, piemēram, galveno komponentu analīzi, faktoranalīzi, klasteranalīzi un diskriminantu analīzi.
Prasmes:• „R” programmā ievieš atbilstošas daudzdimensiju datu vizualizācijas; • prot patstāvīgi izmantot daudzdimensiju datu analīzes metodes „R” programmā, lai veiktu pētniecisku darbību, vai augsti kvalificētas profesionālas funkcijas.
Kompetences:• Prot salīdzināt un izprast dažādu daudzdimensiju datu analīzes metožu mērķus un izvēlēties piemērotāko datu kopas analīzei; • Spēj izvirzīt hipotēzes un pieņemt uz analīzi balstītus lēmumus, kas saistīti ar daudzdimensiju datiem.
Bibliogrāfija
Nr.Atsauce
Obligātā literatūra
1W. K. Haerdle Härdle, L. Simar, Applied Multivariate Statistical Analysis. Springer. 2015
2D. Zelterman. Applied Multivariate Statistics with R. Springer, Statistics for biology and health series, 2015
Papildu literatūra
1R. A. Johnson, D.W. Wickern, Applied Multivariate Statistical Analysis, 6th edition. Prentice & Hall, 2007
2T. Hothorn, B. Everitt, An Introduction to Applied Multivariate Analysis with R. Springer, Use R! series, 2011