ZUT - Polska Rama Kwalifikacji / Rok 2021/2022 / Wydział Informatyki / Informatyka (S1) / Sylabus przedmiotu

Wydział Informatyki - Informatyka (S1)

Sylabus przedmiotu Przetwarzanie i analiza danych:

Informacje podstawowe

Kierunek studiów	Informatyka
Forma studiów	studia stacjonarne	Poziom	pierwszego stopnia
Tytuł zawodowy absolwenta	inżynier
Obszary studiów	charakterystyki PRK, kompetencje inżynierskie PRK
Profil	ogólnoakademicki
Moduł	—
Przedmiot	Przetwarzanie i analiza danych
Specjalność	przedmiot wspólny
Jednostka prowadząca	Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej
Nauczyciel odpowiedzialny	Marcin Korzeń <Marcin.Korzen@zut.edu.pl>
Inni nauczyciele	Paweł Forczmański <Pawel.Forczmanski@zut.edu.pl>, Przemysław Klęsk <Przemyslaw.Klesk@zut.edu.pl>, Izabela Rejer <Izabela.Rejer@zut.edu.pl>
ECTS (planowane)	5,0	ECTS (formy)	5,0
Forma zaliczenia	zaliczenie	Język	polski
Blok obieralny	—	Grupa obieralna	—

Formy dydaktyczne

Forma dydaktyczna	KOD	Semestr	Godziny	ECTS	Waga	Zaliczenie
ćwiczenia audytoryjne	A	4	15	1,0	0,20	zaliczenie
laboratoria	L	4	30	2,0	0,40	zaliczenie
wykłady	W	4	30	2,0	0,40	zaliczenie

Wymagania wstępne

KOD	Wymaganie wstępne
W-1	Algebra liniowa
W-2	Matematyka stosowana ze statystyką 2
W-3	Metody numeryczne
W-4	Algorytmy 2

Cele przedmiotu

KOD	Cel modułu/przedmiotu
C-1	Zasadniczym celem przedmiotu jest zaznajomienie studenta z podstawowymi technikami analizy i przetwarzania różnego rodzaju danych. Celem dodatkowym jest zapoznanie praktyczne studenta z wybranym środowiiskiem analizy danych do wyboru rozważane mogą być środowiska analizy danych w językach Python, Matlab lub R.

Treści programowe z podziałem na formy zajęć

KOD	Treść programowa	Godziny
ćwiczenia audytoryjne
T-A-1	Przypomnienie wiadomośći z rachunku prewdopodobieństwa: niezależnośc, tw. Bayesa wzór na prawdopodobieństow całkowite.	2
T-A-2	Elementarne pojęcia teorii informacji: entorpia, entropia krzyżowa, informacja wzajemna, przyrost informacji, indeks Giniego, nierówność Gibbsa, własności związki z selekcją atrybutów oraz dyskretyzacją.	2
T-A-3	Techniki przetwarzania wstępnego, transformacje ortogonalne (PCA, dyskretne przekształcenie Foruriera), zadania	2
T-A-4	Zadanie klasyfikacji, miary jakości klasyfikacji, wyznaczanie krzywej ROC, zadania ilustrujące związki pomiędzy miarami jakości, klasyfikacja bezregułowa	4
T-A-5	Zadanie klasteryzacji, metryki geometryczne oraz miary podobieństwa pomiędzy skupieniami, grupowanie hierarchiczne, algorytm k-środków, zadania powiązane z analizą i działaniem algorytmów grupujących.	4
T-A-6	Kolokwium podsumowujące	1
		15
laboratoria
T-L-1	Wprowadzenie do środowiska obliczeniowego (Python (numpy, scipy, matplotlib, pandas, sklearn), Matlab (Statistical Toolbox), lub R) oraz wczytywanie danych w róznych formatach.	4
T-L-2	Metody preprocesingu normalizacja, binaryzacja, atrybutów, selekcja zmiennych	2
T-L-3	Transformacje ortogonalne oraz analiza składowych głównych, zastosowanie do ekstrakcji cech oraz wizualizacji danych	4
T-L-4	Wygładzanie danych, interpolacja, jądrowe estymatory funkcji gęstości.	2
T-L-5	Medody klasyfikacji implementacja wybranej metody (liniowy SVM, regresja logistyczna drzewo decyzyjne lub k-nn) oraz porównaie własnej implementacji z metodami wbudowanym w pakiet scikit-klearn.	4
T-L-6	Przegląd metod klasyfikacyjnych oraz ocena jakiości i czasu działania wybranych metod.	2
T-L-7	Klasyfikacja wielkolasowa różne strategie: 1:1 1:pozostali,	2
T-L-8	Regresja zwykłą i odporna zagadnienie selekcji zmiennych w modelu liniowym.	4
T-L-9	Grupowanie danych implementacja algorytmu k-środków. Analiza działania algorytmu, zastosowanie do kwantyzacji wektorowej.	4
T-L-10	Gurpowanie hierarchiczne, dendorogram porównanie metod grupowania danych. Dobór liczby skupień, miary AIC oraz BIC.	2
		30
wykłady
T-W-1	Modele danych oraz i różne rodzaje danych, rodzaje atrybutów, skale pomiarowe, Dane numeryczne, tabelaryczne, ramki danych, dane tekstowe, obrazy, dźwięki, szeregi czasowe, Załażenia odnośnie danych, i.i.d stacjonarność.	3
T-W-2	Techniki przetwarzania wstępnego (binaryzacja, normalizacje, skalowanie, braki w danych), Metody selekcji zmiennych oraz ogólne metody ekstrakcji cech z danych, transformacje ortogonalne danych: transformacja Fouriera, transformacja cosinusowa, PCA, techniki wizualizacji danych.	5
T-W-3	Duże małe, zbiory danych (big data), zagadnienia związane z przetwarzaniem dużych zbiorów danych (np. zarządzanie pamięcią, paradygmat map-reduce)	2
T-W-4	Zadania analizy danych (wygładzanie danych, identyfikacja rozkładu, klasyfikacja, regresja, klasteryzacja, wykrywanie zależności, wykrywanie obserwacji odstających, analiza szeregów czasowych), Komponenty typowego zadania analizy danych jak: wybór modelu, funkcja uczące, ocena jakości modelu, sposób zarządzania danymi. Paradygmaty uczenia maszynowego (nadzorowane, nienadzorowane, półnadzorowane, ze wzmocnieniem)	2
T-W-5	Histogramy, techniki wygładzania danych, Jądrowe metody estymacji funkcji gęstości, estymator Parzena	2
T-W-6	Metody oceny dokładności modeli (próba ucząca, walidująca, testowa, krosswalidacja, bootstap), miary oceny jakości modeli klasyfikacyjnych (dokładnosć, czułość, precyzja, F1, krzywa ROC, AUC), regresyjnych (MAE, MSE), funkcja wiarygodności, wiarygodność modelu	2
T-W-7	Podstawowe modele klasyfikacyjne: klasyfikatory liniowe (lda, regresja logistyczna, liniowy SVM), k-nn, drzewa decyzyjne; Klasyfikacja wieloklasowa.	6
T-W-8	Zadanie regresji, modele regresyjne: regresja liniowa, regresja odporna liniowa, regresje lokalne, regularyzacja modelu.	2
T-W-9	Techniki grupowania danych, kwantowanie wektorowe, metryki, miary oceny podobieństwa obiektów i skupień, metoda k-środków, metody hierarchiczne (Warda, najbliżeszego sąsiedztwa), Algorytm EM.	4
T-W-10	Zaliczenie wykładu	2
		30

Obciążenie pracą studenta - formy aktywności

KOD	Forma aktywności	Godziny
ćwiczenia audytoryjne
A-A-1	Uczestnictwo w zajęciach.	14
A-A-2	Kolokwium podsumowujące.	1
A-A-3	Praca własna studenta, przygotowanie się do kolowium.	9
A-A-4	Konsultacje	1
		25
laboratoria
A-L-1	Uczestnictwo w zajęciach	30
A-L-2	Praca własna studenta, przygotowywanie się do zajęć, przygotowywanie sprawozdań	18
A-L-3	Konsultacje	2
		50
wykłady
A-W-1	Uczestictwo w wykładach	30
A-W-2	Praca własna studenta, przygotowanie do zaliczenia	18
A-W-3	Konsultacje	2
		50

Metody nauczania / narzędzia dydaktyczne

KOD	Metoda nauczania / narzędzie dydaktyczne
M-1	Wykład informacyjny i problemowy
M-2	Ćwiczenia przedmiotowe

Sposoby oceny

KOD	Sposób oceny
S-1	Ocena formująca: Ćwiczenia: ocena z kolokwium podsumowującego, ocena pracy na zajęciach Laboratorium: oceny ze sprawozdań, ocena pracy na zajęciach
S-2	Ocena podsumowująca: Wykład: ocena z egzaminu Ćwiczenia: wypadkowa z ocen cząstkowych Laboratoria: wypadkowa z ocen cząstkowych

Zamierzone efekty uczenia się - wiedza

Zamierzone efekty uczenia się	Odniesienie do efektów kształcenia dla kierunku studiów	Odniesienie do efektów zdefiniowanych dla obszaru kształcenia	Odniesienie do efektów uczenia się prowadzących do uzyskania tytułu zawodowego inżyniera	Cel przedmiotu	Treści programowe	Metody nauczania	Sposób oceny
I_1A_C14_W01 Student zna postawowe pojęcia związane z analizą i przetwarzaniem danych, zna i rozróżnia podstawowe zagadnienia, metody i narzedzia analizy danych.	I_1A_W04, I_1A_W03	—	—	C-1	T-W-2, T-W-1, T-W-3, T-W-8, T-W-5, T-W-6, T-W-9, T-W-7, T-W-4	M-1	S-2

Zamierzone efekty uczenia się - umiejętności

Zamierzone efekty uczenia się	Odniesienie do efektów kształcenia dla kierunku studiów	Odniesienie do efektów zdefiniowanych dla obszaru kształcenia	Odniesienie do efektów uczenia się prowadzących do uzyskania tytułu zawodowego inżyniera	Cel przedmiotu	Treści programowe	Metody nauczania	Sposób oceny
I_1A_C14_U01 Student umie rozpoznawać typy zadań analizy i przetwarzania danych,umie wybrać odpowiednie metody i stosować wybrane narzędzia przy rozwiązywaniu zagadnień związanych z analizą i przetwarzaniem danych.	I_1A_U01, I_1A_U03, I_1A_U05, I_1A_U06	—	—	C-1	T-A-1, T-A-3, T-A-4, T-A-2, T-A-5, T-L-1, T-L-10, T-L-2, T-L-6, T-L-3, T-L-5, T-L-7, T-L-9, T-L-8, T-L-4	M-2	S-1, S-2

Kryterium oceny - wiedza

Efekt uczenia się	Ocena	Kryterium oceny
I_1A_C14_W01 Student zna postawowe pojęcia związane z analizą i przetwarzaniem danych, zna i rozróżnia podstawowe zagadnienia, metody i narzedzia analizy danych.	2,0	Uzyskanie z zaliczenia 50% punktów lub poniżej
	3,0	Uzyskanie z zaliczenia powyżej 50% punktów
	3,5	Uzyskanie z zaliczenia 60%-70% punktów
	4,0	Uzyskanie z zaliczenia 70%-80% punktów
	4,5	Uzyskanie z zaliczenia 80%-90% punktów
	5,0	Uzyskanie z zaliczenia 90%-100% punktów

Kryterium oceny - umiejętności

Efekt uczenia się	Ocena	Kryterium oceny
I_1A_C14_U01 Student umie rozpoznawać typy zadań analizy i przetwarzania danych,umie wybrać odpowiednie metody i stosować wybrane narzędzia przy rozwiązywaniu zagadnień związanych z analizą i przetwarzaniem danych.	2,0	Uzyskanie z zaliczenia minie lub rowno 50% punktów
	3,0	Uzyskanie z zaliczenia powyżej 50% punktów
	3,5	Uzyskanie z zaliczenia 60%-70% punktów
	4,0	Uzyskanie z zaliczenia 70%-80% punktów
	4,5	Uzyskanie z zaliczenia 80%-90% punktów
	5,0	Uzyskanie z zaliczenia 90%-100% punktów

Literatura podstawowa

J. Ćwik, J. Koronacki, Statystyczne systemy uczące się, PWN, Warszawa, 2013

Treści programowe - ćwiczenia audytoryjne

KOD	Treść programowa	Godziny
T-A-1	Przypomnienie wiadomośći z rachunku prewdopodobieństwa: niezależnośc, tw. Bayesa wzór na prawdopodobieństow całkowite.	2
T-A-2	Elementarne pojęcia teorii informacji: entorpia, entropia krzyżowa, informacja wzajemna, przyrost informacji, indeks Giniego, nierówność Gibbsa, własności związki z selekcją atrybutów oraz dyskretyzacją.	2
T-A-3	Techniki przetwarzania wstępnego, transformacje ortogonalne (PCA, dyskretne przekształcenie Foruriera), zadania	2
T-A-4	Zadanie klasyfikacji, miary jakości klasyfikacji, wyznaczanie krzywej ROC, zadania ilustrujące związki pomiędzy miarami jakości, klasyfikacja bezregułowa	4
T-A-5	Zadanie klasteryzacji, metryki geometryczne oraz miary podobieństwa pomiędzy skupieniami, grupowanie hierarchiczne, algorytm k-środków, zadania powiązane z analizą i działaniem algorytmów grupujących.	4
T-A-6	Kolokwium podsumowujące	1
		15

Treści programowe - laboratoria

KOD	Treść programowa	Godziny
T-L-1	Wprowadzenie do środowiska obliczeniowego (Python (numpy, scipy, matplotlib, pandas, sklearn), Matlab (Statistical Toolbox), lub R) oraz wczytywanie danych w róznych formatach.	4
T-L-2	Metody preprocesingu normalizacja, binaryzacja, atrybutów, selekcja zmiennych	2
T-L-3	Transformacje ortogonalne oraz analiza składowych głównych, zastosowanie do ekstrakcji cech oraz wizualizacji danych	4
T-L-4	Wygładzanie danych, interpolacja, jądrowe estymatory funkcji gęstości.	2
T-L-5	Medody klasyfikacji implementacja wybranej metody (liniowy SVM, regresja logistyczna drzewo decyzyjne lub k-nn) oraz porównaie własnej implementacji z metodami wbudowanym w pakiet scikit-klearn.	4
T-L-6	Przegląd metod klasyfikacyjnych oraz ocena jakiości i czasu działania wybranych metod.	2
T-L-7	Klasyfikacja wielkolasowa różne strategie: 1:1 1:pozostali,	2
T-L-8	Regresja zwykłą i odporna zagadnienie selekcji zmiennych w modelu liniowym.	4
T-L-9	Grupowanie danych implementacja algorytmu k-środków. Analiza działania algorytmu, zastosowanie do kwantyzacji wektorowej.	4
T-L-10	Gurpowanie hierarchiczne, dendorogram porównanie metod grupowania danych. Dobór liczby skupień, miary AIC oraz BIC.	2
		30

Treści programowe - wykłady

KOD	Treść programowa	Godziny
T-W-1	Modele danych oraz i różne rodzaje danych, rodzaje atrybutów, skale pomiarowe, Dane numeryczne, tabelaryczne, ramki danych, dane tekstowe, obrazy, dźwięki, szeregi czasowe, Załażenia odnośnie danych, i.i.d stacjonarność.	3
T-W-2	Techniki przetwarzania wstępnego (binaryzacja, normalizacje, skalowanie, braki w danych), Metody selekcji zmiennych oraz ogólne metody ekstrakcji cech z danych, transformacje ortogonalne danych: transformacja Fouriera, transformacja cosinusowa, PCA, techniki wizualizacji danych.	5
T-W-3	Duże małe, zbiory danych (big data), zagadnienia związane z przetwarzaniem dużych zbiorów danych (np. zarządzanie pamięcią, paradygmat map-reduce)	2
T-W-4	Zadania analizy danych (wygładzanie danych, identyfikacja rozkładu, klasyfikacja, regresja, klasteryzacja, wykrywanie zależności, wykrywanie obserwacji odstających, analiza szeregów czasowych), Komponenty typowego zadania analizy danych jak: wybór modelu, funkcja uczące, ocena jakości modelu, sposób zarządzania danymi. Paradygmaty uczenia maszynowego (nadzorowane, nienadzorowane, półnadzorowane, ze wzmocnieniem)	2
T-W-5	Histogramy, techniki wygładzania danych, Jądrowe metody estymacji funkcji gęstości, estymator Parzena	2
T-W-6	Metody oceny dokładności modeli (próba ucząca, walidująca, testowa, krosswalidacja, bootstap), miary oceny jakości modeli klasyfikacyjnych (dokładnosć, czułość, precyzja, F1, krzywa ROC, AUC), regresyjnych (MAE, MSE), funkcja wiarygodności, wiarygodność modelu	2
T-W-7	Podstawowe modele klasyfikacyjne: klasyfikatory liniowe (lda, regresja logistyczna, liniowy SVM), k-nn, drzewa decyzyjne; Klasyfikacja wieloklasowa.	6
T-W-8	Zadanie regresji, modele regresyjne: regresja liniowa, regresja odporna liniowa, regresje lokalne, regularyzacja modelu.	2
T-W-9	Techniki grupowania danych, kwantowanie wektorowe, metryki, miary oceny podobieństwa obiektów i skupień, metoda k-środków, metody hierarchiczne (Warda, najbliżeszego sąsiedztwa), Algorytm EM.	4
T-W-10	Zaliczenie wykładu	2
		30

Formy aktywności - ćwiczenia audytoryjne

KOD	Forma aktywności	Godziny
A-A-1	Uczestnictwo w zajęciach.	14
A-A-2	Kolokwium podsumowujące.	1
A-A-3	Praca własna studenta, przygotowanie się do kolowium.	9
A-A-4	Konsultacje	1
		25

(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - laboratoria

KOD	Forma aktywności	Godziny
A-L-1	Uczestnictwo w zajęciach	30
A-L-2	Praca własna studenta, przygotowywanie się do zajęć, przygotowywanie sprawozdań	18
A-L-3	Konsultacje	2
		50

(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KOD	Forma aktywności	Godziny
A-W-1	Uczestictwo w wykładach	30
A-W-2	Praca własna studenta, przygotowanie do zaliczenia	18
A-W-3	Konsultacje	2
		50

(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Pole	KOD	Znaczenie kodu
Zamierzone efekty uczenia się	I_1A_C14_W01	Student zna postawowe pojęcia związane z analizą i przetwarzaniem danych, zna i rozróżnia podstawowe zagadnienia, metody i narzedzia analizy danych.
Odniesienie do efektów kształcenia dla kierunku studiów	I_1A_W04	Ma wiedzę w zakresie programowania systemów komputerowych, zna podstawowe paradygmaty programowania i wiodące języki programowania.
Odniesienie do efektów kształcenia dla kierunku studiów	I_1A_W03	Posiada poszerzoną wiedzę w zakresie metod przechowywania, przetwarzania, przesyłania i analizy danych oraz modelowania systemów umożliwiającą rozwiązywanie rzeczywistych problemów obliczeniowych.
Cel przedmiotu	C-1	Zasadniczym celem przedmiotu jest zaznajomienie studenta z podstawowymi technikami analizy i przetwarzania różnego rodzaju danych. Celem dodatkowym jest zapoznanie praktyczne studenta z wybranym środowiiskiem analizy danych do wyboru rozważane mogą być środowiska analizy danych w językach Python, Matlab lub R.
Treści programowe	T-W-2	Techniki przetwarzania wstępnego (binaryzacja, normalizacje, skalowanie, braki w danych), Metody selekcji zmiennych oraz ogólne metody ekstrakcji cech z danych, transformacje ortogonalne danych: transformacja Fouriera, transformacja cosinusowa, PCA, techniki wizualizacji danych.
	T-W-1	Modele danych oraz i różne rodzaje danych, rodzaje atrybutów, skale pomiarowe, Dane numeryczne, tabelaryczne, ramki danych, dane tekstowe, obrazy, dźwięki, szeregi czasowe, Załażenia odnośnie danych, i.i.d stacjonarność.
	T-W-3	Duże małe, zbiory danych (big data), zagadnienia związane z przetwarzaniem dużych zbiorów danych (np. zarządzanie pamięcią, paradygmat map-reduce)
	T-W-8	Zadanie regresji, modele regresyjne: regresja liniowa, regresja odporna liniowa, regresje lokalne, regularyzacja modelu.
	T-W-5	Histogramy, techniki wygładzania danych, Jądrowe metody estymacji funkcji gęstości, estymator Parzena
	T-W-6	Metody oceny dokładności modeli (próba ucząca, walidująca, testowa, krosswalidacja, bootstap), miary oceny jakości modeli klasyfikacyjnych (dokładnosć, czułość, precyzja, F1, krzywa ROC, AUC), regresyjnych (MAE, MSE), funkcja wiarygodności, wiarygodność modelu
	T-W-9	Techniki grupowania danych, kwantowanie wektorowe, metryki, miary oceny podobieństwa obiektów i skupień, metoda k-środków, metody hierarchiczne (Warda, najbliżeszego sąsiedztwa), Algorytm EM.
	T-W-7	Podstawowe modele klasyfikacyjne: klasyfikatory liniowe (lda, regresja logistyczna, liniowy SVM), k-nn, drzewa decyzyjne; Klasyfikacja wieloklasowa.
	T-W-4	Zadania analizy danych (wygładzanie danych, identyfikacja rozkładu, klasyfikacja, regresja, klasteryzacja, wykrywanie zależności, wykrywanie obserwacji odstających, analiza szeregów czasowych), Komponenty typowego zadania analizy danych jak: wybór modelu, funkcja uczące, ocena jakości modelu, sposób zarządzania danymi. Paradygmaty uczenia maszynowego (nadzorowane, nienadzorowane, półnadzorowane, ze wzmocnieniem)
Metody nauczania	M-1	Wykład informacyjny i problemowy
Sposób oceny	S-2	Ocena podsumowująca: Wykład: ocena z egzaminu Ćwiczenia: wypadkowa z ocen cząstkowych Laboratoria: wypadkowa z ocen cząstkowych
Kryteria oceny	Ocena	Kryterium oceny
	2,0	Uzyskanie z zaliczenia 50% punktów lub poniżej
	3,0	Uzyskanie z zaliczenia powyżej 50% punktów
	3,5	Uzyskanie z zaliczenia 60%-70% punktów
	4,0	Uzyskanie z zaliczenia 70%-80% punktów
	4,5	Uzyskanie z zaliczenia 80%-90% punktów
	5,0	Uzyskanie z zaliczenia 90%-100% punktów

Pole	KOD	Znaczenie kodu
Zamierzone efekty uczenia się	I_1A_C14_U01	Student umie rozpoznawać typy zadań analizy i przetwarzania danych,umie wybrać odpowiednie metody i stosować wybrane narzędzia przy rozwiązywaniu zagadnień związanych z analizą i przetwarzaniem danych.
Odniesienie do efektów kształcenia dla kierunku studiów	I_1A_U01	Potrafi wykrywać związki i zależności w procesach zachodzących w systemach rzeczywistych i na tej podstawie tworzyć modele komputerowe i przeprowadzać ich symulacje.
	I_1A_U03	Potrafi pozyskiwać, przesyłać, przetwarzać dane, podsumowywać wyniki eksperymentów empirycznych, dokonywać interpretacji uzyskanych wyników i formułować wynikające z nich wnioski.
	I_1A_U05	Potrafi rozwiązywać zadania i problemy informatyczne z wykorzystaniem metod matematyki obliczeniowej w szczególności stosując techniki analityczne lub symulacyjne.
	I_1A_U06	Potrafi rozwiązywać podstawowe problemy algorytmiczne z uwzględnieniem ich złożoności posługując się kluczowymi językami programowania.
Cel przedmiotu	C-1	Zasadniczym celem przedmiotu jest zaznajomienie studenta z podstawowymi technikami analizy i przetwarzania różnego rodzaju danych. Celem dodatkowym jest zapoznanie praktyczne studenta z wybranym środowiiskiem analizy danych do wyboru rozważane mogą być środowiska analizy danych w językach Python, Matlab lub R.
Treści programowe	T-A-1	Przypomnienie wiadomośći z rachunku prewdopodobieństwa: niezależnośc, tw. Bayesa wzór na prawdopodobieństow całkowite.
	T-A-3	Techniki przetwarzania wstępnego, transformacje ortogonalne (PCA, dyskretne przekształcenie Foruriera), zadania
	T-A-4	Zadanie klasyfikacji, miary jakości klasyfikacji, wyznaczanie krzywej ROC, zadania ilustrujące związki pomiędzy miarami jakości, klasyfikacja bezregułowa
	T-A-2	Elementarne pojęcia teorii informacji: entorpia, entropia krzyżowa, informacja wzajemna, przyrost informacji, indeks Giniego, nierówność Gibbsa, własności związki z selekcją atrybutów oraz dyskretyzacją.
	T-A-5	Zadanie klasteryzacji, metryki geometryczne oraz miary podobieństwa pomiędzy skupieniami, grupowanie hierarchiczne, algorytm k-środków, zadania powiązane z analizą i działaniem algorytmów grupujących.
	T-L-1	Wprowadzenie do środowiska obliczeniowego (Python (numpy, scipy, matplotlib, pandas, sklearn), Matlab (Statistical Toolbox), lub R) oraz wczytywanie danych w róznych formatach.
	T-L-10	Gurpowanie hierarchiczne, dendorogram porównanie metod grupowania danych. Dobór liczby skupień, miary AIC oraz BIC.
	T-L-2	Metody preprocesingu normalizacja, binaryzacja, atrybutów, selekcja zmiennych
	T-L-6	Przegląd metod klasyfikacyjnych oraz ocena jakiości i czasu działania wybranych metod.
	T-L-3	Transformacje ortogonalne oraz analiza składowych głównych, zastosowanie do ekstrakcji cech oraz wizualizacji danych
	T-L-5	Medody klasyfikacji implementacja wybranej metody (liniowy SVM, regresja logistyczna drzewo decyzyjne lub k-nn) oraz porównaie własnej implementacji z metodami wbudowanym w pakiet scikit-klearn.
	T-L-7	Klasyfikacja wielkolasowa różne strategie: 1:1 1:pozostali,
	T-L-9	Grupowanie danych implementacja algorytmu k-środków. Analiza działania algorytmu, zastosowanie do kwantyzacji wektorowej.
	T-L-8	Regresja zwykłą i odporna zagadnienie selekcji zmiennych w modelu liniowym.
	T-L-4	Wygładzanie danych, interpolacja, jądrowe estymatory funkcji gęstości.
Metody nauczania	M-2	Ćwiczenia przedmiotowe
Sposób oceny	S-1	Ocena formująca: Ćwiczenia: ocena z kolokwium podsumowującego, ocena pracy na zajęciach Laboratorium: oceny ze sprawozdań, ocena pracy na zajęciach
Sposób oceny	S-2	Ocena podsumowująca: Wykład: ocena z egzaminu Ćwiczenia: wypadkowa z ocen cząstkowych Laboratoria: wypadkowa z ocen cząstkowych
Kryteria oceny	Ocena	Kryterium oceny
	2,0	Uzyskanie z zaliczenia minie lub rowno 50% punktów
	3,0	Uzyskanie z zaliczenia powyżej 50% punktów
	3,5	Uzyskanie z zaliczenia 60%-70% punktów
	4,0	Uzyskanie z zaliczenia 70%-80% punktów
	4,5	Uzyskanie z zaliczenia 80%-90% punktów
	5,0	Uzyskanie z zaliczenia 90%-100% punktów