Politechnika Rzeszowska im. Ignacego Łukasiewicza - Centralny System Uwierzytelniania
Strona główna

Eksploracja danych

Informacje ogólne

Kod przedmiotu: EF/AA-ZU>ED
Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Eksploracja danych
Jednostka: Katedra Informatyki i Automatyki
Grupy: Przedmioty 1 sem. - informatyka-inżynieria systemów informatycznych nst.II-go st.
Punkty ECTS i inne: 4.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: polski
Pełny opis:

W ramach przedmiotu omawiane są pojęcia, algorytmy, techniki oraz systemy wykorzystujące hurtownie danych oraz metody eksploracji danych, w tym: (1) wstępna obróbka danych, (2) projektowanie i implementacja systemów hurtowni danych i aplikacji OLAP, (3) technologia kostek danych, (4) odkrywanie częstych wzorców i asocjacji, (5) klasyfikacja oraz (6) analiza skupień (klastrów). Student powinien postrzegać eksplorację danych jako proces obejmujący fazy: rozpoznania danych, wstępnego przetwarzania, modelowania, oceny uzyskanych wzorców oraz wdrożenia wyników eksploracji.

Treści kształcenia

- Wprowadzenie do odkrywania wiedzy z danych.

- Problem wstępnego przetwarzania i metody czyszczenia danych

- Integracja, transformacja i redukcja danych

- Pojęcie i architektura hurtowni danych

- Wielowymiarowy model danych. Operacje OLAP

- Podstawowe pojęcia z zakresu częstych wzorców i analizy asocjacji

- Metody odkrywania częstych wzorców

- Przykłady zastosowań reguł asocjacyjnych

- Kolokwium 1

- Podstawowe pojęcia oraz ocena modeli klasyfikacji

- Indukcja drzew i reguł decyzyjnych

- Podstawowe pojęcia z zakresu klasyfikacji nieliniowej

- Pojęcie klasteryzacji i typy danych w kontekście wyznaczania odrębności

- Wybrane metody klasteryzacji

- Kolokwium 2

- 1) Nauka użytkowania systemów eksploracji danych przez pracę z wybranym oprogramowaniem wspomagającym eksplorację danych zarządzanie hurtownią danych, np.: MS SQLServer, Oracle 10g (część data mining), IBM Intelligent-Miner oraz narzędzia do analizy statystycznej.

2) Realizacja wybranych funkcji eksploracji danych, jak: generowanie asocjacji, klasyfikacja oraz klasteryzacja. Używa się przy tym wybranych systemów eksploracji udostępnianych na zasadach niekomercyjnych jak Weka.

3) Wykorzystanie przykładowych, powszechnie dostępnych, zbiorów danych do implementacji i testowania funkcji eksploracji danych.

Literatura:

Literatura wykorzystywana podczas zajęć wykładowych

D.T. Larose - Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych - Wydawnictwo Naukowe PWN. - 2006

J. Han, M. Kamber, J. Pei - Data Mining: Concepts and Techniques, 3rd ed. - Morgan Kaufman, 2011 (można wykorzystać także wczesniejsze wydania). -

Literatura wykorzystywana podczas zajęć ćwiczeniowych/laboratoryjnych/innych

D.T. Larose - Odkrywanie wiedzy z danych. Wprowadzenie do eksploracji danych - Wydawnictwo Naukowe PWN. - 2006

J. Han, M. Kamber, J. Pei - Data Mining: Concepts and Techniques 3rd ed. - Morgan Kaufman, 2011 (można wykorzystać także poprzednie wydania). -

Literatura uzupełniająca

D. Pyle - Data Preparation for Data Mining - Morgan Kaufmann. - 1999

C. Todman - Projektowanie hurtowni danych - Wydawnictwa Naukowo-Techniczne. - 2003

D. Hand, H. Mannila, P. Smyth - Eksploracja danych - Wydawnictwa Naukowo-Techniczne. - 2005

D.T. Larose - Metody i modele eksploracji danych - Wydawnictwo Naukowe PWN. - 2012

Publikacje naukowe

B. Jędrzejec; K. Świder - Automatically conducted learning from textually expressed vacationers’ opinions - . - 2018

Efekty uczenia się:

Student, który zaliczył modułFormy zajęć/metody dydaktyczne prowadzące do osiągnięcia danego efektu kształceniaSposoby weryfikacji każdego z wymienionych efektów kształcenia
Rozumie potrzebę wstępnego przetwarzania danych a także ma podstawową wiedzę z zakresu: technik oczyszczania danych, integracji i transformacji danych oraz redukcji danych.wykład, laboratoriumkolokwium, egzamin końcowy
Ma podstawową wiedzę na temat hurtowni danych i związanych z nimi modeli wielowymiarowych oraz jest w stanie przeprowadzać proste analizy OLAP na kostce danych.wykład, laboratorium kolokwium, egzamin końcowy
Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy asocjacji, korelacji a także analizy częstych wzorców.wykład, laboratorium kolokwium, egzamin końcowy
Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy metodą klasyfikacji, w tym indukcji drzew decyzyjnych.wykład, laboratorium kolokwium, egzamin końcowy
Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy metodą klasteryzacji, w tym klasteryzacji metodą k-średnich.wykład, laboratorium kolokwium, egzamin końcowy

Metody i kryteria oceniania:

na ocenę 3na ocenę 4na ocenę 5
Rozumie potrzebę wstępnego przetwarzania danych a także ma podstawową wiedzę z zakresu: technik oczyszczania danych, integracji i transformacji danych oraz redukcji danych.nie tylko osiągnął poziom wiedzy i umiejętności wymagany na ocenę 3, ale również ma rozszerzoną wiedzę z zakresu: technik oczyszczania danych, integracji i transformacji danych oraz redukcji danych.nie tylko osiągnął poziom wiedzy i umiejętności wymagany na ocenę 4, ale również wykazuje się biegłością i kreatywnością w zakresie: technik oczyszczania danych, integracji i transformacji danych oraz redukcji danych.
Ma podstawową wiedzę na temat hurtowni danych i związanych z nimi modeli wielowymiarowych oraz jest w stanie przeprowadzać proste analizy OLAP na kostce danych.nie tylko osiągnął poziom wiedzy i umiejętności wymagany na ocenę 3, ale również ma rozszerzoną wiedzę na temat hurtowni danych i związanych z nimi modeli wielowymiarowych oraz jest w stanie przeprowadzać proste analizy OLAP na kostce danych.nie tylko osiągnął poziom wiedzy i umiejętności wymagany na ocenę 4, ale również wykazuje się biegłością i kreatywnością w zakresie hurtowni danych i związanych z nimi modeli wielowymiarowych oraz jest w stanie przeprowadzać proste analizy OLAP na kostce danych.
Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy asocjacji, korelacji a także analizy częstych wzorców.nie tylko osiągnął poziom wiedzy i umiejętności wymagany na ocenę 3, ale również ma rozszerzoną wiedzę na temat pojęć i technik z zakresu analizy asocjacji, korelacji a także analizy częstych wzorców.nie tylko osiągnął poziom wiedzy i umiejętności wymagany na ocenę 4, ale również wykazuje się biegłością i kreatywnością w zakresie pojęć i technik z zakresu analizy asocjacji, korelacji a także analizy częstych wzorców.
Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy metodą klasyfikacji, w tym indukcji drzew decyzyjnych.nie tylko osiągnął poziom wiedzy i umiejętności wymagany na ocenę 3, ale również ma rozszerzoną wiedzę na temat pojęć i technik z zakresu analizy metodą klasyfikacji, w tym indukcji drzew decyzyjnych.nie tylko osiągnął poziom wiedzy i umiejętności wymagany na ocenę 4, ale również wykazuje się biegłością i kreatywnością w zakresie pojęć i technik z zakresu analizy metodą klasyfikacji, w tym indukcji drzew decyzyjnych.
Ma podstawową wiedzę na temat pojęć i technik z zakresu analizy metodą klasteryzacji, w tym klasteryzacji metodą k-średnich.nie tylko osiągnął poziom wiedzy i umiejętności wymagany na ocenę 3, ale również ma rozszerzoną wiedzę na temat pojęć i technik z zakresu analizy metodą klasteryzacji, w tym klasteryzacji metodą k-średnich.nie tylko osiągnął poziom wiedzy i umiejętności wymagany na ocenę 4, ale również wykazuje się biegłością i kreatywnością w zakresie pojęć i technik z zakresu analizy metodą klasteryzacji, w tym klasteryzacji metodą k-średnich.

Zajęcia w cyklu "Semestr zimowy 2019/20" (zakończony)

Okres: 2019-10-01 - 2020-01-31
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 15 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Krzysztof Świder
Prowadzący grup: Bartosz Jędrzejec, Mariusz Oszust, Krzysztof Świder
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie

Zajęcia w cyklu "Semestr zimowy 2020/21" (zakończony)

Okres: 2020-10-01 - 2021-02-01
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 15 godzin więcej informacji
Wykład, 15 godzin więcej informacji
Koordynatorzy: Krzysztof Świder
Prowadzący grup: Bartosz Jędrzejec, Mariusz Oszust, Krzysztof Świder
Lista studentów: (nie masz dostępu)
Zaliczenie: Zaliczenie
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Politechnika Rzeszowska im. Ignacego Łukasiewicza.
al. Powstańców Warszawy 12
35-959 Rzeszów
tel: +48 17 865 11 00 https://prz.edu.pl
kontakt deklaracja dostępności USOSweb 7.0.1.0-4 (2024-03-12)