Wprowadzenie do Data Miningu.pdf

(1556 KB) Pobierz
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
Data Mining
- wprowadzenie
855067125.005.png
Agenda
Data Mining
Proces odkrywania wiedzy
Działy DM
Data Mining w SQL Server
855067125.006.png
Toniemy w danych
Z każdym dniem przybywa
danych, co powoduje, że są
magazynowane i przechowy-
wane w olbrzymich ilościach.
Nasze możliwości analizowania
i rozumienia tak dużych wolu-
menów danych są dużo mniejsze
od możliwości ich gromadzenia
i przechowywania.
Zaczynamy „tonąć w danych, ale brakuje nam wiedzy, która tkwi w
nagromadzonych danych. Wiele firm, przedsiębiorstw, instytucji
administracji publicznej, ośrodków naukowych, stanęło przed
problemem, w jaki sposób efektywnie i racjonalnie wykorzystać
nagromadzoną w danych wiedzę dla celów wspomagania swojej
działalności biznesowej. To okazało się być źródłem rozwoju nowej
technologii, którą nazwano technologią eksploracji danych, która
potrafiłaby wydobyć wiedzę ze zgromadzonych danych.
3
855067125.007.png 855067125.008.png 855067125.001.png 855067125.002.png
Skąd biorą się takie olbrzymie ilości danych?
Codziennie w bankach, ubezpieczalniach, firmach,
szpitalach, sieciach handlowych (nawet niewielkie
supermarkety rejestrują codziennie sprzedaż tysięcy
artykułów), wykonuje się tysiące operacji handlowych
(transakcje bankowe), raportów (sprzedaży) i opisów
(np. opis zabiegu medycznego).
Innym dostawcą danych są np. ośrodki naukowe, gdzie
generuje się ogromne ilości danych eksperymentalnych.
W ostatnich latach rozwój sieci Web zaowocował
powstaniem miliardów stron internetowych, rozwojem e-
handlu i rozprzestrzenianiem się olbrzymich ilości
informacji w postaci tekstowej
4
855067125.003.png
Skąd się biorą dane?
Firma telekomunikacyjna AT&T obsługuje miliardy
połączeń dziennie. Okazało się, że danych jest tyle, że
nie można ich wszystkich zapamiętać – analiza tych
danych jest wykonywana “on the fly” („w locie”) (tzw.
strumienie danych).
System satelitarnej obserwacji EOS generuje w każdej
godzinie dziesiątki gigabajtów danych pochodzących ze
zdjęć satelitarnych.
Koncern Mobil Oil rozwija magazyn danych pozwalający
na przechowywanie ponad 100 terabajtów danych o
wydobyciu ropy naftowej.
5
855067125.004.png
Zgłoś jeśli naruszono regulamin