Jumat, 16 Oktober 2009

adalah sebuah alat yang digunakan dalam menjalankan tahap-tahap yang terdapat di dalam metodologi (SDLC, OOAD). UML digunakan untuk melakukan pemodel

BAB I
PENGANTAR DATA MINING:
MENAMBANG PERMATA PENGETAHUAN DI GUNUNG DATA

Abstrak :
Data Mining (DM) adalah salah satu bidang yang berkembang pesat
karena besarnya kebutuhan akan nilai tambah dari database skala besar
yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi
informasi. Definisi umum dari DM itu sendiri adalah serangkaian proses
untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak
diketahui secara manual dari suatu kumpulan data. Dalam review ini,
penulis mencoba merangkum perkembangan terakhir dari teknik-teknik
DM beserta implikasinya di dunia bisnis.
Kata Kunci:
data mining, data warehouse, association rule mining, classification,
clustering
1.1 Pendahuluan
Perkembangan data mining(DM) yang pesat tidak dapat lepas dari
perkembangan teknologi informasi yang memungkinkan data dalam jumlah besar
terakumulasi. Sebagai contoh, toko swalayan merekam setiap penjualan barang
dengan memakai alat POS(point of sales). Database data penjualan tsb. bisa
mencapai beberapa GB setiap harinya untuk sebuah jaringan toko swalayan
berskala nasional. Perkembangan internet juga punya andil cukup besar dalam
akumulasi data.
Tetapi pertumbuhan yang pesat dari akumulasi data itu telah menciptakan
kondisi yang sering disebut sebagai “rich of data but poor of information” karena
data yang terkumpul itu tidak dapat digunakan untuk aplikasi yang berguna. Tidak
jarang kumpulan data itu dibiarkan begitu saja seakan-akan “kuburan data” (data
tombs). DM adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara
manual. Patut diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan
sedikit barang berharga dari sejumlah besar material dasar. Karena itu DM
sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan
buatan (artificial intelligent), machine learning, statistik dan database. Beberapa
teknik yang sering disebut-sebut dalam literatur DM antara lain : clustering,
classification, association rule mining, neural network, genetic algorithm dan lain-
lain.
Yang membedakan persepsi terhadap DM adalah perkembangan teknik-teknik DM untuk aplikasi pada database skala besar. Sebelum populernya DM
teknik-teknik tersebut hanya dapat dipakai untuk data skala kecil saja.
Di sini, penulis mencoba untuk memberi gambaran sekilas atas
perkembangan terakhir teknik-teknik DM sambil memberikan juga ilustras
pemakaian di dunia bisnis. Penulis juga menyajikan pengertian konfiguras
penyimpanan data yang memudahkan pemakai untuk melakukan DM yang umum
disebut dengan data warehouse.

Tidak ada komentar:

Posting Komentar