Data Mining Menggunakan Weka Part II

WEKA GUI Chooser

WEKA GUI Chooser adalah tampilan utama yang akan dilihat user pada saat pertama kali membuka perangkat lunak WEKA. Tampilan utama tersebut memberikan 4 pilihan GUI WEKA, yaitu Simple CLI, Experimenter, Explorer, dan Knowledge Flow.

GUI Simple CLI merupakan GUI yang memungkinkan user mengetikkan perintah-perintah melalui command line menurut standar penggunaan classifiers maupun filters. Misalnya mengeset percobaan dengan file batch.

Contoh penggunaan CLI adalah dengan mengetikkan perintah:

  • java weka.classifiers.j48.J48 –t weather.arff

Perintah ini memanggil JVM (Java Virtual Machine) dan menginstruksikannya untuk mengeksekusi algoritma J48 dari J48 package.

  • java  weka.filters.unsupervised.attribute.Remove -V -R 1,4 -i trainingFile.arff -o myTrainingFile.arff

Filter tersebut akan menghapus semua atribut kecuali yang pertama dan keempat dari sebuah dataset yang disimpan pada file trainingFile.arff dan menyimpan hasilnya di myTrainingFile.arff

  • java  weka.classifiers.trees.J48 -t myTrainingFile.arff -T myTestFile.arff -U -p 1 > Results.arff 

Dari perintah ini, decision tree J48 diterapkan pada file myTrainingFile.arff. File yang diuji ditunjukkan dengan option -T. Hasilnya redirected dari layar ke file Results.arff dan options -U dan -p menentukan bentuk output tertentu.
Beberapa pilihan skema pembelajaran yang dapat diterapkan pada WEKA antara lain:

Option Fungsi
-t <training file> Menentukan file training
-T <test set> Menentukan file pengujian. Jika tidak ada, dilakukan cross-validation pada data training.
-c <class index> Menentukan 
-x <number of folds> Menentukan jumlah folds untuk cross-validation
-s <random number seed> Menentukan jumlah seed untuk cross-validation
-m <cost matrix file> Menentukan file yang mengandung matriks biaya
-v Output tanpa statistik untuk data training
-l <input file> Menentukan file input untuk model
-d <output file> Menentukan file output untuk model
-o Hanya mengeluarkan statistik, tanpa classifier
-I Output statistik information retrieval untuk masalah dengan 2 class
-k Output statistik information-theoretic
-p Hanya mengeluarkan prediksi untuk instances pengujian
-r Hanya mengeluarkan distribusi batas kumulatif

Baca Juga  Cara Bisnis Online (WAZZUB)

  • GUI Explorer adalah GUI WEKA yang paling mudah digunakan dan menyediakan semua fitur WEKA dalam bentuk tombol dan tampilan visualisasi yang menarik dan lengkap. Preprocess, klasifikasi, asosiasi, clustering, pemilihan atribut, dan visualisasi dapat dilakukan dengan mudah dan menyenangkan di sini. Antarmuka ini akan dijelaskan lebih lanjut pada Modul 2.

Baca Juga: Data Mining Menggunakan Weka Part I

  • GUI Experimenter memudahkan perbandingan performansi skema-skema pembelajaran yang berbeda. Experimenter biasanya digunakan untuk klasifikasi dan regresi. Hasil dari perbandingan performansi dapat dituliskan dalam file atau basis data. Pilihan evaluasi yang tersedia dalam WEKA adalah cross-validation, learning curve, hold-out. User juga dapat melakukan iterasi menurut beberapa setting parameter yang berbeda.

Tab Setup yang muncul saat user membuka Experimenter memungkinkan user memilih dan mengkonfigurasi eksperimen yang dilakukan. Setelah menyimpan definisi eksperimen yang dilakukan, user dapat memulai eksperimen dari tab Run dan meng-klik tombol Start. Area di bawahnya akan menunjukkan proses yang sedang dilakukan. Hasilnya disimpan dalam format CSV dan dapat dibuka dalam bentuk spreadsheet.

Tab ketiga. Analize, dapat digunakan untuk menganalisa hasil ekperimen yang dikirim ke WEKA. Jumlah baris hasil ditunjukkan pada panel Source. Hasilnya dapat di-load dalam format .ARFF maupun dari basis data.
Antarmuka ini memungkinkan user melakukan lebih dari 1 eksperimen sekaligus, mungkin menerapkan beberapa teknik berbeda pada sebuah dataset, atau teknik yang sama dengan parameter-parameter yang berbeda.

  • GUI Knowledge Flow merupakan GUI baru dalam WEKA yang merupakan antarmuka Java-Beans-based untuk melakukan setting dan menjalankan percobaan-percobaan machine learning. 

Dalam GUI Experimenter ini, beberapa sumber data, classifier, dll dapat dihubungkan secara grafis. User juga dapat menggambarkan aliran data melalui komponen-komponen, misalnya:
“data source” -> “filter” -> “classifier” -> “evaluator”

Baca Juga  Rosenkreuzstilette Freudenstachel Full Patch Eng

KnowledgeFlow menyediakan alternatif lain dari Explorer sebagai sebuah front end grafis untuk algoritma-algoritma inti WEKA. Karena masih dalam pengembangan, beberapa fungsionalitas dalam Explorer belum tersedia dalam KnowledgeFlow.

KnowledgeFlow menampilkan ‘aliran data’ dalam WEKA. User dapat memilih komponen-komponen WEKA dari toolbar, meletakkannya pada area yang tersedia dan menghubungkannya untuk membentuk ‘aliran pengetahuan’ pemrosesan dan analisa data.

 KnowledgeFlow dapat menangani data secara incremental maupun dalam batches (Explorer hanya menangani data batch). Tentunya pembelajaran dari data secara incremental  memerlukan sebuah classifier yang dapat diupdate instance per instance. Dalam WEKA tersedia 5 classifiers yang dapat menangani data secara incremental: NaiveBayesUpdateable, IB1, IBk, LWR (Locally Weighted Regression). Tersedia pula sebuah metadata classifier – RacedIncrementalLogitBoost – yang dapat digunakan dari berbagai basis regresi untuk data class diskrit secara incremental.

Tinggalkan Balasan