Data Mining Menggunakan Weka Part III

Format Data dalam WEKA

Misalnya diketahui sekumpulan data dan ingin dibangun sebuah decision tree dari data tersebut, maka data tersebut harus disimpan dalam format ‘flat’, ARFF karena WEKA perlu mengetahui beberapa informasi tentang tiap atribut yang tidak dapat disimpulkan secara otomatis dari nilai-nilainya.
File ARFF (Attribute-Relation File Format) adalah sebuah file teks ASCII yang berisi daftar instances dalam sekumpulan atribut. File ARFF dikembangkan oleh Machine Learning Project di Department of Computer Science of The University of Waikato untuk digunakan dalam perangkat lunak WEKA.

Baca Juga:
Data Mining Menggunakan Weka Part I
Data Mining Menggunakan Weka Part II

Pengubahan format data ini dapat dilakukan dengan mudah. Misalkan data awal dalam format .xls (lihat gambar 2a), buka data tersebut dari Microsoft Excel dan simpan sebagai .csv. Selanjutnya, buka file tersebut dari Microsoft Word, notepad, atau editor teks lainnya dan data sudah berubah dalam format comma-separated. Lalu sesuaikan data tersebut dengan menambahkan informasi awal (gambar 2b). Hasilnya, data tersebut sudah dapat digunakan sebagai inputan dalam WEKA.
Pastikan bahwa data dalam format .arff tersebut sudah memenuhi:

  1. Data dipisahkan dengan koma, dengan kelas sebagai atribut terakhir.
  2. Bagian header diawali dengan @RELATION.
  3. Tiap atribut ditandai dengan @ATTRIBUTE. Tipe-tipe data dalam WEKA: numerik(REAL atau INTEGER), nominal, String, dan Date.
  4. Bagian data diawali dengan @DATA

Baca Juga  Download Web Landing Page Responsive

Tinggalkan Balasan