Berawal dari pemikiran yang sederhana tentang kuliah, apa yang harus saya kerjakan di skripsi nanti :) . Akhirnya terjawab sudah bahwa pilihan kedua dari 2 judul yang saya ajukan ke pihak akademik  yang saya ambil. Text summarization atau Peringkasan teks, untuk peringkasan ini akan meringkas dokumen teks dengan bahasa Indonesia. Sebenarnya apa itu peringkasan teks ? Peringkasan teks adalah proses mengambil intisari dari suatu dokumen teks. Peringkasan teks banyak jenis dan metodenya. Pada penelitian ini, saya akan menerapkan jenis ekstraksi dari dua jenis yang ada yaitu ekstraksi dan abstraksi.

Peringkasan teks dengan metode ektraksi hanya mereduksi dari beberapa kalimat pada suatu dokumen. Pemilihan kalimat yang akan diambil dapat dihitung dengan beberapa metode. Perhitungan skor fitur dari penelitian Abdul Fateh menggunakan Algoritme Genetika dan Regresi Linear. Penelitian saya kali ini akan mencoba perhitungan skor tiap fitur menggunakan metode Naive Bayes. Naive bayes akan menghasilkan nilai kemungkinan parameter yang digunakan saat pengujian. Penelitian saya pun mencari fitur terpenting dari beberapa fitur yang digunakan, pemilihan fitur ini menggunakan Decision tree C4.5.

Sampai 11 Maret 2013 penelitian text summarization ini sudah mendapatkan hasil yang bagus dengan menggunakan Naive Bayes dibanding dengan Algoritma Genetika yang dilakukan oleh Aristoteles (Magister Ilmu Komputer IPB tahun 2011) dan Regresi Linear oleh Mery Merlina (Sarjana Ilmu Komputer IPB 2012). Akurasi sistem peringkasan teks saya dengan menggunakan 10 fitur berhasil mencapai akurasi 56%.