Memahami Jenis Jenis Tesaurus
Friday, June 16, 2017
Memahami Jenis Jenis Tesaurus di Indonesia
Mencari sebuah padanan
sebuah kata merupakan salah satu kemampuan tesaurus. Sebenarnya, tesaurus
berasal dari bahasa Yunani, thesauros
yang secara bahasa artinya harta beda, gudang, atau kekayaan. Pada umumnya
tesaurus akan berbeda-beda ditinjau dari fungsinya. Oleh karena itu jenis jenis tesaurus akan sangat
beragam berdasarkan fungsinya.
Tesaurus sering digunakan
pada proses temu kembali informasi, misalnya pencarian kata kunci berdasarkan
dokumen atau arsip yang ditemukan. Secara umum, tesaurus dapat diartikan
sebagai kamus kata-kata dan atau ungkapan yang disortir berdasarkan padanan
maknanya. Pernyataan itu kemudian didukung oleh pengertian dari Kamus Besar
Bahasa Indonesia yang menyatakan bahwa tesaurus merupakan buku referensi
tentang informasi yang berisi berbagai perangkat konsep atau istilah dalam
berbagai disiplin ilmu kehidupan dan atau pengetahuan.
Berikut penjelasan lebih detail terkait dengan tesaurus.
Berikut penjelasan lebih detail terkait dengan tesaurus.
Tujuan Tesaurus
Jenis jenis tesaurus mempunyai tujuan yang hampir sama. Berdasarkan
Encyclopedia of Library and Information Science Vol 30. Penyusunan tesaurus
ditujukan untuk memenuhi hal berikut.
Memberi Gambaran Ilmu Pengetahuan Tertentu
Salah satu tujuan
tesaurus yaitu memberikan persepesi terkait dengan bidang ilmu pengetahuan
tertentu. Disamping itu, tesaurus juga bisa memberikan pengertian atau konsep
yang berkaitan yang biasanya digunakan para peneliti untuk memahami struktur
dari bidang ilmu pengetahuan tersebut.
Persediaan Kosa kata Standar
Dengan tesaurus kosa kata
standar yang digunakan untuk subyek terntentu, peneliti akan sangat terbantu
dalam rangka penyimpanan dan atau proses temu kembali informasi.
Persediaan Sistem Referensi
Persediaan sistem
referensi yang dimaksud di sini adalah sebuah rujukan antara istilah yang telah
ditinjau ulang dengan pasti mempunyai satu bentuk padanan kata yang digunakan
untuk mengindeks dokumen atau arsip.
Jenis jenis Tesaurus Berdasarkan Algoritmanya
Algoritma Tokenizing
Algoritma Tokenizing
merupakan algoritma yang dibuat penulisnya secara mandiri. Jika algoritma ini
diterapkan, sistem akan membuang istilah yang termasuk dalam stoplist dan
melakukan stemming. Pada jenis algoritma tokenizing ini, semua karakter pemisah
dianggap sebagai pemisah penuh. Biasanya, alasan tesaurus menggunakan algoritma
seperti ini dikarenakan beberapa token yang tidak sesuai untuk diterapkan
sebagai indeks. Hal ini disebabkan token tersebut menimbulkan inkonsistensi
dengan token lain yang dihasilkan.
Algoritma Stemming
Jenis algoritma Stemming
termasuk salah satu dari jenis jenis
tesaurus berdasarkan algoritma yang umum digunakan. Prosesnya diawali
dengan pembacaan tiap kata dari sampel. Hal ini akan menimbulkan input
algoritmanya adalah sebuah kata. Langkah selanjutnya adalah pengecekan semua
kemungkinan bentuk kata. Kemudian, pada setiap pemotongan kata langsung diikuti
dengan langkah pencarian di kamus.pencarian tersebut bertujuan untuk melihat
apakah bentuk tersebut sudah dalam bentuk dasar. Jika masih terdapat imbuhan,
maka akan dilakukan pemotongan kembali sampai menjadi bentuk dasar.
Algoritma Pencarian Struktur Topik
Jenis algoritma ini
menggunakan perulangan sebuah term
sebagai penunjuk keterkaitan secara leksikal. Hal ini diselesaikan dengan cara membandingkan
pasangan blok teks berurutan, kemudian dihitung besar kemiripannya secara
leksikal. Pada jenis ketiga dari jenis
jenis tesaurus berdasarkan algoritmanya ini, dapat dianggap bahwa semakin
besar tingkat kemiripan dua blok teks, maka semakin besar bahwa topiknya
berkelanjutan. Hal ini juga berlaku sebaliknya. Jika tingkat kemiripan antar
blok sangat kecil, maka hal tersebut mengindikasikan perubahan alur topik
sebelumnya.
Algoritma Identifikasi batas Segmen
Dalam jenis algoritma
tesaurus ini, harus ditentukan ke dalam berapa kelompok suatu dokumen
tebagi-bagi. Terlebih lagi mengingat setiap paragraf pasti mempunyai potensi
untuk tergolong dalam satu segmen. Suatu batas blok bisa dipilih sebagai batas
segmen jika nilai kedalamannya melebihi rata-rata alfa/2.
Contoh Tesaurus
Tesaurus Roget
Tesaurus yang pertama
kali dibuat. Tesaurus ini dikenalkan oleh Peter Mark Roget pada tahun 1852.
Tesaurusnya berjudul Roget’s Thesaurus of English Words and Phrases. Tesaurus
Roget berisi kata-kata dan frasa dalam bahasa Inggris yang tersusun berdasarkan
sinonim dan makna katanya.
Tesaurus Bahasa Indonesia
Tidak hanya bahasa Inggris,
Bahasa Indonesia pun mempunyai tesaurus, salah satunya yang populer adalah
karya Eko Endarmoko yang diterbitkan oleh PT Gramedia Pustaka Utama. Fungsinya
pun sama, yait menyediakan perbendaharaan kata yang memiliki padanan makna.
Oleh karenanya, padanan kata tersebut sangat membantu, terlebih dengan adanya
penyortiran berdasarkan konteks penggunaan katanya.
Itulah sekilas tentang tesaurus dan jenis jenis tesaurus. Tesaurus akan sangat berguna terlebih untuk menambah perbendaharaan kata untuk sebuah ilmu pengetahuan tertentu. Karenanyalah, mari kenali tesaurus lebih dalam.
Itulah sekilas tentang tesaurus dan jenis jenis tesaurus. Tesaurus akan sangat berguna terlebih untuk menambah perbendaharaan kata untuk sebuah ilmu pengetahuan tertentu. Karenanyalah, mari kenali tesaurus lebih dalam.
Sumber:
https://farikhsaba.wordpress.com
http://jejeffri.blogspot.sg
http://kbbi.web.id
http://www.hirupmotekar.com
http://www.hirupmotekar.com
http://www.hirupmotekar.com