-->

Memahami Jenis Jenis Tesaurus

Memahami Jenis Jenis Tesaurus di Indonesia

Mencari sebuah padanan sebuah kata merupakan salah satu kemampuan tesaurus. Sebenarnya, tesaurus berasal dari bahasa Yunani, thesauros yang secara bahasa artinya harta beda, gudang, atau kekayaan. Pada umumnya tesaurus akan berbeda-beda ditinjau dari fungsinya. Oleh karena itu jenis jenis tesaurus akan sangat beragam berdasarkan fungsinya.


Tesaurus sering digunakan pada proses temu kembali informasi, misalnya pencarian kata kunci berdasarkan dokumen atau arsip yang ditemukan. Secara umum, tesaurus dapat diartikan sebagai kamus kata-kata dan atau ungkapan yang disortir berdasarkan padanan maknanya. Pernyataan itu kemudian didukung oleh pengertian dari Kamus Besar Bahasa Indonesia yang menyatakan bahwa tesaurus merupakan buku referensi tentang informasi yang berisi berbagai perangkat konsep atau istilah dalam berbagai disiplin ilmu kehidupan dan atau pengetahuan.
Berikut penjelasan lebih detail terkait dengan tesaurus.

Tujuan Tesaurus

Jenis jenis tesaurus mempunyai tujuan yang hampir sama. Berdasarkan Encyclopedia of Library and Information Science Vol 30. Penyusunan tesaurus ditujukan untuk memenuhi hal berikut.
Memberi Gambaran Ilmu Pengetahuan Tertentu
Salah satu tujuan tesaurus yaitu memberikan persepesi terkait dengan bidang ilmu pengetahuan tertentu. Disamping itu, tesaurus juga bisa memberikan pengertian atau konsep yang berkaitan yang biasanya digunakan para peneliti untuk memahami struktur dari bidang ilmu pengetahuan tersebut.
Persediaan Kosa kata Standar
Dengan tesaurus kosa kata standar yang digunakan untuk subyek terntentu, peneliti akan sangat terbantu dalam rangka penyimpanan dan atau proses temu kembali informasi.
Persediaan Sistem Referensi
Persediaan sistem referensi yang dimaksud di sini adalah sebuah rujukan antara istilah yang telah ditinjau ulang dengan pasti mempunyai satu bentuk padanan kata yang digunakan untuk mengindeks dokumen atau arsip.

Jenis jenis Tesaurus Berdasarkan Algoritmanya

Algoritma Tokenizing
Algoritma Tokenizing merupakan algoritma yang dibuat penulisnya secara mandiri. Jika algoritma ini diterapkan, sistem akan membuang istilah yang termasuk dalam stoplist dan melakukan stemming. Pada jenis algoritma tokenizing ini, semua karakter pemisah dianggap sebagai pemisah penuh. Biasanya, alasan tesaurus menggunakan algoritma seperti ini dikarenakan beberapa token yang tidak sesuai untuk diterapkan sebagai indeks. Hal ini disebabkan token tersebut menimbulkan inkonsistensi dengan token lain yang dihasilkan.
Algoritma Stemming
Jenis algoritma Stemming termasuk salah satu dari jenis jenis tesaurus berdasarkan algoritma yang umum digunakan. Prosesnya diawali dengan pembacaan tiap kata dari sampel. Hal ini akan menimbulkan input algoritmanya adalah sebuah kata. Langkah selanjutnya adalah pengecekan semua kemungkinan bentuk kata. Kemudian, pada setiap pemotongan kata langsung diikuti dengan langkah pencarian di kamus.pencarian tersebut bertujuan untuk melihat apakah bentuk tersebut sudah dalam bentuk dasar. Jika masih terdapat imbuhan, maka akan dilakukan pemotongan kembali sampai menjadi bentuk dasar.
Algoritma Pencarian Struktur Topik
Jenis algoritma ini menggunakan perulangan sebuah term sebagai penunjuk keterkaitan secara leksikal. Hal ini diselesaikan dengan cara membandingkan pasangan blok teks berurutan, kemudian dihitung besar kemiripannya secara leksikal. Pada jenis ketiga dari jenis jenis tesaurus berdasarkan algoritmanya ini, dapat dianggap bahwa semakin besar tingkat kemiripan dua blok teks, maka semakin besar bahwa topiknya berkelanjutan. Hal ini juga berlaku sebaliknya. Jika tingkat kemiripan antar blok sangat kecil, maka hal tersebut mengindikasikan perubahan alur topik sebelumnya.
Algoritma Identifikasi batas Segmen
Dalam jenis algoritma tesaurus ini, harus ditentukan ke dalam berapa kelompok suatu dokumen tebagi-bagi. Terlebih lagi mengingat setiap paragraf pasti mempunyai potensi untuk tergolong dalam satu segmen. Suatu batas blok bisa dipilih sebagai batas segmen jika nilai kedalamannya melebihi rata-rata alfa/2.

Contoh Tesaurus

Tesaurus Roget

Tesaurus yang pertama kali dibuat. Tesaurus ini dikenalkan oleh Peter Mark Roget pada tahun 1852. Tesaurusnya berjudul Roget’s Thesaurus of English Words and Phrases. Tesaurus Roget berisi kata-kata dan frasa dalam bahasa Inggris yang tersusun berdasarkan sinonim dan makna katanya.

Tesaurus Bahasa Indonesia

Tidak hanya bahasa Inggris, Bahasa Indonesia pun mempunyai tesaurus, salah satunya yang populer adalah karya Eko Endarmoko yang diterbitkan oleh PT Gramedia Pustaka Utama. Fungsinya pun sama, yait menyediakan perbendaharaan kata yang memiliki padanan makna. Oleh karenanya, padanan kata tersebut sangat membantu, terlebih dengan adanya penyortiran berdasarkan konteks penggunaan katanya.

Itulah sekilas tentang tesaurus dan jenis jenis tesaurus. Tesaurus akan sangat berguna terlebih untuk menambah perbendaharaan kata untuk sebuah ilmu pengetahuan tertentu. Karenanyalah, mari kenali tesaurus lebih dalam.

Sumber:
https://farikhsaba.wordpress.com
http://jejeffri.blogspot.sg
http://kbbi.web.id
http://www.hirupmotekar.com
http://www.hirupmotekar.com
http://www.hirupmotekar.com

Iklan Atas Artikel

Iklan Tengah Artikel 1

Iklan Tengah Artikel 2

Iklan Bawah Artikel