MENERAPKAN TEKNIK PENELUSURAN SEARCH ENGINE
Pengertian Aplikasi Search Engine
Search engine (mesin
pencari/pelacak/penelusur) adalah salah satu program komputer yang dirancang
khusus untuk membantu seseorang menemukan file-file yang disimpan dalam
komputer, misalnya dalam sebuah web server umum di web (www) atau komputer
sendiri. Mesin pencari memungkinkan kita untuk meminta content media dengan
kriteria yang spesifik (biasanya berisikan frase atau kata yang kita inginkan)
dan memperoleh daftar file yang memenuhi kriteria tersebut.
Komponen Search Engine
Search engine terdiri atas
lima komponen, yaitu:
1. Query Interface
Query interface adalah
komponen penting pertama yang merupakan bentuk tampilan atau format situs yang
menyediakan fasilitas searching engine. Bentuk yang paling sederhana adalah
tersedianya sebuah kotak kosong di situs dimana user dapat menuliskan data atau
informasi yang ingin dicari (lihat situs Yahoo.com atau Altavista.com). Yang
harus diketahui oleh user adalah bahwa tidak semua situs memiliki kemampuan
yang sama dalam membantu user untuk mengekspresikan jenis data atau informasi
yang ingin dicari. Dalam bahasa komputer cara mengekspresikan ini disebut
sebagai query. Contohnya adalah seseorang yang ingin mencari data atau
informasi mengenai hal-hal yang berkaitan dengan kesehatan ibu dan anak, dapat
menggunakan query semacam: “kesehatan” and “ibu” and “anak”.
2. Query Engine
Komponen kedua adalah Query
Engine, merupakan sebuah program yang bertugas untuk menterjemahkan keinginan
user ke dalam bahasa yang dimengerti oleh mesin komputer. Secara teknis,
perusahaan-perusahaan penyedia searching engine berlomba-lomba membuat query
engine yang baik sehingga selain tepat dalam mengekspresikan keinginan user,
dapat pula melakukan tugas pencarian secara cepat.
3. Database
Database pada dasarnya
merupakan kumpulan atau daftar dari dokumen maupun arsip dari seluruh situs
yang ada di internet. Semakin besar skala internet, akan semakin besar pula
kapasitas penyimpan yang dibutuhkan.
4. Spider
Spider merupakan komponen
terpenting dalam sebuah searching engine. Secara berkala dan kontinyu, spider
akan mendata setiap situs yang ada di internet, baik yang baru maupun yang
lama. Terhadap masing-masing situs, selain alamatnya, akan diambil kata-kata
kunci dari arsip maupun dokumen yang ditemukan. Katakanlah dari situs
Bidanku.com akan diambil setiap kata pada kalimat judul artikel, disinilah
sebenarnya persaingan antara situs terjadi, yaitu strategi dan teknik apa yang
dipergunakan dalam melakukan sampling terhadap kata-kata yang akan menjadi
kunci dalam pencarian arsip dan dokumen.
5. Indexer
Indexer merupakan sebuah
program untuk mempercepat proses pencarian. Filosofi yang dipergunakan mirip
dengan prinsip penggunaan indeks pada kamus atau buku-buku. Perang antar situs
pun terjadi di sini, karena teknik melakukan indeks akan sangat berpengaruh
terhadap kecepatan pencarian data atau informasi. Biasanya yang terjadi di sini
adalah adu algoritma (alur logika sebuah program) antar para programmer yang
direkrut oleh masing-masing perusahaan.
Jenis Search Engine
Berdasarkan cara mengumpulkan
data halaman-halaman web, mesin pencari dapat di kelompokkan menjadi 4 kategori
:
1. Human
Organized Search Engine
Mesin pencari yang dikelola
sepenuhnya oleh tangan manusia. Mesin pencari ini menggunakan metode dengan memilah-milih
informasi yang relevan dan dikelompokan sedemikian rupa sehingga lebih bermakna
dan bermanfaaat bagi penggunannya. Situs ini dalam prakteknya memperkerjakan
para pakar dalam bidang-bidang tertentu, kemudian para pakar tersebut dapat
mengkelompokan situs-situs tertentu sesuai dengan bidangnnya atau kategori
situs itu sendiri.
2. Computer
Created Search Engine
Search engine kategori ini
banyak memiliki kelebihan karena banyak menyajikan inforrmasi walaupun
kadang-kadang ada beberapa informasi yang tidak relevan tidak seperti yang kita
inginkan. Search engine ini telah menggunakan software laba-laba atau spider
software yang berfungsi menyusup pada situs-situs tertentu, kemudian
mengumpulkan data serta mengelompokan dengan sedikit bantuan tangan manusia.
3. Hybrid
Seacrh Engine
Merupakan gabungan antara
tangan manusia dengan computer, sehingga menghasilkan hasil pencarian yang
relative akurat. Peran manusia dalam hal ini adalah sebagai penelaah dalam
proses pengkoleksian database halaman web. Sebenarnya tipe ini lah yang paling
mudah pembuatannya karena dapat didesain sesuai dengan keinginan kita.
4. MetaCrawler/Metasearch
Merupakan perantara dari
mesin pencari yang sebenarnya. Mesin ini hanya akan mengirimkan permintaan
pencarian ke berbagai mesin pencari serta menampilkan hasilnya satu di layer
browser sehingga akan menampilkan banyak sekali hasil dari ber bagai mesin
pencari yang ada.
Cara Kerja Search Engine
Program Search Engine dalam
menjalankan fungsinya sebenarnya bekerja bersamaan dengan Browser. Ketika kita
mengetikkan sesuatu lalu Enter, Search Engine-lah yang bekerja
melakukan pencarian di database. Hasil yang didapat diberikan kembali ke
Browser, lalu Browser menampilkannya untuk kita dalam format yang mudah kita
mengerti. Sebenarnya Search Engine tidak tampak, ia bekerja di balik layar.
Search Engine juga sebenarnya bekerja dengan teman-temannya yaitu crawler atau
indexer atau robot atau bot.
Sederhananya, proses yang
berlangsung adalah: saat user membuka Browser, dan memerintahkan pencarian,
maka browser minta tolong Search Engine untuk mencarikan. Jika sudah didapat,
hasilnya dikembalikan ke Browser dan Browser menampilkannya untuk user.
Semuanya berlangsung sangat cepat sehingga kita tidak mengetahui proses
sesungguhnya yang terjadi.
Mesin pencari web bekerja
dengan cara menyimpan informasi tentang banyak halaman web, yang diambil secara
langsung dari www. Halaman ini di ambil dengan web crawler-browser web yang
otomatis mengikuti setiap pranala yang dilihatnya. Isi setiap halaman lalu
dianalisis untuk menentukan cara mengindeksnya (misalnya kata-kata di ambil
dari judul, subjudul, atau field khusus yang di sebut meta tag). Data tentang
halaman web disimpan dalam sebuah database indeks untuk digunakan dalam
pencarian selanjutnya.
Sebagian mesin pencari
seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang disebut
cache) maupun informasi tentang halaman web itu sendiri. Ketika seorang
pengguna menggunakan mesin pencari dan memasukan query, biasanya dengan memasukan
kata kunci, mesin mencari akan mengindeks dan memberikan daftar halaman web
yang paling sesuai dengan kriterianya. Daftar ini biasanya disertai ringkasan
singkat menggenai judul dokumen dan terkadang sebagian teks dari hasil
pencarian yang kita cari.
Kelebihan:
1. Kecepatan
dan kemudahan dalam mencari
2. lebih
canggih dengan fitur yang dimilikinya
3. Tampilan
yang sederhana
Google merupakan satu-satunya
mesin pencari yang memilki cach. Dengan adanya cache ini, si pencari dapat
menghemat waktu pencarian, karena hasil pencarian yang akan ditampilkan.
Kekurangan:
Dengan kelebihan yang
dimilikinya, ternyata mesin pencari ini jadi bidikan para spamer untuk
menampilkan iklan-iklan yang tidak diperlukan. Mereka memanfaatkan setiap celah
yang ada pada sistem algoritma Google untuk memaksa iklan mereka tampil pada
halaman terdepan. Maka, pencarian pun terasa tergangggu.
Boolean Logic
Boolean logic adalah suatu
pencarian pelacakan yang menyatakan tentang hubungan antara variabel yang
dicari dengan variabel terkait. Boolean logic juga merupakan identifikasi
spesifik tentang artikel yang akan dicari. Boolean logic dikembangkan oleh
George Boole (1815-1864), adalah suatu metode pencarian informasi, yang
memfokuskan hasil penelusuran dimana pencarian datanya menggunakan kata kunci.
Boolean logic terdiri dari
operasi logika AND, OR dan NOT. Pada fitur pencarian Google, operasi ini
merupakan bagian dari fitur pencarian dasar. Penggunaan operasi logika ini
dapat memudahkan user dalam mendapatkan informasi yang diinginkan. Boolean
logic merupakan operasi logika yang digunakan untuk mendapatkan informasi di
PubMed (NCBI)