SEARCH ENGINE
Mesin pencari atau Search engine
adalah program komputer yang dirancang untuk melakukan pencarian atas
berkas-berkas yang tersimpan dalam layanan www, ftp, publikasi milis, ataupun
news group dalam sebuah ataupun sejumlah komputer peladen dalam suatu jaringan.
Search engine merupakan perangkat pencari informasi dari dokumen-dokumen yang
tersedia. Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang
seringkali diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas
suatu berkas yang disebut sebagai hits. Informasi yang menjadi target pencarian
bisa terdapat dalam berbagai macam jenis berkas seperti halaman situs web,
gambar, ataupun jenis-jenis berkas lainnya. Beberapa mesin pencari juga
diketahui melakukan pengumpulan informasi atas data yang tersimpan dalam suatu
basisdata ataupun direktori web.
Sebagian besar mesin pencari dijalankan oleh
perusahaan swasta yang menggunakan algoritma kepemilikan dan basisdata
tertutup, di antaranya yang paling populer adalah Google (MSN Search dan
Yahoo!). Telah ada beberapa upaya menciptakan mesin pencari dengan sumber
terbuka (open source), contohnya adalah Htdig, Nutch, Egothor dan OpenFTS.
Manfaat
• mesin pencari merupakan tempat
kebanyakan orang mencari sesuatu via internet. Menurut survei hampir 90%
pengguna internet memakai mesin pencari untuk mencari lokasi tertentu di
internet. dan di antara mesin pencari yang ada, google merupakan mesin pencari
yang paling banyak digunakan.
• Sebagian besar pengguna mesin pencari
tidak pernah melewatkan dua halaman pertama dari mesin pencari.
• Sebagian besar (hampir 70%) pengguna
mesin pencari tidak pernah klik pada hasil pencarian sponsor. Dengan demikian,
hasil pencarian yang organik (secara alami) akan membuat suatu website
memperoleh posisi strategis dalam dunia internet.
• Di negara-negara maju, porsi
penjualan yang dilakukan melalui internet sudah hampir mencapai 20% dari
keseluruhan transaksi tahunan.
• Sebuah
informasi yang mudah di akses oleh semua orang baik dalam maupun luar negeri.
• Memudahkan
Masyarakat dalam mencari informasi di internet
Cara
kerja mesin pencari
Mesin pencari web bekerja dengan
cara menyimpan informasi tentang banyak halaman web, yang diambil langsung dari
WWW. Halaman-halaman ini diambil dengan web crawler — browser web otomatis yang
mengikuti setiap pranala/link yang dilihatnya. Isi setiap halaman lalu
dianalisis untuk menentukan cara indeks-nya (misalnya, kata-kata diambil dari
judul, subjudul, atau field khusus yang disebut meta tag). Data tentang halaman
web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian
selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan seluruh atau
sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman
web itu sendiri.
Selain halaman web, Mesin pencari juga menyimpan dan
memberikan informasi hasil pencarian berupa pranala yang merujuk pada file,
seperti file audio, file video, gambar, foto dan sebagainya, serta informasi
tentang seseorang, suatu produk, layanan, dan informasi beragam lainnya yang
semakin terus berkembang sesuai dengan perkembangan teknologi informasi.
Ketika seseorang mengunjungi mesin pencari dan
memasukkan query, biasanya dengan memasukkan kata kunci, mesin mencari indeks
dan memberikan daftar halaman web yang paling sesuai dengan kriterianya,
biasanya disertai ringkasan singkat mengenai judul dokumen dan kadang-kadang
sebagian teksnya.
Ada jenis mesin pencari lain: mesin pencari
real-time, seperti Orase. Mesin seperti ini tidak menggunakan indeks. Informasi
yang diperlukan mesin tersebut hanya dikumpulkan jika ada pencarian baru. Jika
dibandingkan dengan sistem berbasis indeks yang digunakan mesin-mesin seperti
Google, sistem real-time ini unggul dalam beberapa hal: informasi selalu
mutakhir, (hampir) tak ada pranala mati, dan lebih sedikit sumber daya sistem
yang diperlukan. (Google menggunakan hampir 100.000 komputer, Orase hanya
satu.) Tetapi, ada juga kelemahannya: pencarian lebih lama rampungnya.
Manfaat mesin pencari bergantung pada relevansi
hasil-hasil yang diberikannya. Meskipun mungkin ada jutaan halaman web yang
mengandung suatu kata atau frasa, sebagian halaman mungkin lebih relevan,
populer, atau autoritatif daripada yang lain. Kebanyakan mesin pencari
menggunakan berbagai metode untuk menentukan peringkat hasil pencarian agar
mampu memberikan hasil "terbaik" lebih dahulu. Cara mesin menentukan
halaman mana yang paling sesuai, dan urutan halaman-halaman itu diperlihatkan,
sangat bervariasi. Metode-metode nya juga berubah seiring waktu dengan
berubahnya penggunaan internet dan berevolusinya teknik-teknik baru.
Sebagian besar mesin pencari web adalah usaha
komersial yang didukung pemasukan iklan dan karenanya sebagian menjalankan
praktik kontroversial, yaitu membolehkan pengiklan membayar agar halaman mereka
diberi peringkat lebih tinggi dalam hasil pencarian.
Prinsip
Umum Dari mesin pencari
Sistem kinerja mesin ini ada beberapa hal yang perlu
di perhatikan terutama keterkaitannya dengan masalah arsitekrut dan
mekanismenya.
Spider
Merupakan program yang men-download halaman-halaman
yang mereka temukan, mirip dengan browser. Perbedannya adalah bahwa browser
menapilkan secara langsung informasi yang ada (baik tekas, gambar, dll). Untuk
kepentingan manusia yang menggunakannya pada saat itu, sedangkan spider tidak
melakukan untuk menampilkan dalam bentuk yang terlihat seperti itu, karena
kepentingannya adalah untuk mesin, bukan untuk manusia, spider pun dijalankan
oleh mesin secara otomatis. Kepentingannya adalah untuk mengambil
halaman-halaman yang dikunjunginya untuk disimpan kedalam database yang
dimiliki oleh search engine.
Crawler
Merupakan program yang dimiliki search engine untuk
melacak dan menemukan link yang terdapat dari setiap halaman yang ditemuinya.
Tugasnya adalah untuk menentukan spoder harus pergi kemana dan mengevaluasi
link berdasarkan alamat yang ditentukan dari awal. Crawler mengikuti link dan
mencoba menemukan dokumen yang belum dikenal oleh search engine.
Indexer
Komponen ini melakukan aktifitas untuk menguraikan
masing-masing halaman dan meneliti berbagai unsur, seperti teks, headers,
struktur atau fitur dari gaya penulisan, tag HTML khusus, dll.
Database
Merupakan tempat standar untuk menyimpan data-data
dari halaman yang telah dikunjungi, di-download dan sudah dianalisis. kadang
kala disebut juga dengan index dari suatu search engine.
Result Engine
Mesin yang melakukan penggolongan dan penentuan
peringkat dari hasil pencarian pada search engine. Mesin ini menentukan halaman
mana yang menemui kriteria terbaik dari hasil pencarian berdasarkan permintaan
penggunanya, dan bagaimana bentuk penampulan yang akan ditampilkan.
Proses ini dilaksanakan berdasarkan algoritma
perangkingan yang dimiliki oleh search engine tersebut, mengikuti kaidah
perangkingan hakaman yang dipergunakan oleh mereka adalah hak mereka, para
peneliti mempelajari sifat-sifat yang mereka gunakan, terutama untuk
meningkatkan pencarian yang dihasilkan oleh serach engine tersebut.
Web Server
Merupakan komponen yang melayani permintaan dan
memberikan respon balik dari permintaan tersebut. Web Server ini biasanya
menghasilkan informasi atau dokumen dalam format HTML. Pada halaman tersebut
tersedia layanan untuk mengisikan kata kunci pencarian yang diinginkan oleh
usernya. Web Server ini juga bertanggung jawab dalam menyampaikan hasil
pencarian yang dikirimkan kepada komputer yang meminta informasi.
Pangsa pasar
Bagian ini membutuhkan pengembangan
dengan: Informasi tentang mesin pencari nasional seperti StatCounter, Yandex,
Naver dan pangsa pasar di negara bersangkutan.