Mempelajari Cara Kerja Mesin Pencari (Searhc Engin)-Dalam panduan ini, saya akan memberi Anda pengantar tentang cara kerja mesin telusur. Ini akan mencakup proses perayapan dan pengindeksan serta konsep seperti anggaran perayapan dan PageRank .
Mesin pencari bekerja dengan merayapi ratusan miliar halaman menggunakan crawler web mereka sendiri. Perayap web ini biasanya disebut sebagai bot atau spider mesin telusur . Mesin pencari menavigasi web dengan mendownload halaman web dan mengikuti link pada halaman ini untuk menemukan halaman baru yang telah disediakan.
Indeks Mesin Pencari
Halaman web yang telah ditemukan oleh mesin pencari ditambahkan ke dalam struktur data yang disebut indeks.
Indeks ini mencakup semua URL yang ditemukan bersama dengan sejumlah sinyal kunci yang relevan tentang konten setiap URL seperti:
Kata kunci ditemukan dalam konten halaman - topik apa yang tercakup dalam halaman?
Jenis konten yang sedang di-crawl (menggunakan mikrodata yang disebut Skema) - apa yang disertakan di halaman?
The kesegaran halaman - bagaimana baru-baru ini diperbarui?
Keterlibatan pengguna sebelumnya pada halaman dan / atau domain - bagaimana orang berinteraksi dengan halaman?
Apa Tujuan Algoritma Mesin Pencari?
Tujuan dari algoritma mesin pencari adalah untuk menyajikan sekumpulan hasil pencarian berkualitas tinggi yang relevan yang akan memenuhi permintaan / pertanyaan pengguna secepat mungkin.
Pengguna kemudian memilih opsi dari daftar hasil pencarian dan tindakan ini, bersama dengan aktivitas berikutnya, kemudian dimasukkan ke dalam pembelajaran selanjutnya yang dapat mempengaruhi peringkat mesin pencari di masa depan.
Apa yang terjadi ketika pencarian dilakukan?
Saat kueri penelusuran dimasukkan ke dalam mesin telusur oleh pengguna, semua halaman yang dianggap relevan diidentifikasi dari indeks dan algoritme digunakan untuk memeringkat halaman yang relevan secara hierarkis ke dalam serangkaian hasil.
Algoritme yang digunakan untuk menentukan peringkat hasil yang paling relevan berbeda untuk setiap mesin pencari. Misalnya, halaman dengan peringkat tinggi untuk kueri penelusuran di Google mungkin tidak berperingkat tinggi untuk kueri yang sama di Bing .
Selain kueri penelusuran, mesin telusur menggunakan data relevan lainnya untuk memberikan hasil, termasuk:
Lokasi - Beberapa permintaan pencarian bergantung pada lokasi, mis. 'Kafe di sekitar saya' atau 'jadwal film'.
Bahasa terdeteksi - Mesin pencari akan memberikan hasil dalam bahasa pengguna , jika dapat dideteksi.
Riwayat penelusuran sebelumnya - Mesin telusur akan memberikan hasil yang berbeda untuk kueri yang bergantung pada penelusuran pengguna sebelumnya.
Perangkat - Kumpulan hasil yang berbeda dapat dikembalikan berdasarkan perangkat tempat kueri dibuat.
Mengapa Halaman Tidak Dapat Diindeks?
Ada beberapa situasi di mana URL tidak akan diindeks oleh mesin pencari. Ini mungkin karena:
Pengecualian file Robots.txt - file yang memberi tahu mesin telusur apa yang tidak boleh mereka kunjungi di situs Anda.
Arahan di halaman web yang memberi tahu mesin telusur untuk tidak mengindeks halaman itu ( tag noindex ) atau mengindeks halaman lain yang serupa ( tag kanonik ).
Algoritme mesin telusur menilai halaman tersebut berkualitas rendah , memiliki konten tipis, atau berisi konten duplikat .
Posting Komentar
Posting Komentar