本文介紹SEO人員十大必備工具之搜索引擎蜘蛛模擬器,從搜索引擎的發展談到搜索引擎蜘蛛的工作原理,重點是談通過搜索引擎蜘蛛模擬器得到結果,並通過該結果進行優化。並提供了搜索引擎蜘蛛模擬器讓大家進行體驗。
早幾年,搜索引擎還處於人工編輯目錄的時候,搜索引擎的使用並不是那麼普及,原因可能有很多,其中互聯網的普及程度,以及目錄難以查找,而且很難直接查找到有用信息可能是典型的原因。還記得hao123的神話,現在看起來一個網頁設計初學者都可以製作的網址站,居然能夠月贏利上百萬。在羨慕hao123的同時,也發現那是在特殊環境下幹了一件正確的事情,所以獲得了成功,因為那個時候的網址還需要使用筆記本進行記錄,還有大部頭的網址書籍,對於上網為何物都很陌生的普通中國網民,網址站無疑是黑暗中的一盞明燈,明燈得到回報也是自然而然的事情。
然而,有些聰明的人想出來了聰明的搜索引擎,這些叫做搜索引擎的東西可以知道你需要什麼,然後在浩瀚的網絡海洋中抓到大家需要的資料,自然的,當白熾燈出現的時候,煤油燈自然就會退出歷史舞台,這是規律。
以上的話似乎有些跑題了,有空的朋友可以看看,權且當成消遣,忙的朋友從這裡看起。搜索引擎是什麼呢?搜索引擎首先必須擁有一個龐大網頁資料庫,這裡保存了所以改搜索引擎收錄的網站內容副本,然後通過高超的算法,這個算法是關鍵,讓客人輸入某個關鍵字的時候,判斷哪些信息是客人想要的,然後將算法最有用的信息呈現給客人。那麼,搜索引擎是怎麼樣建立起這個龐大的數據呢?其實就是一些自動下載網站的程序,這些程序被稱為「蜘蛛」或者「爬蟲」,或許還有別的叫法,但是都表達它們像蜘蛛一樣在網上爬來爬去,目的是得到別的網站的資料,如果你有幸被「蜘蛛」爬到了,那麼恭喜,這說明搜索引擎收錄了網站內容。這其實搜索收錄資料的過程。
然而這個機器「蜘蛛」顯然沒有現實生活中的蜘蛛那麼聰明和靈活,它中規中矩,但也鐵面無私。對於網站來說,搜索引擎「蜘蛛」是一「視」同仁的,它基本上只能看到純文本信息,然後帶走,有個網站為了效果,使用了大量的Flash,圖片等非文本的媒體,如果將重要信息放在多媒體裡面,那麼搜索引擎「蜘蛛」是不會看見的,「蜘蛛」看不見的話,後果就是客戶也不能通過搜索引擎搜索到該網站。
所以,如果需要進行SEO,那麼應該用「蜘蛛」的眼睛來觀察網頁,而且要將重要的、關鍵的信息一定要讓「蜘蛛」看到。那麼,這個時候就需要搜索引擎蜘蛛模擬器來完成,通過這個模擬器就可以看到在搜索引擎中,哪些信息被抓走了,比如某網站主要關鍵字是「網絡營銷」,可是為了突出,全部使用了GIF動畫來製作「網絡營銷」這些文字(當然,沒人會這樣,只是打個比方),對於「蜘蛛」來說它就看不到,而且搜索引擎也可能不會認為這個網站在討論「網絡營銷」所以自然就沒有辦法客戶搜索「網絡營銷」的時候出現該網站的結果。
搜索引擎蜘蛛模擬器的原理就是模仿搜索引擎的抓取器,其實也相當於早年的純文本瀏覽器,只能看見文字,而且目前搜索引擎主要也是通過文本查找來定位信息。通過搜索引擎蜘蛛模擬器得到了結果後,SEO優化人員可以從多方面進行優化,一般有主要如下方面:
將重要文字信息從多媒體轉換成純文字。
將語義不完整的內容添加。
保持該頁的主題,去掉不相干的文字。
其他一些內容上的處理。
搜索引蜘蛛模擬器使用也非常簡單,大部分搜索引擎蜘蛛也是在線的,只需要簡單的輸入網址就可以看到結果,結果一般包括一下幾個方面:
整個網頁(包括標題)的所有純文本信息
該網頁所有的鏈接
該網頁的Meta Keywords
該網頁的Meta Description
通過以上結果就可以為SEO動作提供參考。
馬上就可以體驗搜索引擎蜘蛛模擬器:

