大家好,這里是一濤說電腦,很高興今天我們來聊聊我們常用的搜索引擎。

搜索引擎分類
搜索引擎大致可分為四種:全文搜索引擎、元搜索引擎、垂直搜索引擎和目錄搜索引擎幾大類
搜索引擎原理
通俗的講就是收集了萬維網(wǎng)上眾多的網(wǎng)頁中的每一個詞并記錄到數(shù)據(jù)庫中,然后建立數(shù)據(jù)庫索引的搜索引擎。當用戶輸入關(guān)鍵詞時,就在數(shù)據(jù)庫中查找該詞,并迅速將擁有該詞的網(wǎng)頁展現(xiàn)在用戶面前。
引擎結(jié)構(gòu)
搜索引擎基本結(jié)構(gòu)一般包括:搜索器、索引器、檢索器、用戶接口等四個功能模塊。
- 搜索器,顧名思義就是搜索用的,也被稱為網(wǎng)絡(luò)蜘蛛,程序員俗稱爬蟲,更為形象的比喻就是螞蟻搬家,是搜索引擎用來抓取網(wǎng)頁內(nèi)容的一個全自動程序,在他們系統(tǒng)后臺全天不停歇的在萬維網(wǎng)上爬行抓取內(nèi)容到他們服務(wù)器上。
- 索引器,就是將搜索器抓取的內(nèi)容就行分類存儲在數(shù)據(jù)庫中并就行索引。
- 檢索器,當我們輸入關(guān)鍵詞時,此時會在他們數(shù)據(jù)庫中得到很多結(jié)果(先進行預處理),檢索器就是優(yōu)化結(jié)果,將最接近我們輸入的關(guān)鍵詞的結(jié)果優(yōu)先輸出。
- 用戶接口,就是檢索器優(yōu)化后的結(jié)果展現(xiàn)到我們面前。
工作原理
搜索器工作原理,通過網(wǎng)絡(luò)蜘蛛程序:掃描程序指定范圍內(nèi)IP地址網(wǎng)站,通過鏈接遍歷整個Web空間,來進行采集網(wǎng)頁資料,為保證采集的資料最新,蜘蛛程序可能會回訪已抓取過的網(wǎng)頁,以防萬一。
屏蔽百度搜索引擎
有的時候我們網(wǎng)站的信息并不希望搜索引擎能夠爬取,例如:獨家新聞、視頻、門戶網(wǎng)站,一些登錄頁面,或者不想分享的內(nèi)容,此時我們就會想辦法屏蔽搜索引擎。其實屏蔽搜索引擎的方法很多,小編列舉幾種,僅供參考切勿用于不法用途!
- robots.txt方法
robots協(xié)議也叫robots.txt(統(tǒng)一小寫)是一種存放于網(wǎng)站根目錄下的ASCII編碼的文本文件,它通常告訴網(wǎng)絡(luò)搜索引擎的漫游器(又稱網(wǎng)絡(luò)蜘蛛),此網(wǎng)站中的哪些內(nèi)容是不應(yīng)被搜索引擎的漫游器獲取的,哪些是可以被漫游器獲取的。因為一些系統(tǒng)中的URL是大小寫敏感的,所以robots.txt的文件名應(yīng)統(tǒng)一為小寫。robots.txt應(yīng)放置于網(wǎng)站的根目錄下。如果想單獨定義搜索引擎的漫游器訪問子目錄時的行為,那么可以將自定的設(shè)置合并到根目錄下的robots.txt,或者使用robots元數(shù)據(jù)(Metadata,又稱元數(shù)據(jù))。
搜索引擎一般情況下是默認遵守robots.txt協(xié)議的,所以我們可以通過robots協(xié)議來屏蔽搜索引擎
編輯代碼如下:User-agent:*Disallow:,保存為robots.txt文本文件上傳至網(wǎng)站根目錄下即可。
還可以通過網(wǎng)頁代碼,在網(wǎng)站首頁代碼<head>與</head>之間,加入<metaname="robots"content="noarchive">
此標記禁止搜索引擎抓取網(wǎng)站并顯示網(wǎng)頁快照。
可以聯(lián)系百度管理人員,信箱地址為:[email protected],用網(wǎng)站聯(lián)系人信箱發(fā)電郵,如實說明刪除網(wǎng)頁快照的情況,經(jīng)百度核實后,網(wǎng)頁停止收錄抓取。
登陸百度自己的“百度快照”貼吧和“百度投訴”貼吧,發(fā)個帖子,表明刪除網(wǎng)頁收錄網(wǎng)站快照的原因,當百度管理人員,看到會給予處理。

列舉幾個國內(nèi)知名搜索引擎
搜索引擎是如何盈利的
說到搜索引擎的盈利方式那真是太多了,五花八門,今天說說我們熟悉的百度吧!

百度的盈利方式其實也很多,今天說說最主要的幾種:
方式一、競價排名
百度營收重要功臣
百度競價排名也被稱作百度搜索推廣、百度關(guān)鍵字推廣。是一種按效果付費的網(wǎng)絡(luò)推廣方式,企業(yè)在購買該項服務(wù)后,提交自己定制的關(guān)鍵詞,其推廣信息就會率先出現(xiàn)在網(wǎng)民相應(yīng)的搜索結(jié)果中。簡單來說就是當用戶利用某一關(guān)鍵詞進行檢索,在檢索結(jié)果頁面會出現(xiàn)與該關(guān)鍵詞相關(guān)的廣告內(nèi)容。百度按照實際點擊量進行收費。其好處也是顯而可見,可以更直接給企業(yè)帶來一個潛在客戶,但是在同一關(guān)鍵字下,誰的價格高,誰的排名將會更靠前,這也讓百度賺的盆滿缽滿。其實并非百度,大多數(shù)的搜索引擎都靠競價來賺錢。
方式二、火爆地帶
火爆地帶即百度火爆地帶是一種針對特定關(guān)鍵詞的網(wǎng)絡(luò)推廣方式,按時間段固定付費,出現(xiàn)在百度網(wǎng)頁搜索結(jié)果第一頁的右側(cè),不同位置價格不同。
企業(yè)購買了火爆地帶關(guān)鍵詞后,就會被主動查找這些關(guān)鍵詞的用戶找到,給企業(yè)帶來更多的商業(yè)機會!
表現(xiàn)形式

百度火爆地帶出現(xiàn)在網(wǎng)頁搜索結(jié)果第一頁的右側(cè)區(qū)域內(nèi), 點擊后可直接進入企業(yè)所指定的網(wǎng)站
方式三、圖片推廣收入
是一種針對特定關(guān)鍵詞的網(wǎng)絡(luò)推廣方式,按時間段固定付費,搜索結(jié)果第一頁的結(jié)果區(qū)域,不同詞匯價格不同。企業(yè)購買了圖片推廣關(guān)鍵詞后,就會被主動查找這些關(guān)鍵詞的用戶內(nèi)找到并向其展示企業(yè)推廣圖片,給企業(yè)帶來商業(yè)機會!
方式四、品牌專區(qū)收入
百度品牌專區(qū),位于百度搜索結(jié)果首位,以超大黃金首屏展示位置,以文字、圖片、視頻等多種廣告形式全方位推廣展示企業(yè)品牌信息,將最為精華和直接的品牌信息展現(xiàn)在網(wǎng)民面前,眾多網(wǎng)民也得以更便捷的了解品牌官網(wǎng)信息,更方便的獲取所需企業(yè)資訊,是提升企業(yè)品牌推廣效能的創(chuàng)新品牌推廣模式。
好了,這里是一濤說電腦,我們下期再見!