1. 搜索引擎通常具備哪些基本的檢索功能
現有的搜索引擎基本上分為三類:
1.1 single search engine(獨立搜索引擎) 它的特點是僅在搜索引擎自身的資料庫檢索信息,比如Yahoo。
1.2 Meta search engine(元搜索引擎) 它在檢索信息時通過調用其它多個獨立的搜索引擎來完成檢索功能,並且能夠將從多個獨立搜索引擎查詢的結果進行不同程度的處理,比如刪除重復結果、校驗連接、結果按照相關度排序等。元搜索引擎本身可以有也可以沒有自己的資料庫。由於不同的元搜索引擎掛接的獨立搜索引擎各不相同,且各自獨立的搜索引擎在查詢語法上的差別較大,使得元搜索引擎本身僅支持AND、0R、N0T等簡單的語法操作,返回的結果只能滿足「最低常用分母」,即不能提高搜索結果的准確性。
1.3 Net search engine(網路搜索軟體) 就是網路用戶可以將相應的搜索軟體下載至本地的計算機上,安裝查詢,這是一種具有網路查詢功能的離線瀏覽器。相對於元搜索引擎,它可以靈活地控制輸出結果,其最大特點是方便用戶使用和能快速地查詢網路相關資源。2 網路搜索引擎的工作原理及其基本構成
用戶檢索信息時,搜索引擎是根據用戶的查詢要求,按照一定的演算法從索引資料庫中查找對應的信息返回給用戶。為了保證用戶查找信息的精度和新鮮度。對於獨立的搜索引擎而言.還需要建立並維護一個龐大的資料庫。獨立搜索引擎中的索引資料庫中的信息是通過一種叫做網路蜘蛛(spider)的程序軟體定期在網上爬行,通過訪問公共網路中公開區域的每一個站點採集網頁,對網路信息資源進行收集,然後利用索引軟體對收集的信息進行自動標引,創建一個可供用戶按照關鍵字等進行查詢的web頁索引資料庫,搜索軟體通過索引資料庫為用戶提供查詢服務。所以,一般的搜索引擎主要由網路蜘蛛、索引和搜索軟體三部分組成.
網路蜘蛛。是一個功能很強的程序,它會定期根據預先設定的地址去查看對應的網頁,如網頁發生變化則重新獲取該網頁,否則根據該網頁中的鏈接繼續去訪問。網路蜘蛛訪問頁面的過程是對互連網上信息遍歷的過程。為了保證網路蜘蛛遍歷信息的廣度,一般事先設定_ 些重要的鏈接,然後進行遍歷。在遍歷的過程中不斷記錄網頁中的鏈接,不斷地遍歷下去,直到訪問完所有的鏈接。
索引軟體。網路蜘蛛將遍歷搜索集得到的網頁存放在資料庫中。為了提高檢索的效率,需要建立索引。索引一般為倒排檔索引。
搜索軟體。該軟體用於篩選索引資料庫中無數的網頁信息,選擇出符合用戶檢索要求的網頁並對它們進行分級排序。然後將分級排序後的結果顯示給用戶。
3 搜索引擎的主要性能評價指標
3.1 搜索引擎建立索引的方法 資料庫中的索引一般是按照倒排文檔的文件格式存放,在建立例排索引的時候,不同的搜索引擎有不同的選項。有些搜索引擎對於信息頁面建立全文索引;而有些只建立摘要部分,或者是段落前面部分的索引;還有些搜索引擎,比如Google建立索引的時候,同時還考慮超文本的不同標記所表示的不同含義。如粗體、大字體顯示的東西往往比較重要;放在錨鏈中的信息往往是它所指向頁面的信息的概括,所以用它來作為所指向的頁面的重要信息。Google、infoseek還在建立索引的過程中收集頁面中的超鏈接。這些超鏈接反映了收集到的信息之間的空間結構,利用這些結果信息可以提高頁面相關度判別時的准確度。由於索引不同,在檢索信息時產生的結果會不同。
3.2 搜索引擎的檢索功能搜索引擎所支持的檢索功能的多少及其實現的優劣,直接決定了檢索效果的好壞,所以網路檢索工具除了要支持諸如布爾檢索、鄰近檢索、截詞檢索、欄位檢索等基本的檢索功能之外,更應該根據網上信息資源的變化,及時地應用新技術、新方法,提高高級檢索功能。另外,由於中文信息特有的編碼不統一問題,所以如果搜索引擎能夠實現不同內碼之間的自動轉換,用戶就會全面檢索大陸、港台乃至全世界的中文信息。這樣不但提高了搜索引擎的質量,而且會得到用戶的支持。
3.3 搜索引擎的檢索效果 檢索效果可以從響應時間、查全率、查准率和相關度方面來衡量。響應時間是用戶輸入檢索式開始查詢到檢出結果的時間。查全率是指一次搜索結果中符合用戶要求的數目與和用戶查詢相關的總數之比;查准率是指一次搜索結果集中符合用戶要求的數目與該次搜索結果總數之比;相似度是指用戶查詢與搜索結果之間相似度的一種度量。雖然由於無法估計網路上與某個檢索提問相關的所有信息數量。所以目前尚沒有定量計算查全率的更好方法,但是它作為評價檢索效果的指標還是值得保留。查准率也是一個復雜的概念,一方面表示搜索引擎對搜索結果的排序,另一方面卻體現了搜索引擎對垃圾網頁的抗干擾能力。總之,一個好的搜索引輦應該具有較快的響應速度和高的查全率和查准率,或者有極大的相似度。
3.4 搜索引擎的受歡迎程度 搜索引擎的受歡迎程度體現了用戶對於搜索引擎的偏愛程度,知名度高、性能穩定和搜索質量好的搜索引擎很受用戶的青睞。搜索引擎的受歡迎程度也會隨著它的知名度和服務水平的變化而動態的變化。搜索引擎的服務水平和它所收集的信息量、信息的新鮮度和查詢的精度相關。隨著各種新的搜索技術的出現,智能化的、支持多媒體檢索的搜索引擎將越來越受用戶的歡迎。
另外,搜索引擎的信息佔有量也可以作為評價搜索引擎性能的指標。綜上所述,評價搜索引擎的性能指標可以概括為:a.建立索引的方法(全文索引,部分索引,按重要程度索引等);b.檢索功能(支持的檢索技術,多媒體檢索,內碼處理等);C.查詢效果(響應時間,查全率,查准率,相關度);d.受歡迎程度;e.信息佔有量。4 搜索引擎檢索信息的局限
2001年Roper的調查指出,36% 的互連網用戶一個星期花超過2個小時的時間在網上搜索;71% 的用戶在使用搜索引擎時遇到過麻煩;平均搜索12分鍾以後發現搜索受挫。另一項由Keen所做的調查顯示,31% 的人使用搜索引擎尋找答案,網上查找答案的半數以上都不成功。從這些調查數據中不難看出。目前的搜索引擎仍然存在不少的局限性。概括起來大致有以下幾個方面。
4.1 搜索引擎對信息的標引深度不夠 目前,搜索引擎檢索的結果往往只提供一些線形的網址和包括關鍵詞的網頁信息,與人們對它的預期存在較大的距離,或者返回過多的無用信息,或者信息丟失,特別是對特定的文獻資料庫的檢索顯得無能為力。
4.2 搜索引擎的信息量佔有不足 作為搜索引擎必須佔有相當大的信息量才能具有一定的查全率和實用性。目前還沒有一種覆蓋整個網際網路信息資源的搜索引擎。
4.3 搜索引擎的查准率不高 分析起來,這是因為:一方面由於網上信息數量巨大、內容龐大、良莠不齊,信息的質量得不到保障;另一方面是由於大多數搜索引擎的索引工作由程序自動完成,根據網頁中詞頻及詞的位置等因素確定關鍵詞,有的網站為了提高點擊率,將一些與網頁主題並不相關的熱門詞彙以隱含方式放在頁面上,並重復多次,從而造成查准率低。
4.4 檢索功能單一,缺乏靈活性 目前許多搜索引擎的查詢方法比較單一,一般只提供分類查詢方式和關鍵詞查詢方式。不能從文獻的多個方面對檢索提問進行限制,只能就某一關鍵詞或者概念進行籠統的檢索。
4.5 搜索引擎自身的技術局限像目前部分搜索引擎還不能支持對多媒體信息的檢索。造成上述信息檢索困難的原因實質在於搜索引擎對要檢索的信息僅僅採用機械的詞語匹配來實現,缺乏知識處理能力和理解能力。也就是說搜索引擎無法處理用戶看來是非常普通的常識性知識,更不能處理隨用戶不同而變化的個性化知識、隨地域不同而變化的區域性知識以及隨領域不同而變化的專業性知識等等。5 搜索引擎未來的發展趨勢
新一代搜索引擎的發展目標就是採用新興的搜索技術為用戶提供更方便易用、更精確的搜索工具來滿足用戶的信息查詢需要。技術上,應該在自然語言理解技術上有所突破,以XML可擴展標記語言為主,並使用向導技術。下面就搜索引擎的發展趨勢談幾點看法。
<strong>答案補充</strong>
5.1 垂直化專業領域搜索 由於社會分工的加大,用戶從事的職業有所不同,不同用戶對信息搜索也往往有自己的專業要求。由於綜合性的搜索引擎收錄各方面、各學科、各行業的信息,因而搜索不相關的信息太多,專業垂直引擎則可以解決這個問題,垂直類搜索引擎是只面向某一特定的領域,專注於自己的特長和核心技術,能夠保證對該領域信息的完全收錄與及時更新。因此,基於專業領域的「垂直搜索引擎」開始成為搜索引擎發展的一個新趨勢。
5.2 智能化搜索 傳統的搜索引擎使用方法是被動搜索,而准確的搜索應建立在對收錄信息和搜索請求的理解之上。顯然,基於自然語言理解技術的搜索引擎由於可以同用戶使用自然語言交談,並深刻理解用戶的搜索請求,則查詢的結果更
加准確。
5.3 關聯式的綜合搜索 所謂關聯式綜合搜索,是這樣一種一站式的搜索服務,它使得用戶在搜索時只需要輸入一次查詢目標,即可以在同一界面得到各種有關聯的查詢結果,這種服務的關鍵在於有一架構在XML基礎上的整合資訊平台。<strong>答案補充</strong>
5.4 個性化搜索 提高搜索精確度的另一個途徑是提供個性化的搜索,也就是將搜索建立在個性化的搜索環境之下,其核心是跟蹤用戶的搜索行為,通過對用戶的不斷了解、分析,積累用戶的搜索個性化數據來提高用戶的搜索效率。
5.5 結構化搜索 所謂結構化搜索,是指充分利用XML等技術使信息結構化,同時使用查詢結構化,從而使搜索的准確度大大提高。
5.6 本土化的搜索 世界上許多著名的搜索引擎都在美國,它們以英語為基礎,完全按他們的思維方式和觀點搜集和檢索資料,這對於全球不同國家的用戶來說是顯然不合適的。各國的文化傳統、思維方式和生活習慣不同,在對於網站的內容的搜索要求上也就存在差異。搜索結果要符合當地用戶的要求,搜索引擎就必須本土化。
5.7 多媒體搜索。隨著寬頻技術的發展,未來的互聯網是多媒體數據的時代,開發出可查詢圖像、聲音、圖片和電影的搜索引擎是一個新的方向,這也將極大地滿足用戶的需求。未來的搜索引擎應該信息量更大、搜索速度更快、搜索精度更高和更能夠滿足用戶的信息查詢需求。
2. 常用的提供搜索引擎的網站有哪些
1、網路搜索
網路搜索是全球最大的中文搜索引擎,2000年1月由李彥宏、徐勇兩人創立於北京中關村,致力於向人們提供「簡單,可依賴」的信息獲取方式。 「網路」二字源於中國宋朝詞人辛棄疾的《青玉案》詩句:「眾里尋他千網路」,象徵著網路對中文信息檢索技術的執著追求。
2、搜狗搜索
搜狗搜索是中國領先的中文搜索引擎,致力於中文互聯網信息的深度挖掘,幫助中國上億網民加快信息獲取速度,為用戶創造價值。
3、360搜索
360綜合搜索,屬於元搜索引擎,是搜索引擎的一種,是通過一個統一的用戶界面幫助用戶在多個搜索引擎中選擇和利用合適的搜索引擎來實現檢索操作,是對分布於網路的多種檢索工具的全局控制機制。
4、谷歌搜索
谷歌搜索引擎是谷歌公司的主要產品,也是世界上最大的搜索引擎之一,由兩名斯坦福大學的理學博士生拉里·佩奇和謝爾蓋·布林在1996年建立。谷歌搜索引擎擁有網站、圖像、新聞組和目錄服務四個功能模塊,提供常規搜索和高級搜索兩種功能。
(2)留學生專搜網站有什麼功能擴展閱讀
隨著搜索引擎技術的日益成熟,當代搜索引擎技術幾乎可以支持各種數據類型的檢索,例如自然語言、智能語言、機器語言等各種語言。目前,不僅視頻、音頻、圖像可以被檢索,而且人類面部特徵、指紋、特定動作等也可以被檢索到。可以想像,在未來幾乎一切數據類型都可能成為搜索引擎的檢索對象。
搜索引擎在捕獲用戶需求的信息的同時,還能對檢索的信息加以一定維度的分析,以引導其對信息的使用與認識。例如,用戶可以根據檢索到的信息條目判斷檢索對象的熱度,還可以根據檢索到的信息分布給出高相關性的同類對象,還可以利用檢索到的信息智能化給出用戶解決方案等。
3. 搜索引擎有什麼作用
搜索引擎是一個對互聯網信息資源進行搜索整理和分類,並儲存在網路資料庫中供用戶查詢的系統,包括信息搜集、信息分類、用戶查詢三部分。
4. 出國留學去信息可以在哪裡看
查出國記錄的方法:
1、要查詢自己的出國記錄,可以翻看護照上的簽證信息,或者在出入境辦事處也可以查到。
2、要查詢他人的出國記錄,因為涉及到別人的隱私,所以必須要有關部門批准,才能去出入境辦事處查詢,否則無法查詢。
出國留學前必須看的網站推薦
國外網站:出國留學前必須看的網站推薦
很多出國留學的學子們對於去國外上學有很多迷茫的地方,例如選擇什麼學校?學校環境怎麼樣?留學的標準是什麼?如何去申請等等一系列的問題在,我們我們結合以前收集到的站點來為各位解惑。
1.UniversitiesAbroad
UniversitiesAbroad:美國院校留學查詢平台是美國一家國外留學院校查詢服務機構,幫助那些有意就讀外國大學的學生聯系目的大學,為他們提供各所大學相關的資料和申請信息。
2.CampusExplorer
CampusExplorer:學校搜索引擎是一個面對學生、家長的校園搜索引擎,提供查過8000所學校的搜索資料,是查找國外留學的必備站點。
3.時差網
ShiCha:第三方出國留學服務平台是一家由美國常春藤大學畢業生創辦的留學服務交易平台。網站致力於整合海外留學生、國內留學顧問以及國內外留學資源,打通留學生和資源之間的距離,將傳統的留學咨詢服務搬至線上,提供新型的優質留學服務。
4.CssaBook
CssaBook:美國大學教科書比價搜索網為是一個在美中國留學生提供美國教科書比價搜索,電子書搜索以及學術搜索服務, 電子書搜索效果超級好,而且對於圖書的比價也很棒。
5.CosMenu
CosMenu:海外留學生在線交流平台是由一群留學生回國創業開發的網站,是一個關於海外留學生學習資料的分享平台和網路問答社區!在我們這個留學平台上,你可以免費上傳學習資料。
6.出國匯
ChuGuoHui:出國匯信息活動匯集平台是一個提供出國留學費用,留學申請,留學中介機構,游學,國際預科,雅思培訓班,移民中介機構,出國勞務等服務,免費為用戶推薦出國留學,雅思托福培訓,游學旅遊,留學預科,出國移民機構。獨特的出國社區,讓您和海外遊子交流、溝通、共享網路世界。
7.MoveHa
MoveHa:國際學生原創租房預定平台是一個致力於海外留學的學生們通過學校或者城市名稱來查詢可以預定的租房網站,該平台支持發布房源信息,找到志同道合的小夥伴,讓出國留學的用戶避免找房子的 苦惱。
8.YouVisit
YouVisit:在線虛擬大學旅遊參觀網是一個基於大學高校線上參觀的虛擬平台,其主要目的是為招生服務,只不過他們先把參觀學校搬上網路,想要留學的用戶先查看目的高校,線上參觀後再決定是否留學。
5. 在哪可以找留學生照片
Pixabay網站可以找留學生照片
這是一家提供無版權圖片素材的圖片提供商。
不僅有圖片,還有矢量圖,插畫,視頻。
與其他國外網站不同的是,它可以支持中文關鍵詞的搜索。
喜歡一張圖,想要下載的時候,一般都會有三到四種尺寸大小可供選擇。不同的尺寸大小也對應著不同的內存大小。
6. 搜索器有什麼作用
搜索器是一個對互聯網信息資源進行搜索整理和分類,並儲存在網路資料庫中供用戶查詢的系統,包括信息搜集、信息分類、用戶查詢三部分。
7. 悉尼留學生租房求經驗分享,大家都是怎麼找到
大多數情況下,初來悉尼留學的同學們,一定都是從租房子開始的,畢竟國外的學校宿舍真的很難申請。從學校周圍的合租房,到一個小小的Apartment,總之,留學生們的悉尼生活都離不開「租房」這件事。
在確定要去悉尼留學之後就要開始准備租房的事情了,畢竟租房這件事直接決定了你在悉尼留學期間的生活質量。
國內外也涌現出了不少留學生租房網站,專為留學生提供海外租房服務。那麼留學生們肯定會好奇海外租房哪個網站好,該怎麼辨別呢?
海外租房網站哪個好大概是留學生們租房的時候最想要了解的一個問題了,海外的租房網站雖然數量比較多,但是真正適合留學生使用的方便又靠譜的並不是很多。當你在挑選海外租房網站的時候最簡單的就是要看是否是正規的公司,再看看公司成立的時間以及公司是否在正常運營,如果實在不放心可以到公司實地考察一下。其實大多數國內的海外租房網站都是比較靠譜的。留學生可以主要從他們的網站功能以及房源的信息等方便來考慮是否合作。
以家1號HOMPLUS的官網為例,首頁可以直接看到熱門房源以及專為留學生提供的生活服務,當然同學們也可以通過搜索功能直接搜索想要租房的城市。
點進房源詳情頁可以看到房源圖片,房源的介紹信息,以及設施價格等,還有實時地圖一目瞭然,如果確定想要這套房源可以直接在線申請預定房源。
8. 百度網站的功能有哪些
http://..com/question/24947931.html
以下文字有部分改動!
主要搜索引擎
Google簡體中文
http://www.google.cn/
Google 的使命是整合全球范圍的信息,使人人皆可訪問並從中受益。完成該使命的第一步就是 Google 的創始人 Larry Page 和 Sergey Brin 共同開發的全新的在線搜索引擎。該技術誕生於斯坦福大學的一個學生宿舍里,然後迅速傳播到全球的信息搜索者。 Google 目前被公認為全球最大的搜索引擎,它提供了簡單易用的免費服務,用戶可以在瞬間返回相關的搜索結果。
在訪問 Google 主頁時,您可以使用多種語言查找信息、查看新聞標題、搜索超過 10 億幅的圖片,並能夠細讀全球最大的 Usenet 消息存檔,其中提供的帖子超過 10 億個,時間可以追溯到 1981 年。
Google搜索引擎入門到精通 Google愛好者論壇
網路
http://www..com
網路搜索引擎擁有目前世界上第二大的中文搜索引擎,總量超過3億頁以上,並且還在保持快速的增長。網路搜索引擎具有高准確性、高查全率、更新快以及服務穩定的特點,能夠幫助廣大網民快速的在浩如煙海的互聯網信息中找到自己需要的信息,因此深受網民的喜愛。
網路搜索引擎入門到精通 網路超級搜霸下載 網路愛好者論壇
雅虎
http://www.yahoo.com.cn/
2005年11月9日 阿里巴巴公司在完成對雅虎中國的收購與整合之後,重新發布了進入中國市場7年之久的雅虎網站, 未來雅虎在中國的業務重點方向將全面轉向搜索領域,這也是自8月11日阿里巴巴宣布收購雅虎中國時就從沒改變的方向。阿里巴巴CEO馬雲表示: 阿里巴巴在搜索領域既有決心更有信心,在中國,雅虎就是搜索,搜索就是雅虎。
雅虎搜索引擎入門到精通 雅虎愛好者論壇
中國搜索
http://www.zhongsou.com/
2003年12月23日,剛剛上市的慧聰國際集團重拳出擊,原慧聰搜索正式獨立運做,成立了中國搜索,全力打造中文搜索第一品牌。
中搜入門到精通 中搜愛好者論壇
搜狗搜索
http://www.sogou.com/
2004年8月3日,搜狐正式推出全新獨立域名專業搜索網站「搜狗」,成為全球首家第三代中文互動式搜索引擎服務提供商。提供全球網頁,新聞,商品,分類網站等搜索服務。
搜狗搜索引擎入門到精通 搜狗愛好者論壇
愛問搜索引擎
http://iask.com/
「愛問」搜索引擎產品由全球最大的中文網路門戶新浪匯集技術精英、耗時一年多完全自主研發完成,採用了目前最為領先的智慧型互動搜索技術,充分體現了人性化應用理念,將給網路搜索市場帶來前所未有的挑戰。
愛問搜索入門到精通 愛問愛好者論壇
其它搜索引擎
網易搜索引擎
http://so.163.com/
網易在國內首創「網易開放式目錄管理系統(ODP)」。提供網頁搜索、分類網站、圖片搜索、時尚搜索,其網頁搜索結果由Google提供。網易搜索引擎入門到精通
TOM搜索引擎
http://i.tom.com/
提供網頁、網站、圖片、MP3、新聞搜索,其網頁搜索結果由網路搜索提供。
21CN搜索引擎
http://search.21cn.com/
提供網頁、網站、圖片、MP3、FLASH、電影、軟體、影集搜索,其網頁搜索結果由網路提供。
SOSO搜搜
http://www.soso.com/
QQ推出的獨立搜索網站。提供綜合、網頁、圖片、論壇、音樂、搜吧等搜索服務。
中華搜索
http://sou.china.com/
2006年1月18日,中華網推出新版的搜索引擎網站,目前提供網頁、新聞、本地、圖片、音樂、論壇搜索等服務。
北京大學天網中英文搜索引擎
http://e.pku.e.cn/
MSN中文搜索(測試版)
http://beta.search.msn.com.cn/
網頁搜索功能不僅提供網頁鏈接列表,而且能將您鏈接到您要查找的答案和信息。為實現這點,新的 MSN 搜索使用新的搜索引擎、索引和爬網軟體,它們都是建立在 Microsoft 技術的基礎之上的。
9. 留學生找工作用留信網靠譜嗎
留信網專業人才入庫就是為入職找工作量身定做的,留信網有專業的就業託管和內推就業。
就業託管是用人單位可以根據所需人才的教育層次、專業方向、留學國家、學校名稱和年齡段精準招聘。
內推就業是為海內外大學是提供一站式高端的求職培訓服務,對學生專業分析,並規劃以後的專業選擇及職業發展,獲得名企offer。
留信網還有一個是歸國人員就業託管平台,這個主要是針對用人單位在留信網通過專業方向和教育層次等基本信息選擇適合的求職者。
留信網入庫首先不是學歷認證,是留學生專業人才入庫,可以查詢到學生在國外讀書的基本信息和專業的分析報告,分析報告包括成績單的翻譯和成績與其他學生成績相比的分析圖還有詳細的出入境情況(包括每一年的具體天數等) ,留信網的專業人才入庫一般時間為3-5個工作日,入庫成功後有紙質證明和紙質分析報告。
總體來說,留信網對於留學回國的學生在工作方面用處很大,可以作為一個很重要的輔助平台。
10. 搜索引擎的主要功能是什麼
搜索引擎主要的功能是用戶在數百萬計的網站中快速查找自己需要的網
站搜索引擎是網際網路上的一個WWW伺服器,它使得用戶在數百萬計的網站中快速查找信息成為可能。目前,網際網路上的搜索引擎很多,它們都可以進行如下工作。①能主動地搜索在網際網路中其他WWW伺服器的信息,並收集到搜索引擎伺服器中。②能對收集的信息分類整理,自動索引並建立大型搜索引擎資料庫。③能以瀏覽器界面的方式為用戶進行信息查詢。用戶通過搜索引擎的主機名進入搜索引擎以後,只需輸入相應的關鍵字即可找到相關的網址,並能提供相關的鏈接。........................................................................................
■ 全文搜索引擎
在搜索引擎分類部分我們提到過全文搜索引擎從網站提取信息建立網頁資料庫的概念。搜索引擎的自動信息搜集功能分兩種。一種是定期搜索,即每隔一段時間(比如Google一般是28天),搜索引擎主動派出「蜘蛛」程序,對一定IP地址范圍內的互聯網站進行檢索,一旦發現新的網站,它會自動提取網站的信息和網址加入自己的資料庫。
另一種是提交網站搜索,即網站擁有者主動向搜索引擎提交網址,它在一定時間內(2天到數月不等)定向向你的網站派出「蜘蛛」程序,掃描你的網站並將有關信息存入資料庫,以備用戶查詢。由於近年來搜索引擎索引規則發生了很大變化,主動提交網址並不保證你的網站能進入搜索引擎資料庫,因此目前最好的辦法是多獲得一些外部鏈接,讓搜索引擎有更多機會找到你並自動將你的網站收錄。
當用戶以關鍵詞查找信息時,搜索引擎會在資料庫中進行搜尋,如果找到與用戶要求內容相符的網站,便採用特殊的演算法——通常根據網頁中關鍵詞的匹配程度,出現的位置/頻次,鏈接質量等——計算出各網頁的相關度及排名等級,然後根據關聯度高低,按順序將這些網頁鏈接返回給用戶。
........................................................................................
■ 目錄索引
與全文搜索引擎相比,目錄索引有許多不同之處。
首先,搜索引擎屬於自動網站檢索,而目錄索引則完全依賴手工操作。用戶提交網站後,目錄編輯人員會親自瀏覽你的網站,然後根據一套自定的評判標准甚至編輯人員的主觀印象,決定是否接納你的網站。
其次,搜索引擎收錄網站時,只要網站本身沒有違反有關的規則,一般都能登錄成功。而目錄索引對網站的要求則高得多,有時即使登錄多次也不一定成功。尤其象Yahoo!這樣的超級索引,登錄更是困難。(由於登錄Yahoo!的難度最大,而它又是商家網路營銷必爭之地,所以我們會在後面用專門的篇幅介紹登錄Yahoo雅虎的技巧)
此外,在登錄搜索引擎時,我們一般不用考慮網站的分類問題,而登錄目錄索引時則必須將網站放在一個最合適的目錄(Directory)。
最後,搜索引擎中各網站的有關信息都是從用戶網頁中自動提取的,所以用戶的角度看,我們擁有更多的自主權;而目錄索引則要求必須手工另外填寫網站信息,而且還有各種各樣的限制。更有甚者,如果工作人員認為你提交網站的目錄、網站信息不合適,他可以隨時對其進行調整,當然事先是不會和你商量的。
目錄索引,顧名思義就是將網站分門別類地存放在相應的目錄中,因此用戶在查詢信息時,可選擇關鍵詞搜索,也可按分類目錄逐層查找。如以關鍵詞搜索,返回的結果跟搜索引擎一樣,也是根據信息關聯程度排列網站,只不過其中人為因素要多一些。如果按分層目錄查找,某一目錄中網站的排名則是由標題字母的先後順序決定(也有例外)。
目前,搜索引擎與目錄索引有相互融合滲透的趨勢。原來一些純粹的全文搜索引擎現在也提供目錄搜索,如Google就借用Open Directory目錄提供分類查詢。而象 Yahoo! 這些老牌目錄索引則通過與Google等搜索引擎合作擴大搜索范圍(注)。在默認搜索模式下,一些目錄類搜索引擎首先返回的是自己目錄中匹配的網站,如國內搜狐、新浪、網易等;而另外一些則默認的是網頁搜索,如Yahoo。