唐山網(wǎng)站優(yōu)化的基本架構(gòu)要如何設計

閱讀 ?·? 發(fā)布日期 2018-11-08 16:35 ?·? admin

作為一名優(yōu)秀的唐山網(wǎng)站優(yōu)化工作者,應該了解搜索引擎的工作原理,比如基本的架構(gòu)。

今天,唐山網(wǎng)站優(yōu)化的是《搜索引擎的基本架構(gòu)》。希望本次的SEO技術(shù)培訓對大家有所幫助。

一、什么是搜索引擎的架構(gòu)?

搜索引擎架構(gòu)可以當作軟件架構(gòu)來理解。

① 軟件架構(gòu)

百度百科對于軟件架構(gòu)的描述如下:

軟件架構(gòu),是指一系列相關(guān)的抽象模式,用于指導大型軟件系統(tǒng)各個方面的設計。

② 搜索引擎架構(gòu)

那么唐山網(wǎng)站優(yōu)化搜索引擎的架構(gòu),就是用于指導搜索引擎系統(tǒng)中重要的組件以及組件之間關(guān)系而設計的抽象模式。

二、設計搜索引擎架構(gòu)的目標是什么?

唐山網(wǎng)站優(yōu)化工作者應該知道為什么要設計搜索引擎架構(gòu),主要有以下兩點:

① 搜索效果

搜索引擎致力于優(yōu)化用戶搜索體驗,當用戶搜索某個詞之后,可以給予用戶更多更精準的結(jié)果。這就是在質(zhì)量層面上的目標。

② 搜索效率

搜索引擎追求更快地展現(xiàn)出用戶查詢詞的搜索結(jié)果,也是為了提升用戶搜索體驗,試想如果我們搜索一個詞,搜索引擎一分鐘后才顯示出結(jié)果,這樣的搜索引擎在這個時代是要被淘汰的。這就是在速度層面上的目標。

小結(jié):因為用戶需要一個高效的搜索引擎系統(tǒng),對唐山網(wǎng)站優(yōu)化搜索引擎有效果和效率的要求,所以,結(jié)構(gòu)的目標也就是這兩點了。

三、搜索引擎的基本架構(gòu)是什么?

對于唐山網(wǎng)站優(yōu)化工作者而言,只需要在抽象模式上了解搜索引擎架構(gòu)即可,也無需關(guān)注過多的數(shù)學公式與算法。

搜索引擎基本架構(gòu)主要有索引處理和查詢處理。

① 索引處理

索引過程主要由以下幾個組件來完成:

1)文本采集組件

文本采集組件,主要用于發(fā)現(xiàn)、存儲和傳遞文檔。

2)文本轉(zhuǎn)換組件

文本轉(zhuǎn)換組件,主要用于提取文檔中所有內(nèi)容和元數(shù)據(jù),同時將文本轉(zhuǎn)換為索引項。

元數(shù)據(jù)可以理解為頁面的基本參數(shù),如類型、結(jié)構(gòu)、多少字等等。

索引項,又可以稱之為特征,是對文檔內(nèi)容的一部分,符合要求的文檔的索引會被存放在索引表中用于搜索。

3)索引創(chuàng)建組件

索引創(chuàng)建組件,利用文本轉(zhuǎn)換組件輸出的文檔和索引項,創(chuàng)建索引表,從而實現(xiàn)快速搜索。

索引的創(chuàng)建非常重要,尤其是針對互聯(lián)網(wǎng)的信息爆炸時代,對于新的文檔加入時,應高效完成索引創(chuàng)建。為了實現(xiàn)高效,一般都采用的倒排索引。

② 查詢處理

查詢處理主要由以下幾個組件來完成:

1)用戶交互組件

用戶交互組件,提供了用戶查詢和搜索引擎展現(xiàn)搜索結(jié)果之間的接口。

搜索引擎接收到用戶的查詢詞后,在索引庫中找到相關(guān)文檔,按照程序認為的最合理的索引排序結(jié)果展現(xiàn)給用戶。

2)排序組件

排序組件,從用戶交互組件中獲得查詢詞,并且根據(jù)一定的模型給出一個得分從高到低排序的文檔。

排序的高效依賴于搜索引擎檢索技術(shù)的高低,排序的質(zhì)量取決于搜索引擎的檢索模式。

3)評價組件

評價組件,主要用于評測和評價搜索引擎系統(tǒng)的效果和效率的目標。

一來可以統(tǒng)計大量搜索日志來記錄和分析用戶行為,二來評價的結(jié)果用來調(diào)整和改善排序組件的性能,從而提升用戶的搜索體驗度。