關(guān)鍵詞是網(wǎng)站優(yōu)化的核心概念之一。在網(wǎng)站優(yōu)化的實(shí)踐中,大量的工作集中在關(guān)鍵詞上。本文試圖從結(jié)合搜索技術(shù)原理和網(wǎng)站優(yōu)化實(shí)踐的角度,總結(jié)seo內(nèi)容頁面關(guān)鍵詞布局的具體落地方法。
如何在網(wǎng)站優(yōu)化后的內(nèi)容頁面中布局關(guān)鍵詞?
介紹搜索引擎的技術(shù)原理。
搜索引擎的核心底層技術(shù)是將用戶的查詢詞切割成自然語言中有意義的短語,然后從索引數(shù)據(jù)庫中找出全部或部分短語并返回結(jié)果。
正常的搜索思路是取關(guān)鍵詞,找出內(nèi)容是否包含關(guān)鍵詞。假設(shè)你想從帶有序列號的頁面中搜索包含“關(guān)鍵詞布局”的頁面。搜索頁面全文搜索詞“關(guān)鍵詞布局”,返回包含該詞的頁面序列號。但是如果你要搜索幾百萬個頁面,會非常慢,所以我們發(fā)明了倒排索引的思想。(下圖中的數(shù)據(jù)不是實(shí)際數(shù)據(jù),僅供說明)
僅憑這一點(diǎn)還不足以對搜索結(jié)果進(jìn)行排名。在no _的情況下,一個關(guān)鍵詞在一個網(wǎng)頁上出現(xiàn)的次數(shù)越多,就越能代表該網(wǎng)頁的特征。前提是過濾掉停用詞(停用詞是幾乎每個網(wǎng)頁上都有的詞,但不能表達(dá)任何特定的意思,比如“的”、“是”、“了”等等)。如果能把關(guān)鍵詞在網(wǎng)頁中出現(xiàn)的頻率信息加入倒排索引表(縮寫:wordfrequencyTF),就可以對網(wǎng)頁進(jìn)行排序。如下圖所示:當(dāng)我們的查詢詞分為“關(guān)鍵詞”和“關(guān)鍵詞”時,可以按照(,,,)對相關(guān)頁面進(jìn)行排序。
假設(shè)我有兩頁紙。倒排索引的信息如下:
我們搜索“如何布局關(guān)鍵詞”,關(guān)鍵詞是“關(guān)鍵詞”、“如何”、“布局”。其中“關(guān)鍵詞”、“如何”、“布局”出現(xiàn)了兩次,分別在頁面上出現(xiàn)了兩次和兩次,共;在第二頁,“如何”和“布局”出現(xiàn)了幾次。按照上述邏輯,最終的搜索結(jié)果排名為(,),顯然不是一個理想的排名結(jié)果。page的主題很明顯是關(guān)于“如何布局”。這時候就有必要引入倒排文檔頻率索引(IDF)來解決這個問題。
關(guān)鍵詞位置信息也是一個重點(diǎn)。一般來說,標(biāo)題中的關(guān)鍵詞比正文中的相同關(guān)鍵詞更能體現(xiàn)網(wǎng)頁的主題特征。這就是H標(biāo)簽如此重要的原因。搜索引擎還可以確定導(dǎo)航、文本、側(cè)邊欄等的位置。根據(jù)代碼布局和噪聲比(比如停用詞出現(xiàn)的頻率)。位置信息將被標(biāo)記在倒排索引列表中,以參與排序決策。
除此之外,還有一些其他常用的技術(shù)方法,比如:兩個詞索引/短語索引,“如何布局關(guān)鍵詞”不需要分成三個短詞,也可以分為“關(guān)鍵詞布局”、“如何”和“如何布局關(guān)鍵詞”等等;組合查找相關(guān)的詞,關(guān)鍵詞,怎么樣,怎樣等。
當(dāng)然,在實(shí)際操作中,大型現(xiàn)代搜索引擎的倒排索引模型要復(fù)雜得多,很多其他因素(其中一個是超鏈接分析)都涉及到排序算法,受限于篇幅和作者水平,所以無法規(guī)模化。
如何放置關(guān)鍵詞
題目中一定要有關(guān)鍵詞,但一定不能有完整的問題。
因?yàn)樗阉饕鏁⒉樵冊~分成n個以上的詞、雙詞和短語,并添加相關(guān)詞將查詢合并到查詢中,所以標(biāo)題中的關(guān)鍵詞不一定是完整的問題,通常是“XXX哪家公司比較好”。標(biāo)題不一定需要完整的文字。即使標(biāo)題包含完整的句子,也不匹配任何其他完整的句子。一個高質(zhì)量的網(wǎng)頁通常可以匹配上百個長尾關(guān)鍵詞。顯然,一個標(biāo)題不可能包含所有這些內(nèi)容。標(biāo)題的另一個重要作用是吸引點(diǎn)擊率,這也是排名的一個因素。但核心詞“XXX”、“好”、“公司”必須出現(xiàn)。
作者:徐州百都網(wǎng)絡(luò) | 來源: | 發(fā)布于:2022-03-30 10:52:29