海口網站(zhàn)建設網

百度搜索引擎兩項重要的專利


百度有兩項專利技(jì)術(shù),一(yī)項是搜索引擎超鏈分析技(jì)術(shù);另一(yī)項是搜索引擎投票算(suàn)法,那麽我們就(jiù)根據百度搜索引擎排名的核心專利技(jì)術(shù)進行分析吧(ba)!我們租一(yī)個(gè)簡單概況:超鏈分析技(jì)術(shù)其實是将抓取的頁面包含超鏈接錨文本作為(wèi)了衡量網頁相(xiàng)關性及權重高(gāo)低(dī)的最基礎算(suàn)法。任何一(yī)個(gè)搜索引擎都可以收錄并索引N多(duō)網頁快照(zhào),但是快照(zhào)之間的相(xiàng)關性及頁面權重如何評級?例如sina、souhu、163等權威網站(zhàn)上(shàng)有好排名的的超鏈接,那麽至少說明了該頁面權重很高(gāo)對吧(ba)?假如不但有超鏈接還(hái)有錨文本那麽相(xiàng)關性就(jiù)産生(shēng)了對吧(ba)?例如這些權威網站(zhàn)裡(lǐ)有我一(yī)個(gè)“搜索引擎優化”的超鏈接至少能(néng)知道我網站(zhàn)的主體思想吧(ba)?這就(jiù)是超鏈分析技(jì)術(shù)。超鏈分析算(suàn)法兩個(gè)核心:一(yī)個(gè)是超鏈接的頁面評級判斷;另一(yī)個(gè)是錨文本相(xiàng)關性判斷;這就(jiù)是李彥宏的超鏈分析專利。

一(yī)、搜索引擎超鏈分析算(suàn)法
超鏈分析專利其實就(jiù)是現實生(shēng)活中類似于鏈接關系的應用。要判斷哪個(gè)頁面最具權威性,不能(néng)光(guāng)看(kàn)頁面自(zì)己怎麽說,還(hái)要看(kàn)其他頁面怎麽評價。李彥宏1997年(nián)就(jiù)提交了一(yī)份名為(wèi)“超鏈文件(jiàn)檢索系統和方法”的專利申請,這比GOOGLE創始人發明PR要早得多(duō),不得不說這是非常具有前瞻性的研究工(gōng)作。在這份專利中,李彥宏提出了與傳統信息檢索系統不同的基于鏈接的排名方法。這個(gè)系統除了索引頁面之外,還(hái)建立一(yī)個(gè)鏈接詞庫,記錄鏈接錨文字的一(yī)些相(xiàng)關信息,如錨文字中包含哪些關鍵詞,發出鏈接的頁面索引,包含特定錨文字的鏈接總數,包含特定關鍵詞的鏈接都指向哪些頁面。詞庫不僅包含關鍵詞原型,也包含同一(yī)個(gè)詞幹的其他衍生(shēng)關鍵詞。
根據這些鏈接數據,尤其是錨文字,計算(suàn)出基于鏈接的文件(jiàn)相(xiàng)關性。在用戶搜索時,将得到(dào)的基于鏈接的相(xiàng)關性與基于關鍵詞匹配的傳統相(xiàng)關性綜合使用,得到(dào)更準确的排名。
在今天看(kàn)來,這種基于鏈接的相(xiàng)關性計算(suàn)是搜索引擎的常态,每個(gè)SEO人員(yuán)都知道。但是在十三四年(nián)前,這無疑是非常創新的概念。當然現在的搜索引擎算(suàn)法對鏈接的考慮,已經不僅僅是錨文字,實際上(shàng)要複雜(zá)的多(duō)。一(yī)個(gè)與根據超鏈指向的查詢索引文檔相(xiàng)關,用于檢索文檔的搜索引擎。它的索引器(qì)遍曆超文本數據庫并尋找包括超鏈指向的文檔地址與每個(gè)超鏈的錨文本在内的超文本信息。超文本信息是貯存在一(yī)個(gè)倒排索引文件(jiàn)裡(lǐ),這個(gè)倒排索引文件(jiàn)亦可用于計算(suàn)對于各超鏈指向的特定文檔鏈接向量。輸入查詢時候,搜索引擎找到(dào)錨文本裡(lǐ)含有查詢詞的全部文檔的向量。此外計算(suàn)了查詢向量,然後算(suàn)出查詢向量跟每個(gè)文檔鏈接向量的點積。特定文檔相(xiàng)關點積的加總确定每一(yī)個(gè)文檔的相(xiàng)關性排名這份專利所有人是李彥宏當時所在的公司,發明人是李彥宏本人。

 

二、搜索引擎投票排名算(suàn)法

這個(gè)算(suàn)法是在超鏈分析技(jì)術(shù)之後延伸的一(yī)個(gè)投票記錄算(suàn)法,搜索引擎排序規則需要在搜索展現與訪問之間做出有效分析、對比并記錄的.無論是百度排名還(hái)是google等搜索引擎結果展示并不是很容易判斷關鍵詞與快照(zhào)的權威性,如何判斷關鍵詞與實際快照(zhào)的權威性呢(ne)?一(yī)定是從(cóng)用戶出發,根據有效搜索做出判斷,人自(zì)然檢索一(yī)個(gè)關鍵詞并訪問結果時,用戶經常會(huì)找不到(dào)自(zì)己想要的結果,所以當人自(zì)然檢索後雖然訪問到(dào)了您的網站(zhàn),但不一(yī)定是有效搜索,因為(wèi)最後搜索不一(yī)定會(huì)停留到(dào)您的網站(zhàn)上(shàng),假如:您搜索一(yī)個(gè)詞,打開(kāi)第一(yī)位結果,發現不是你想要的,您肯定會(huì)繼續訪問下(xià)面的結果,直到(dào)找到(dào)你您需要的結果後才停止訪問剩餘結果(也有可能(néng)您根本找不到(dào)自(zì)己想要的結果)當您找到(dào)需要的結果後自(zì)然不會(huì)繼續訪問剩餘的結果,最後停留的目标頁面被稱之為(wèi)有效搜索;雖然這個(gè)思路(lù)和算(suàn)法還(hái)存在很多(duō)缺陷,但是大部分搜索引擎還(hái)是以這個(gè)算(suàn)法為(wèi)最佳算(suàn)法,因為(wèi)搜索引擎無法判斷出來關鍵詞與快照(zhào)的權威性。隻有通(tōng)過用戶訪問需求進行對比分析、加以頁面評級增加或減少!

快速提交您的需求


咨詢類型:


您的姓名: *


您的手機(jī): *


咨詢問題:


    

留下(xià)您的聯系信息,我們會(huì)有專業(yè)營銷顧問與您聯系,或直接拔打電(diàn)話 0898-66960731 一(yī)對一(yī)為(wèi)您詳細介紹相(xiàng)關産品和服務,幫您更高(gāo)效的開(kāi)展網絡營銷。