11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來騰訊云選購吧!
TF-IDF算法已經(jīng)被很多專業(yè)的SEO工作者所熟知,它是一種用于資訊檢索與資訊探勘的常用加權(quán)技術(shù),運用到網(wǎng)頁分析中就是對于網(wǎng)頁中的相關(guān)關(guān)鍵詞進行加權(quán),分析眾多網(wǎng)頁中某個特定關(guān)鍵詞的相關(guān)網(wǎng)頁關(guān)鍵詞權(quán)值,并在最后的排序算法中給予科學的依據(jù)。
TF-IDF算法是一種統(tǒng)計算法,用于對檢索的加權(quán)。簡單的講其作用是評估一字詞對于一個文件的重要程度。在SEO的衍生應(yīng)用中,我們可以這么去理解上面這段話:在一個公司里,有10個SEOer,每個人都寫了一篇關(guān)于SEO的文章,并且把這些文章都放在了一個文檔集里。
當用戶在搜索引擎搜索一個詞的時候,它會將詞去和索引庫內(nèi)的文檔去進行匹配計算,將和詞語最相關(guān)的一定數(shù)量的文檔取出,參與后續(xù)的排名計算。此處“最相關(guān)”的量化指標被成為“權(quán)值”,而對于絕大多數(shù)搜索引擎,權(quán)值的計算中TF*IDF框架都是比較重要的一部分。其中被主要考慮到的因子為:詞頻TF和逆文檔頻率IDF。