實時的靜態(tài)化。策略一為非實時的靜態(tài)化策略, 然而它不會很好地適用于需要經常更新數(shù)據(jù)且對搜索引擎實時性要求較高的大型門戶網(wǎng)站。例如大型的新聞網(wǎng)站, 網(wǎng)站經常會發(fā)布新的文章或者是公告,并且需要搜索引擎 能夠盡快地將新聞的鏈接和關鍵詞加入索引,那么頻繁更新緩存頁面的服務器開銷會很大,并且緩存文件所占的空間也會越來越大, 因此針對此種情況提出了實時的靜態(tài)化策略。
請求頁面時即時生成定時銷毀的靜態(tài)頁面緩存,爬蟲機器人請求時, 首先查找是否存在緩存以及頁面緩存是否失效,如果緩存有效則返回靜態(tài)池中的靜態(tài)頁面,反之則生成新的靜態(tài)頁面或者更新靜態(tài)池內的靜態(tài)頁面, 修改后的實時靜態(tài)化策略原理..同時,此實時靜態(tài)化策略也改進了頁面的緩存方式,它對于不同緩存頁面的關鍵字設置不同的清理權重(即更新頻率高低,需要人工設置)。 較為穩(wěn)定的頁面———例如首頁菜單、公司信息等展示頁面可以設定較小的權重值;更新比較頻繁的頁面,例如新聞公告、發(fā)布消息的匯總頁則可以設定較大的權重值。權重越小的靜態(tài)頁面的緩存時間越久,可以保存一天甚至是一周,這樣可以大幅節(jié)省頻繁生成此類緩存的資源浪費;而權重越大的靜態(tài)頁面由于更新頻繁,所以緩存時間越短,考慮到搜索引擎的爬蟲機器人不會實時抓取信息,而是間隔一段時間(一般為四至五小時)才會重新抓取,因此可以在兩到三小時或更短的時間后清理此類緩存。
這里的緩存也可能會清理失敗,所以在判斷緩存是否存在的同時也需要檢查靜態(tài)頁面的失效時間, 避免過時的舊頁面緩存影響新發(fā)布信息的檢索。策略還規(guī)定了當網(wǎng)站重新部署后強制清理所有緩存。