政府網站普查監測小技巧,“為什么很多政府網站群負責人說網站群普查考核加入更新量指標吃力不討好,總有對更新量數據準確性的投訴?”
雖然網站更新量監測是政府網站監測考核的核心指標,但宜采用“大時間跨度全站更新情況定性統計”或“全站更新量歷史回溯統計”方法,不宜做“每日精確統計”,因為網站更新量統計在較小的時間跨度內,無法實現精確統計。我們認為這其中的原因很復雜,有技術實現問題,也有人為因素,其中人為因素更多。舉例如下:
■ 有分站因為業務流程原因、或為了爭取普查監測達標,或者為了取得更好監測考核成績,可能會在月底最后一天將前三十天數據一并補錄到網站上,而發布日期則被人為分散在1-30日,這造成按日統計的更新量監測軟件對該分站之前每天的監測結果出現漏報。這種“補錄信息”情況在網站普查監測中并非個案,有相當大比例的網站會因各種原因采用這種網站更新方式,也不能說這種方法是“考核作弊”。此種更新方式造成的“更新量準確性投訴”是最多的,從技術角度也很難避免。
■ 還有分站將同一信息在多個欄目多次發布,造成認定規則歧義。網站更新軟件一般將頁面地址相同的信息視為一條信息,但有些網站因各種原因對同一條信息在不同欄目中進行引用,造成軟件數量計算上的“漏報”,或者是“信息的欄目歸類錯誤”。此類投訴數量居于第二。
■ 分站頻繁的欄目格式變動或改版也是造成更新量監測數據不準原因。目前的網頁掃描軟件,如果要得到精確欄目更新量數據,一般都采用人工配置欄目映射的方法。但是如果目標網站欄目調整,而欄目配置沒有隨之調整就會造成網頁抓取漂移,欄目更新量統計錯誤的情況。對于大型網站群(有近百個分站),這種網站欄目或格式調整造成漂移的情況幾乎每周都會發生,無法確保每次分站改版都能第一時間告知監測單位及時變更欄目配置。這也是造成網站更新量監測不準的重要原因。
以上幾點可以充分證明“實時精確的更新量統計”在實際操作中難以實現,或者要付出極大成本,“非不為也,實不能也”。
|