政府網(wǎng)站普查監(jiān)測小技巧,“為什么很多政府網(wǎng)站群負(fù)責(zé)人說網(wǎng)站群普查考核加入更新量指標(biāo)吃力不討好,總有對(duì)更新量數(shù)據(jù)準(zhǔn)確性的投訴?”
雖然網(wǎng)站更新量監(jiān)測是政府網(wǎng)站監(jiān)測考核的核心指標(biāo),但宜采用“大時(shí)間跨度全站更新情況定性統(tǒng)計(jì)”或“全站更新量歷史回溯統(tǒng)計(jì)”方法,不宜做“每日精確統(tǒng)計(jì)”,因?yàn)榫W(wǎng)站更新量統(tǒng)計(jì)在較小的時(shí)間跨度內(nèi),無法實(shí)現(xiàn)精確統(tǒng)計(jì)。我們認(rèn)為這其中的原因很復(fù)雜,有技術(shù)實(shí)現(xiàn)問題,也有人為因素,其中人為因素更多。舉例如下:
■ 有分站因?yàn)闃I(yè)務(wù)流程原因、或?yàn)榱藸幦∑詹楸O(jiān)測達(dá)標(biāo),或者為了取得更好監(jiān)測考核成績,可能會(huì)在月底最后一天將前三十天數(shù)據(jù)一并補(bǔ)錄到網(wǎng)站上,而發(fā)布日期則被人為分散在1-30日,這造成按日統(tǒng)計(jì)的更新量監(jiān)測軟件對(duì)該分站之前每天的監(jiān)測結(jié)果出現(xiàn)漏報(bào)。這種“補(bǔ)錄信息”情況在網(wǎng)站普查監(jiān)測中并非個(gè)案,有相當(dāng)大比例的網(wǎng)站會(huì)因各種原因采用這種網(wǎng)站更新方式,也不能說這種方法是“考核作弊”。此種更新方式造成的“更新量準(zhǔn)確性投訴”是最多的,從技術(shù)角度也很難避免。
■ 還有分站將同一信息在多個(gè)欄目多次發(fā)布,造成認(rèn)定規(guī)則歧義。網(wǎng)站更新軟件一般將頁面地址相同的信息視為一條信息,但有些網(wǎng)站因各種原因對(duì)同一條信息在不同欄目中進(jìn)行引用,造成軟件數(shù)量計(jì)算上的“漏報(bào)”,或者是“信息的欄目歸類錯(cuò)誤”。此類投訴數(shù)量居于第二。
■ 分站頻繁的欄目格式變動(dòng)或改版也是造成更新量監(jiān)測數(shù)據(jù)不準(zhǔn)原因。目前的網(wǎng)頁掃描軟件,如果要得到精確欄目更新量數(shù)據(jù),一般都采用人工配置欄目映射的方法。但是如果目標(biāo)網(wǎng)站欄目調(diào)整,而欄目配置沒有隨之調(diào)整就會(huì)造成網(wǎng)頁抓取漂移,欄目更新量統(tǒng)計(jì)錯(cuò)誤的情況。對(duì)于大型網(wǎng)站群(有近百個(gè)分站),這種網(wǎng)站欄目或格式調(diào)整造成漂移的情況幾乎每周都會(huì)發(fā)生,無法確保每次分站改版都能第一時(shí)間告知監(jiān)測單位及時(shí)變更欄目配置。這也是造成網(wǎng)站更新量監(jiān)測不準(zhǔn)的重要原因。
以上幾點(diǎn)可以充分證明“實(shí)時(shí)精確的更新量統(tǒng)計(jì)”在實(shí)際操作中難以實(shí)現(xiàn),或者要付出極大成本,“非不為也,實(shí)不能也”。
|