分析研判篇_第十一章 網絡輿情研判與預測
第十一章 網絡輿情研判與預測
網絡輿情研判與預測在網絡輿情信息工作中占據重要位置,發揮著重要作用。網絡輿情信息分析研判必須要利用科學的理論和方法,在搜集整理大量的輿情信息基礎之上,通過分析材料敘述的表麵現象,挖掘網絡輿情背後錯綜複雜的本質,進而了解網絡輿情的運動規律。隻有準確地研判與預測,網絡輿情工作才能充分發揮其作用。
第一節 網絡輿情研判
網絡輿情的發展往往受一定的內因推動,承載著特定的訴求,通過各種媒介載體在互聯網中傳播、擴散,並持續發酵。網絡輿情分析研判就是對網絡上苗頭性、傾向性的網絡輿情,尤其是即將或已經形成網絡熱點的輿情,去粗取精、分類整理和研究分析,探究其傳播路徑、趨勢和影響力,並將研判評估結果形成文字上報,向相關部門提供輿情引導策略。
一、網絡輿情研判的重要意義
網絡輿情與現實社會密不可分,它反映了社會群體對現實社會中存在的某些特定事件和問題的態度和心理,是觀察民生民意的一扇窗戶。網絡輿情積聚發展到一定程度,就具有鼓勵、引導和宣傳的作用,集體性事件可能由此發生。所以,通過網絡輿情研判來預警具有重要意義,具體表現在以下幾個方麵:
第一,網絡輿情研判有助於占領網絡輿論製高點。互聯網技術的發展給輿論環境帶來翻天覆地的變化,以報紙、廣播、電視為代表的主流媒體輿論場受到信息滯後、傳播模式單一、缺乏與受眾之間互動交流等製約,影響力逐漸減弱。而以互聯網新技術為基礎的網站、微博、(微)視頻、微信、客戶端等形成了輿論新戰場,以互動交流便捷、自由平等對話、傳播影響力大等優勢,逐漸掌握了民間輿論場的話語權。目前,我國正處於社會經濟的轉型期,經濟發展麵臨巨大的壓力。社會中還存在保障體係不完善、貧富差距較大等問題,這些因素隨時都有可能點燃新興輿論場中的“腥風血雨”。同時,網絡中存在的“網絡推手”、“網絡水軍”、“網絡暴力”現象,加大了輿論引導和社會管理的難度。如何提高輿論引導力,已成為加強黨的執政能力建設迫切需要引起高度重視的現實問題。隻有通過網絡輿情研判,在網絡熱點形成之前,及時占領輿論製高點,才能在新興輿論場中化被動為主動。
第二,通過網絡輿情研判能及時發現和防範不穩定事件。現實社會中的熱點事件容易在網絡輿情中“蔚然成風”,反過來,隨著網絡輿情的膨脹、發酵,社會的關注度也會隨之越來越高。其中,網絡輿情中的一些負麵因素一旦被利用,更容易使整個網絡輿情中呈現級數擴散和宣傳的態勢。此時,就有網絡輿情演變為社會集體行動的可能,對公共安全造成負麵影響。提早進行網絡輿情研判,並在此基礎上建立輿情預警機製,就有可能將這些負麵影響消除在萌芽狀突。
第三,網絡輿情研判能夠發現隱含的社會危機。互聯網已經成為民眾對一些社會現象、熱點事件自由表達其態度和觀點的陣地。受社會矛盾和利益衝突的影響,互聯網輿情中參與者的言論往往具有一定傾向性。它們分布零散,不容易在短期積聚演變成網絡熱點,但其中包含了不容忽視的負麵因素或對公眾產生傾向性引導的意見。如“寒門難出貴子”,這種輿情顯示了對城鄉教育資源的嚴重分化、貧富差距嚴重等問題的不滿情緒。它在網絡中的廣泛傳播引起了相同背景網民的“共情”,極易打擊廣大“寒門學子”的信心,久而久之會演化為更嚴重的社會危機。
第四,網絡輿情研判能夠提高政府部門的敏感度。由於政府部門的工作流程和相關機製不健全,往往不能及時、準確掌握公共安全苗頭性事件的發生,對後期的決策和處置工作帶來一定的阻力。在網絡科技發達的社會中,網絡輿情的熱度反映了網民對相關事件的關注程度,網民關注度越高,傳播越廣泛,就越有可能成為需要公共部門引起注意的公共事件。相關政府部門若是通過網絡輿情研判及早發現這些信息,就能化被動為主動,抓住事件處置和應對的先機。
第五,網絡輿論研判有助於政府體察民意,從而提高公信力。網絡是集聚民聲民意最直接的場所,特別是各級政府推出“網絡問政”之後,許多網民都願意參與到各種問題和事件的討論中來。這就為政府收集社情民意,了解民心動向提供了重要的平台,也為黨和政府密切聯係群眾搭建了橋梁。有效地掌握網絡輿情,並對其中的各種利益矛盾進行預先研判,在發生矛盾衝突之前提出相應的對策,有利於維護社會安定團結,對提高政府公信力意義重大。
互聯網在人們的工作生活中扮演著越來越重要的角色,甚至已經成為必不可少的一部分。網絡中的輿情已成為現實社會輿情的映射,重視互聯網輿情的研判對現實公共安全來說更加必要。近些年來,一些地方政府因輿情研判能力不足引起社會惡劣影響的案例不在少數。如2011年5月26日,江西省撫州市檢察院內停車場、臨川區行政中心西樓一樓、臨川區藥監局大樓旁相繼發生爆炸。犯罪嫌疑人錢明奇在爆炸中死亡。事件起因為時任臨川區區長習東森在2002年5月修建京福高速公路時擅自降低補償標準,克扣征地拆遷款約計1000餘萬元,導致錢明奇損失近200萬。錢明奇為此起訴到當地法院,但法院終審駁回錢的訴訟請求。爆炸案發生之後,撫州征地拆遷問題和錢明奇的新浪微博都受到人們的廣泛關注。輿論對撫州政府一片斥責,並不斷質問撫州的拆遷工作。在輿情的發酵期,撫州市政府並沒有全力配合媒體的報道,網絡上關於撫州市的負麵輿情不斷上升。這就側麵反映出江西撫州市政府處理輿情危機的意識淡薄。
二、網絡輿情研判分析
網絡輿情事件的解決需要不斷回應網絡輿情,並與網民搭建互動溝通橋梁,為此,建立科學的網絡輿情分析研判機製對政府公共安全管理,特別是公共安全輿情方麵有很大的作用。以下就通過對網絡輿情定性和定量兩方麵來探討輿情研判方麵的機製建設。
(一)網絡輿情研判定性分析
1.網絡輿情價值研判。價值判斷是網絡輿情研判的基礎,受到輿情信息發生、發展的時間和內容兩方麵因素的影響。首先是輿情價值的時間要素。在分析網絡輿情信息的時間價值時,要從時間的時效性和連續性來著手。時效性是網絡輿情發生,或輿情走勢發生變化的第一時間。連續性是指網絡輿情隨著時間的推移而呈現不同的輿情態勢。對於決策者來說,第一時間了解公共事務的情況,並能及時獲取輿情更新的發展變化,更有助於把握輿情動向的主動性。相反,再有價值的信息,如果錯過其發生的關鍵時機就喪失了意義。特別是一些重大突發輿情,及時準確了解,就為相關部門決策爭取了時間和主動權。其次是輿情價值的內容要素,主要包含內容準確性和完整性。準確性要求必須客觀、真實說明網絡輿情的具體情況。因為互聯網中存在大量的虛假、冗餘信息,隻有通過去偽存真、去粗取精才能確保信息的準確性。完整性就是要全麵獲取有用信息,避免片麵信息誤導決策者。
2.網絡輿情來源和傳播方式判斷。網絡輿情是網民意見、態度與情緒的綜合體現,它可以通過不同途徑表現出來,也可以通過各種途徑傳播。目前,民眾在互聯網上對各類問題事件發聲的主要通道有:網站新聞跟帖、博客、論壇、微博、微信等。這些輿情信息包含了網民更加真實的情緒和訴求。因此,政府部門為了全方位把握網絡輿情發展情況,就要在上述通道中,收集網民的傾向性、敏感性和苗頭性的意見,判斷網絡輿情發展走勢,為後期政府回應、引導輿論和決策做準備。
3.網絡輿情性質及危害程度研判。一般來說,涉及征地拆遷、官員腐敗、環境保護和社會保障等事件,包含官民關係緊張、貧富差距擴大、權益糾紛增多等社會矛盾因素,一旦出現容易迅速成為網絡輿情熱點事件。如果處理不當還會出現集會抗議、維權上訪等不穩定因素。因此,在研判這類事件時,就要及時準確把握輿情信息的性質,捕捉輿情動態中的苗頭信息。同時,輿情研判還要評估該事件演變成為網絡群體性事件的可能性和危害程度,包括相關負麵的社會影響、經濟損失、政府形象等各種有形無形的危害。
4.網絡輿情的社會情景研判。上述網絡輿情研判都是從事件發生、發展的時間維度出發,網絡傳播具有超越時空的特性,這一方麵的研判就從網絡輿情的廣度和深度上著手,分析輿情信息在多維度的曆史環境、地域空間中的影響和地位,注意網絡輿情是否發生在敏感時間和敏感地點。比如,2013年3月27日到4月3日,僅僅八天時間之內,河南中牟、湖北巴東、四川西昌相繼發生三起因征地糾紛農民被碾死事件,且死狀慘烈,引起網民強烈不滿。網絡中充斥著責罵、悲憤、無奈的情緒。騰訊網發起題為“你認為還會發生農民被碾死事件嗎”的調查顯示,99%的人認為還會發生,隻有1%的人認為不會。就社會情景分析而言,首先,這三起事件單獨的發生地都不具備敏感性,但是在網絡輿情快速傳播的今天,相關事件極易被輿論關聯評論,從而引起輿論高峰;其次,每年的4月5日左右都是清明節,而第三起事件發生日為4月3日,更能激發人們哀悼悲憤的心情,積聚網民的關注度;再次,輿情評論呈現主題擴散性。網民的相關評論從維護農民合法權益和生命尊嚴,不斷轉移到官商勾結、貧富差距過大等社會現象的不滿情緒中。
(二)網絡輿情研判定量分析
1.建立網絡輿情熱點事件案例庫、數據庫。通過建立數據庫和案例庫,收集近年來發生的各類熱點事件,按照事件的性質或主體責任將其分門別類,總結各種輿情案例的發酵規律、網民情緒和政府應對措施及效果,以便將來發生類似事件時進行參考。如:2011年6月29日,四川什邡市政府宣布鉬銅項目開工建設,這一決定引起當地市民的不滿,一度引起學生和市民接連上訪並示威,最終導致了警民衝突的發生。衝突發生後,什邡官方就鉬銅項目三次表態,最終決定今後在什邡不再建設鉬銅項目。從輿情應對的角度看,什邡官方事發後積極應對,順應了當地民意,從而使事態得以控製。而2014年3月30日,廣東省茂名市爆發反對當地擬建PX項目的千人聚集事件,造成多人受傷,市區部分設施被毀。事發後,網絡上出現大量不實傳言,一度引發大規模的恐慌性輿論圍觀,各類謠傳泛濫多日之後,才被主流媒體證偽。當地政府控製不實傳言的能力凸顯官民信息溝通仍待加強。從這兩個事件來看,發生官民衝突時,地方政府要保持積極主動的態度回應群眾的訴求,網絡輿論就會出現大大轉向。
2.跟蹤高回帖率的事件,統計網民傾向性意見。回帖率就是網民針對熱點事件,對相關網站媒體報道、博客、論壇、微博、微信中的關注度,包括媒體報道瀏覽量、參與評論人數、實際評論人數、微博轉發及評論數等。一個熱點事件如果在網絡中一出現就引起廣泛關注,則相關內容的報道、微博的瀏覽量、評論量和轉載量會以小時、以天為單位積聚上升。這些內容是網民針對該事件的網絡輿情真實體現,也量化反映了網絡輿情的網民關注程度。據中國傳媒大學網絡輿情研究所2009年發布的年度報告指出,如果網民參與官民矛盾類事件評論的人數超過8%,相關部門就應關注事件的進展。同時,輿情研判還要對媒體和網民的傾向言論、觀點進行統計。包括截至某一時間節點,有多少網民關注、網民中具有代表性意見的占比等。如果將這些輿情信息統計並分析,就能總結出網民的主要意見和看法,為決策者了解當下輿情走勢提供重要的線索。
第二節 網絡輿情預測
從網絡輿情產生之初,它的生命周期就按照網絡輿情傳播規律,經曆著發生期、發酵期、**期和回落期的周期演變。網絡輿情預測就是采用各種信息分析手段,預判網絡輿情所處階段,民眾關注焦點和趨勢的過程。輿情預測有助於發現輿情變化中的潛在危機,輔助政府部門做出相應決策。
網絡輿情具有傳播範圍廣、速度快和影響力大的特點。一旦發生具有強影響力的公共事件,特別是涉及群體利益、官民矛盾等事件,媒體和網民就會通過各種渠道發表自己的意見和看法。此外,網絡傳播的虛擬性、匿名性和超越時空等特點讓網絡成為情緒化、偏激言論,甚至是謠言的灰色地帶。因此,網絡輿情作為公共情緒,具有感情和思想,有著很大的非穩定性和易變性,隨時會左右網絡事件的走向。法國社會學家古斯塔夫·龐勒認為,社會集體行動爆發促使整個群體形成一個集體心理,反過來,集體心理會影響著群體的每個個體忽略自身的因素,共同為集體目標努力。從這種意義上來說,群體無意識支配了群體行動,從而引發集體行動的爆發。但是從近幾年發生的網絡危機來看,網絡輿情轉變為集體行動的可能性較低,主要是由於現實社會形成的熱點一旦將陣地轉移到了網絡,就演變成了網絡空間事件。它較之於現實群體事件有著本質的不同,因為互聯網中僅僅依賴於文字評論的情緒激發著網絡輿論的高漲,事件中的當事者可以在輿論演化的過程中采取種種措施,從而舒緩輿情,降低其衍生為集體行動的可能。然而,這並不是一個放之四海而皆準的原理,不能排除網絡輿情轉變為集體行動的可能。比如,2014年8月,在一個社交網絡上發起的冰桶挑戰活動,迅速成為網絡集體行動,並蔓延到世界範圍。我國的各界人士也紛紛響應。再比如,“隨手拍解救公車”、“隨手拍解救乞討兒童”等,已成為此類公共事件的最佳推手。
當前,一些地方政府在輿情管理機製上還存在較大的欠缺,有著重危機處理、輕危機預警,重危機過程管理、輕危機信息分析的通病。這導致地方政府在網絡輿情的管理中常處於被動地位,更易被網絡輿論的狂潮牽著鼻子走,無從發揮引導輿論走向的作用。如果地方政府能及時預測網絡輿情發展趨勢,感知危機事件的征兆,則有利於發揮輿情處置的主動性,在網絡輿論中“力挽狂瀾”。對即將或已經形成網絡熱點的輿情有效預測,可以從輿情事件參與主體、涉及相關內容和定量分析等方麵來預測。
一、根據輿情參與主體進行預測
一是通過輿情傳播者來預測輿情影響力。網絡輿情傳播者的身份、影響力對輿情的發展具有重要的意義。比如,微博在網絡輿論中發揮著非常重要的作用,據統計已有30餘個國家的駐華大使館及領事館借微博賬號,促進與我國友好邦交關係。但是,部分西方國家駐華大使館及各總領事館的微博賬號頻頻發布一些具有較強刺激性的內容,例
如發布各地PM2.5監測數據,因其與我國官方數據相去甚遠,引起網民熱議和追捧,加深了網民對國內環保問題的不滿。而且,此類使領館微博還與一些意見領袖頻繁互動,不斷維護著話題的熱度。
二是通過網民活動軌跡預測輿情發展階段。互聯網自媒體技術的不斷發展為網民自由發表言論開辟了陣地,他們在這些通道中針對某一網絡熱點的表現就可以看出網絡輿情的發展態勢。一般來說,網絡輿情隨著網民參與度的增加而高漲,反之亦然。政府部門應該通過網民關注態勢預測網絡輿情趨勢。
三是通過媒體報道和意見領袖預測輿情發展的拐點。網絡輿情的形成和發展在很大程度上受到媒體、專家和網絡意見領袖的製約,他們從各自的角度出發,共同影響著整個輿論走向。其中,充當著二級傳播並擁有大量粉絲人群的網絡意見領袖,發揮著不可忽視的引導作用。網絡熱點發展過程中,他們的表現有可能決定著輿論的拐點。因此,在特定的網絡輿情事件中,要重點關注這些人群的反應。
二、根據輿情事件的內容預測
一是敏感事件。涉及敏感政治事件的網絡輿情應該成為分析預測的重點對象。敏感事件具有明確的政治導向和針對性,它對國家現行的政治體製、社會穩定能產生嚴重的破壞作用。因此,網絡輿情中一旦涉及這一因素,就要密切警惕其發揮的渲染、鼓動因素和網絡輿情相互作用造成的嚴重危機。
二是網絡熱點話題。網絡熱點話題是公眾在特定時間段最關注的話題。從近幾年來各大媒體頻頻發布的輿情年度報告來看,每年輿論關注的熱點都和政府政策導向、經濟發展中的民生問題等與人民群眾息息相關的話題有關,包括了國際關係、醫療教育、樓市股市、環保、食品藥品安全等多個方麵。這些熱點事件輿情不會輕易發展為集體公共行動,但仍具有影響公共安全的潛力。比如,樓市調控一直是人們關注的熱點話題,2011年10月,伴著資金鏈緊張、政策鬆動無望、保障房的衝擊、商品房存量的激增,全國範圍的樓市出現一波降價潮。房子未見,房價縮水,不少地區的老業主在各地“團團包圍”討要說法,有的地區甚至出現了上百名老業主“衝擊”售樓處的情況。
三是各種社會思潮。社會思潮是指一定時期內反映一定階級階層的利益和要求,以某種理論學說為主導和依據,得到廣泛傳播並對社會生活產生廣泛而深遠影響和作用的思想傾向及潮流。例如,當代中國社會思潮領域存在自由主義、新左派,民族主義思潮等。目前,我國正處於改革發展的關鍵期,各種複雜的思潮互相交織、影響,加之互聯網的特殊屬性,在特定時刻會對社會公共安全有重要的影響。因此,政府部門應對特定網絡輿情中可能涉及的思潮提前預測研判。
三、建立預警指標體係量化網絡危機
定量預警是在收集相關敏感信息的基礎上,通過科學的技術方法和分析,將網絡輿情危機中的各種征兆量化顯示,從而確定輿情的危機等級。其中,最關鍵的是建立一套輿情預警指標體係,可以分為輿情真實性、敏感度、關聯性、網民傾向性和參與度等。《國家突發公共事件總體應急預案》將危機劃分為特別重大、重大、較大和一般四個等級,不同等級的危機要采取相應等級的人力和物力應對。參照這種劃分模式,輿情危機程度可以分為:安全、輕度、中度、重度和危險五個等級。將網絡輿情各項指標轉換為具體數值之後,與之前默認的臨界值進行對比,判斷輿情的危險級別和發生突發危機的可能性,並向相關部門發布與等級對應的預警報告和處置建議。
四、撰寫網絡輿情預警研判報告
網絡輿情預警研判報告是針對某一熱點事件,在一定的時間內,通過定性和定量的方法分析網站、論壇、微博等多通道傳播的媒體、專家、意見領袖和網民的意見,判斷網絡輿情的發展趨勢,預測發生社會集體事件的可能性和時間節點,同時向相關部門提出相關處置應對的建議。網絡輿情研判報告的質量不僅決定著主管部門對輿情事件的關注程度,還影響著相關部門的決策效果。因此,優秀的輿情預警研判報告,從內容上來看,要客觀準確、重點突出;從語言上來看,要精巧連貫,生動活潑;從形式上來看,要數據鮮明準確,形象直觀。
第三節 網絡輿情指標體係簡介
網絡輿情指標體係是指通過一係列相互聯係、相互補充的指標,來反映網絡輿情的整體狀況。完整的指標體係可以指導網絡輿情監控工作,並可根據指標來明確網絡輿情信息采集的來源、範圍和方向。指標體係涉及整個網絡輿情生命周期,有助於全麵了解網絡輿情的發展狀況,挖掘有價值的信息,並及時通過預警指標判斷網絡輿情潛在問題。指標體係的設立,使得網絡輿情信息判斷更加客觀,定性定量相結合可以實現綜合分析,直觀展現複雜問題,增強對網絡輿情形勢的把握度。
構建網絡輿情指標體係,需要遵循以下原則:一是目標性:要體現網絡信息本質,反映計算機處理指標的要求,符合網絡輿情形成模式和變動規律,便於網絡輿情工作者對網絡輿情進行引導和管理。二是科學性:指標項目要有科學依據,符合信息學、情報學、傳播學、社會學等專業理論原則以及網絡輿情工作流程實際,盡可能減少人為主觀因素。三是係統性:網絡輿情匯集和分析工作是一個十分複雜的過程,涉及許多方麵,構建指標體係一定要全麵、完整,各項指標彼此有機地形成一個整體,從而能夠多層次、多角度將網絡輿情的特點表現出來。四是實用性:構建指標體係是為了實際操作應用。如果不能或不便操作,那麽建立起來的指標體係也毫無意義,所以一定要考慮在可行的條件下取得數據資料,使采集和處理規範有可操作性。
建立網絡輿情指標體係的思路是:先從新聞、論壇、博客、微博客、社交類網站、搜索引擎日誌和元搜索這些數據源中提取出網絡輿情要素,然後建立網絡輿情指標體係,最後設計網絡輿情指數的計算方法。進而,網絡輿情指標體係架構就包括了:總體態勢指標、業務指標、基礎指標、網絡輿情要素。如下圖所示:
圖11-1 網絡輿情指標體係架構
一、受眾指標
(一)受眾維度的粒度
受眾維度的粒度層次設置為:ID、用戶:一個用戶可能有多個ID、用戶群體。
(二)和受眾相關的指標
ID、用戶、用戶群體共用指標:實名度指標、活躍度指標、交際廣泛度指標、影響度指標、敏感度指標、上網時間分布度指標、接入方式分布度指標、成為意見領袖的可能性指標、心理特征指標。(注:1. ID、用戶的指標含義相似。2.用戶群體的指標含義一般用群體內用戶的同名指標的加權計算。)
用戶群體獨有的指標:地域分布度指標、內部凝聚力指標。
ID、用戶、用戶群體共用指標描述:
● 實名度指標:使用真實姓名的可能性,為以後網站實名製實施後提供的擴展指標。
● 活躍度指標:根據發文頻率、回帖頻率計算。
● 交際廣泛度指標:與其他用戶的關係。根據博客、微博客、社交類網站中的跟隨人數、被跟隨的人數、朋友數計算。
● 影響力指標:單位時間內、每發一個文、被回帖的頻率。
● 敏感度指標:發布敏感信息的頻率。
● 上網時間分布度指標:根據上網的時間計算分布度。
● 接入方式分布度指標:接入方式主要有網頁、手機、即時通、客戶端。
● 成為意見領袖的可能性指標:根據活躍度指標、交際廣泛度指標、影響度指標計算。
● 心理特征指標:通常對一篇文章持什麽意見。根據活躍度指標、發文的觀點傾向計算。
◆ 不活躍
◆ 活躍
■ 從眾/中庸
■ 情感強烈
◇ 反對
◇ 支持
用戶群體獨有的指標描述:
● 地域分布度指標:ID或用戶的IP、發布信息的位置、家鄉、住地的離散程度。
● 內部凝聚力指標:描述群體對輿情事件的觀點的一致程度。可以理解為群體內部每個人的觀點分布,用分布的密度計算。如下圖所示。圖中每個點代表一個網民的觀點。這些觀點的態度越相近,則距離越近。態度相近到一定程度的觀點能夠自然聚成一個團。圖中的團越多,越分散,則說明內部凝聚力越弱。
圖11-2 內部凝聚力指標
二、信息源指標
(一)信息源維度的粒度
信息源維度的粒度按照以下層次設置:
● 新聞
新聞網站
新聞-頻道
● 論壇
論壇網站
論壇-版塊
● 博客
博主
● 微博客
● 社交類網站
● 搜索引擎日誌
● 元搜索
(二)和信息源相關的指標
各信息源共用如下指標:活躍度指標、權威度指標、可信度指標、重要度指標、地域擴散度指標、態度傾向度指標。
和信息源相關的指標描述:
● 影響力指標:信息轉載關係、發文數、點擊數、回複數。
● 活躍度指標:發文頻率。
● 權威度指標:人工指定,如中央級、地域級等。
● 可信度指標:人工指定。
● 重要度指標:人工指定。
● 地域擴散度指標:地域擴散程度,如有可能,可以利用備案係統。
● 態度傾向度指標:發文的態度傾向性。
三、主題指標
(一)主題維度的粒度
主題維度的粒度層次如下圖所示。
圖11-3 主題維度粒度層次
(二)和主題相關的指標
文章、主題、類別共用如下指標:地域擴散度指標、敏感度指標、流量指標、報道熱度指標、點擊熱度指標、回複熱度指標、態度傾向性指標、拐度指標、觀點對立度指標。
和主題相關的指標描述:
● 地域擴散度指標:內容涉及的地域擴散程度。
● 敏感度:根據內容涉及敏感信息的程度、一段時間內成為熱點的頻率計算。
● 流量指標:一段時間內Web頁麵總數。
● 點擊熱度指標:一段時間內點擊數。
● 回複熱度指標:一段時間內回複數。
● 態度傾向性指標:態度是正麵還是負麵還是中立。
● 拐度指標:一段時間內熱度的變化程度,例如可能反映了某管製措施的有效程度。
● 觀點對立度指標:一段時間內,觀點的分散程度。可以理解為參與討論主題的人的觀點分布,用分布的密度計算。如下圖所示。圖中每個點代表一個網民的觀點。這些觀點的態度越相近,則距離越近。態度相近到一定程度的觀點能夠自然聚成一個團。圖中的團越多,越分散,則說明觀點對立度越大。
圖11-4 觀點對立度指標
四、業務指標
業務指標包括:受眾心理特征指標、受眾成為意見領袖的可能性指標、網民內部凝聚力指標、網民的地域分布度指標、主題相關信息源的地域擴散度指標、主題相關信息源的權威度指標、主題相關信息源的可信度指標、主題的傳播擴散度指標、主題的流量指標、主題危機預警指標、主題熱度指標、主題態度傾向指標、主題焦度指標、主題重要度指標。
注:(1)受眾= ID、用戶、用戶群體
(2)主題=文章、主題、類別
業務指標的具體描述:
● 受眾心理特征指標:同基礎指標。
● 受眾成為意見領袖的可能性指標:同基礎指標。
● 網民內部凝聚力指標:同基礎指標—用戶群體內部凝聚力指標。
● 網民的地域分布度指標:同基礎指標—用戶群體地域分布度指標。
● 信息源影響力指標:信息源的影響力。
● 主題相關信息源的地域擴散度指標:發布該主題的信息媒介的地域擴散程度。
● 主題相關信息源的可信度指標:發布該主題的信息媒介的可信度。
● 主題相關信息源的活躍度指標:發布該主題的信息媒介的活躍度。
● 主題的傳播擴散度指標:根據信息源的總數量、變化量、地域擴散,網民的總數量、變化量、地域擴散,主題流量指標計算。
● 主題熱度指標:根據流量指標、點擊熱度指標、回複熱度指標計算。
● 主題態度傾向指標:同基礎指標。
● 主題焦度指標:根據一段時間內保持熱度的時間、頻率計算。
五、總體態勢指標
總體態勢指標主要從主題角度對網絡輿情的總體情況加以概括,基於主題的領域或類別劃分,對包括流量和熱度等基礎指標,由細到粗對各主題領域進行分層匯總,最終得到總體的輿情指數以及在各領域間的分布情況。根據業務需要和偏好,對重點關注的類別或主題可以相應調整權重。
在相關的指標確定後,即可以采用模糊綜合評估模型進行建模計算。綜合評判隸屬於多元分析,是係統工程的重要環節,應用非常廣泛。所謂綜合評判就是對受到多種因素製約的事物或現象做出一個總體評判。綜合評判的方法有多種,用模糊數學的方法進行綜合評判叫做模糊綜合評判。該方法突破了精確數學的邏輯和語言,強調了影響事物或現象的各個因素模糊性,較好地解決了定性指標的定量化問題,在處理定性指標較多的評價問題時具有良好的適應性,較為深刻地刻畫了其客觀屬性,是迄今為止比較先進的評判方法,可適用於類型識別係統、專家評價係統、帶有評語集的多目標社會評價係統。
在實際應用中,對模型的選擇要根據具體問題的需要和可能而定。評估對象是網絡輿情時,要考慮所有因素對整體對象安全的影響,從而體現出整體特性,因此采用加權平均型算子模型。
建立模型的程序通常包含以下六步:
1.確定對象集和因素集U; (確定指標體係)
2.建立評語集V; (確定各指標的值域)
3.確定權重集W; (確定指標的不同因素的權
重)
4.在U和V之間進行單因素評價,建立模糊隸屬度矩陣R=(rij)n*m;rij表示U中第i個因素ui對於V中第j個等級vj的隸屬度;(指標隸屬度的確定)
5.選擇合成算子(加權平均型算子),計算模糊關係矩陣的合成值B=W◦R,對B作歸一化;B是一個模糊向量,不是一個點值,這個向量較為準確地刻畫了被評價對象本身的模糊情況;
6.利用評價向量B的分量形成權數,對各個評語等級的得分進行加權平均得到總評分。(得出指數)
下麵以計算某主題的熱度指標為例對具體計算過程進行說明。熱度指標根據流量指標、點擊熱度指標和回複熱度指標計算。
第一,指標權重的確定方法。
權重是以某種數量形式對比、權衡被評價事物總體中諸因素相對重要程度的量值,反映了各因素在評估中對最終的評估目標所起作用的大小程度,體現了單項指標在整個評估指標體係中的重要性,反映了評估者對不同指標價值的認識程度。權重是評估工作要解決的重要問題之一,它不僅是評判模型構造時的重要因素,而且直接體現評估者的價值取向,是最能反映人的主觀能動性的方麵。一般說來,各個因素在評估中具有的重要程度不同,區分各因素的重要程度,有助於突出主要因素的作用,有助於評判結果的準確。
指標權重的確定方法從總體上可以分為主觀賦權法和客觀賦權法兩種。
主觀賦權法認為權重的本質是各評價指標相對於評價目標的相對重要程度的量化值。由於這種相對重要程度是一種客觀存在的模糊概念,對其度量的依據是客觀的,但又必須通過主觀判斷來獲得,常用的主觀賦權法包括德爾菲(Delphi)法和層次分析法(AHP)。
而客觀賦權法認為權重的大小取決於各評價指標屬性值數列的離散程序的相對大小。也就是說,如果某個指標的各屬性值相同無差異,則該指標的權重值應為0;否則,指標屬性值的差異(即離散程度)越大,則賦予的權重值也越大,即該指標在綜合評價中的作用也越大。客觀賦權法的特點是消除了主觀賦權法的“主觀隨意性”,但也有其局限性,比較適用於評價突出各評價對象的差異情況。常用的客觀賦權法包括變異係數賦權法和熵值法。
德爾菲法又稱專家打分法,是指在對各個指標賦權時,邀請一批在本行業內有豐富經驗的專家,對各指標應當賦予的權重發表看法。具體操作方法是:先請每位專家為各項指標打分;然後,將若幹名專家的意見集中起來,求出每個指標權重的均值和方差。由於各位專家對同一指標重要程度的看法不盡相同,通過對方差的分析,可以了解到全部專家意見的分散程度。如果第一輪調查結束後,發現專家們的意見分散程度過大,則可以進行下一輪甚至多輪的調查,直至專家們意見接近一致。最後,選擇最終各個專家打分的均值作為指標的權重。在實際操作中,各專家的打分一般是匿名進行的。即各個專家之間並不知道對方也在接受該項目的谘詢,從而避免因為專家之間相互溝通而降低結論的客觀性。
層次分析法AHP是美國運籌學家薩蒂(T.L.saaty)在20世紀70年代初提出來的,它是將一些難量化的定性問題,在嚴格數學運算的基礎上進行量化;是將一些定量與定性相混雜的複雜決策問題綜合為統一整體後,再進行綜合分析評價。此方法特別適用於那些難於完全用定量方法進行分析的複雜問題。因此,在資源分配、選優排序及決策預報等領域得到廣泛的應用。
變異係數反映了各個指標數值的差異程度。這裏的差異包括縱向和橫向兩方麵內容,即時間序列數據和截麵數據都可以作為確定權重的依據。假如某個指標的各個數值差異越大,意味著該指標發展越不穩定(時序數據)或不均衡(截麵數據),從而對於實現預期目標的把握性越差,因而賦予較大權重;反之,若某個指標差異很小,意味著該指標發展得較為穩定(或均衡),實現預期目標的把握較大,我們給予的關注就可以少一些,因而所賦權重就小。
熵值法(entropy method)也是一種根據各項指標觀測值所提供的信息量的大小來確定指標權重的方法。熵原是熱力學中的一個名詞,在信息論中又稱為平均信息量,是用於估計各種各樣隨機試驗不肯定程度的指標。根據美國數學家申農(Shannon)的定義,假定隨機實驗a有有限個不相容的結果A1, A2, …, An,其出現的概率分別為P1, P2, ..., Pn,則這n個結果的平均信息量,即熵為:
並且,熵值越大,說明P1, P2, ..., Pn之間的差異越小,即這n個結果勢均力敵,隨機實驗a的不肯定性就越強;反之亦然。
第二,指標隸屬度的確定。
在普通集合理論中,對於任何一個元素來說,其隸屬關係隻有兩種:或屬於某集合U,或不屬於這一集合。然而在模糊集合理論中,由於存在模糊性,論域中的元素對於一個模糊子集的關係就不再是“屬於”和“不屬於”那麽簡單的關係,其對該模糊集的隸屬程度大小即隸屬度,取值在0到1之間。在進行模糊評判的時候,如何建立各個因素對應各個評判等級的隸屬程度大小,是整個評判能否進行的關鍵。確定隸屬度,在各類評判中有不同的方法。由於模糊數學本來就是用以解決難以用完全定量的方法來解決的問題,而且確定隸屬函數的方法多數還處於研究階段,尚沒有達到像概率分布的確定那麽成熟的階段,所以,隸屬函數的確定難以避免不同程度上人為主觀性的影響,但是無論其受到主觀性的影響如何,都是對客觀現實的一種逼近。評判隸屬函數是否符合實際,主要看它是否正確地反映了元素隸屬集合到不屬於集合這一變化過程的整體特性,而不在於單個元素的隸屬度數值如何。隸屬函數的表示方法通常有公式法、圖表法、曲線法。
對於網絡輿情評估模型來說,在確定了評估因素集、評判集和各評判指標的權重集之後,就要對每個因素進行單因素評判,得到單因素評判向量,從而建立模糊隸屬度矩陣,以確定評估指標的隸屬度。
指標隸屬度的確定一般來自問卷調查。為避免主觀判斷所引起的非科學性,增加定性指標的科學性,可采用對專家打分後的問卷調查的處理。可以采用簡單的求平均值,也可以根據不同專家對該領域的影響程度,賦相應的權重,而後求其加權平均值,從而得到各個指標的綜合指數,即評價值。
假設該主題在某天的部分輿情信息如下:
Web頁麵總數:101000
點擊數:55000
回複數:45000
計算該主題的熱度指數。
第一步:確定對象集和因素集U
主題熱度指標U={流量指標 u1, 點擊熱度指標 u2,回複熱度指標 u3}
流量指標 u1={Web頁麵總數u11}
點擊熱度指標 u2={點擊數u21}
回複熱度指標 u3={回複數u31}
第二步:確定評語集V
主題熱度指標的值域:
1.很熱 (-∞,1]
2.比較熱 (1,2]
3.一般熱 (2,3]
4.不熱 (4, ∞)
第三步:確定指標權重
第3.1步 建立遞階層次結構模型
表11-1 主題熱度指標的層次結構
第3.2步 專家打分
請專家協助,參考表11-2填寫調查表11-3。
表11-2 層次分析法比例標度表
表11-3 主題熱度指標重要程度兩兩比較調查表
第3.3步 確定指標權重
對專家填寫的調查表11-3用平均或加權平均的方法,構造各層次中的兩兩比較判斷矩陣,並用根法計算各層次的相對權重。得到結果如表11-4所示。
表11-4 主題熱度指標重要程度兩兩比較調查表
將各層次的權重進行歸一化後得到權重向量W=(0.25,0.15,0.6)
第3.4步 一致性檢驗
通過計算得到:最大特征根=3.1
一致性比例 CI = 0.05
一致性指標 RI = 0.58
CR =CI/ RI =0.086<0.1
因此,各層次指標的相對權重可以接受。
第四步:確定指標隸屬度
請專家協助,填寫調查表11-5、11-6、11-7。假設三位專家填寫的調查表如表11-8、11-10、11-12所示,用平均或加權平均的方法分別得到流量指標、點擊熱度指標、回複熱度指標的隸屬度矩陣,如表11-9、11-11、11-13所示。
表11-5 流量指標等級評估表
表11-6 點擊熱度指標等級評估表
表11-7 回複熱度指標等級評估表
表11-8 流量指標等級評估表調查結果
表11-9 流量指標隸屬矩陣
表11-10 點擊熱度指標等級評估表調查結果
表11-11 點擊熱度指標隸屬矩陣
表11-12 回複熱度指標等級評估表調查結果
表11-13 回複熱度指標等級評估表調查結果
第五步:合成
根據Web頁麵總數=101000、點擊數=55000、回複數=45000 去表11-9、11-11、11-13中查得相應的隸屬向量:
r1=(1 0 0 0)
r2=(0 1 0 0)
r3=(0 1/3 2/3 0)
計算模糊關係矩陣的合成向量:
第六步:計算主題熱度指數
B=(0.25, 0.35, 0.4, 0)
G=(1*0.25 + 2*0.35 + 3*0.4 + 4*0)
=2.15
因為:(-∞,1]很熱 (1,2] 比較熱 (2,3] 一般熱 (4, ∞)不熱
所以:此主題一般熱。
第四節 網絡輿情分析技術手段簡介
互聯網技術的發展不僅改變了人們的生活方式和工作方式,也深刻影響著政府部門運作方式。對待這一先進的工具,政府部門不僅要積極建設,還要加強引導和強化管理,防止網絡中的負麵信息和消極意識形態破壞經濟、政治、文化、社會的和諧穩定。相關部門必須對各種網絡輿論及時反饋引導,才能對現實中出現的各種網絡輿論,防微杜漸,防患於未然。然而,互聯網的受眾群體隨著互聯網技術的發展呈現爆炸式的分布,網絡中流動蘊藏的信息也如大海般浩瀚,僅靠人力去鑒別網絡輿情信息的性質和走向難免會“一葉障目”。隻有利用計算機自動處理技術,對互聯網輿情進行分析、整理,才能建立起全麵、有效、快速的輿情監測預警機製,及時應對網絡輿情。目前網絡輿情分析技術手段主要有以下幾種:
第一,熱點話題和敏感話題識別技術。這種技術是在一定的時間範圍內,根據網絡輿情的流傳擴散範圍和網民關注程度,判斷網絡話題的熱度。話題出處的權威度、相關內容的瀏覽量、轉載量和網民評論數量等都是識別固定時間段內熱門話題的主要參數。話題的敏感度主要是利用布控的關鍵字和語義分析進行識別,其中首先要將關鍵詞表中的關鍵詞通過字音變換、字形變換、插入無效符號、圖像化以及它們之間的變形組合來擴充關鍵詞庫;然後,將每個關鍵詞前兩個字對應的拚音編碼值組合起來作為索引號,建立一個關鍵詞索引表;最後,根據擴充的關鍵詞庫和拚音編碼索引表,對關鍵詞從拚音匹配到字型匹配程度進行打分排序,找出可能的敏感詞。按照“敏感”、“重要”和“一般”三個等級將相關網絡話題標記為不同的背景色來突出提供功能,橙色預警等級最高,為“敏感”事件;黃色預警等級居中,為“重要”事件;藍色預警等級最低,為“一般”事件。
第二,輿情情感傾向分析技術。互聯網已成為用戶表達觀點、態度、情緒的平台,這些內容更具強烈主觀色彩,一定程度內,負麵情緒聚集會對輿情走勢產生不可估量的推動作用。這種技術就是對網絡輿情在各種觀點的交織碰撞下產生的多種情緒,通過計算機手段分析輿情文本內容蘊含的各種非內容或非實時信息,為輿情研判進一步提供依據。本質上,這是情感信息的分類問題,主要集中在文本客觀性分類、詞的級判類別、語氣分類等方麵。目前主要有兩種研究思路:一是統計所有詞匯的傾向性,根據其評分正負來判斷文本傾向性;二是目前最流行思路是根據詞匯傾向性訓練出語義傾向分類器,效果好於前者。同時情感傾向分析方法、情感詞典構建、語料庫建設和係統建設也成為該技術的研究重心。
第三,話題跟蹤與檢測技術。這種技術起源於美國國防部高級研究規劃署的TDT項目,旨在發現網絡輿情動態發展過程中出現的新話題和某個主題在不同時間段內人們所關注的程度。話題檢測包括以下四方麵的工作:報道切分、話題關聯識別、新話題發現和話題跟蹤。首先要將一個輿情信息流切分為不同的話題文檔,然後判斷不同文檔之間的關聯程度,並對其進行排序,之後判斷這些不同的文檔是否轉向了一個新的話題,這也成為該過程中最有難度的一個步驟。話題跟蹤就是在後續報道中跟蹤檢測與新話題相關的所有報道。
第四,網絡文本自動分析和自動摘要技術。這種技術通過利用計算機自動化處理和人工智能技術手段采集指定網站上的輿情文本,根據文檔內容自動抽取其主題,然後經過自然語言處理技術加工生成的文本摘要。它可以幫助用戶無需閱讀全篇文章,就能快速了解文章大意和核心,從而提高用戶的閱讀效率。
第五,輿情預警和引導技術。輿情預警技術是在上述四項技術的基礎上,將分析結果通過數值、圖表等直觀方式表現。與此同時,按照安全、輕度、中度、重度和危險五個等級評估網絡輿情的危機態勢,一旦輿情危機程度為中度以上,則向指定對象發布相應的危機處理提醒。輿情引導技術就是根據輿情危機預警態勢,輔助決策部門判斷目前的輿情情況,並策劃、發送相關輿情疏解信息,讓網民及時了解真相,潛移默化地引導輿論走向。
(本章完)