熱搜再次成為目光焦點(diǎn)。熱搜仍
11月24日,上線算法四部門聯(lián)合開展“清朗·網(wǎng)絡(luò)平臺(tái)算法典型問題治理”專項(xiàng)行動(dòng),第年重點(diǎn)整治熱搜榜單、為何信息繭房、爭(zhēng)議止沉迷上癮、熱搜仍大數(shù)據(jù)殺熟、上線算法算法侵蝕新就業(yè)形態(tài)勞動(dòng)者權(quán)益五類問題。第年
在熱搜問題上,為何專項(xiàng)行動(dòng)的爭(zhēng)議止《算法專項(xiàng)治理清單指引》明確提出了三點(diǎn)要求:第一,算法規(guī)則公示。熱搜仍平臺(tái)需要公示榜單排序機(jī)制機(jī)理,上線算法包括基本原理和排序依據(jù);第二,第年日志留存核驗(yàn)。為何平臺(tái)應(yīng)留存榜單相關(guān)網(wǎng)絡(luò)日志,爭(zhēng)議止日志內(nèi)容包括時(shí)間、榜單排名、熱度值等信息;第三,水軍賬號(hào)識(shí)別。平臺(tái)應(yīng)健全異常賬號(hào)監(jiān)測(cè)機(jī)制,防范違規(guī)操縱榜單、控制熱搜等現(xiàn)象。
實(shí)際上,國(guó)內(nèi)社交平臺(tái)上線熱搜功能不過十年,已經(jīng)經(jīng)歷了兩次大型整改。微博公布過算法規(guī)則,引入了編輯人工審核,可信賬號(hào)的識(shí)別模型每年都在更新,但買榜單、流量造假、娛樂導(dǎo)向過重……紛紛擾擾的爭(zhēng)議始終未停。
熱搜是如何被算法塑造的,底層問題到底出在哪里?當(dāng)我們討論熱搜時(shí),還存在哪些誤解和盲區(qū)?
微博擁有熱搜功能,其實(shí)剛到十年。
2014年,熱搜在微博手機(jī)端正式上線。當(dāng)時(shí)熱搜的唯一指標(biāo)就是“實(shí)時(shí)搜索次數(shù)”,榜單每十分鐘更新一次。《微博搜索白皮書》顯示,熱搜上線的第二年,日均曝光量達(dá)到2.5億。
2018年1月,熱搜被網(wǎng)信辦啟動(dòng)為期一周的下線整改。因PG One粉絲刷榜的“紫光閣地溝油”熱搜,微博相關(guān)負(fù)責(zé)人被北京市網(wǎng)信辦約談,被指“用戶發(fā)布違法違規(guī)信息未盡到審查義務(wù),持續(xù)傳播炒作導(dǎo)向錯(cuò)誤、低俗色情等違法違規(guī)有害信息。”
通過這次整改,熱搜算法迎來(lái)了第一次升級(jí)——一個(gè)話題要成為熱搜,除了單純的搜索次數(shù),還需考慮傳播熱度、互動(dòng)率、話題率。
當(dāng)時(shí)微博副總裁曹增輝還對(duì)界面新聞表示,熱搜不再是純粹的算法排序,開始引入編輯人工干預(yù),整治虛假信息和謠言。
2020年6月,熱搜再次被啟動(dòng)為期一周的下線整改。據(jù)國(guó)家網(wǎng)信辦對(duì)外發(fā)布的公告,微博被指在阿里蔣凡輿論事件中,干擾網(wǎng)上傳播秩序、傳播違法違規(guī)信息。當(dāng)年開始實(shí)施的《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》將熱搜列為網(wǎng)絡(luò)信息內(nèi)容的重點(diǎn)展示環(huán)節(jié),指出要應(yīng)當(dāng)防范和抵制不良信息。
熱搜算法因此有了第二次升級(jí),并且進(jìn)行了公開說明。這一大體規(guī)則此后沒有更新,其計(jì)算公式是:(搜索熱度+傳播熱度 +討論熱度) x互動(dòng)率。
在官方公式中,互動(dòng)數(shù)是一個(gè)很重要的衡量指標(biāo),也就是通常所說的轉(zhuǎn)發(fā)、點(diǎn)贊、評(píng)論。不難看出,比起一次搜索,在熱搜頁(yè)面進(jìn)行的一次互動(dòng)能帶來(lái)的分?jǐn)?shù)更高,話題因此登上熱搜的概率也更大。
鄭州大學(xué)新聞與傳播學(xué)院副教授王茜長(zhǎng)期研究熱搜,她的論文《批判算法研究視角下微博“熱搜”的把關(guān)標(biāo)準(zhǔn)考察》被引用超過六千次。王茜在采訪中告訴21記者,2018年算法升級(jí)后,“熱搜”仍然是原來(lái)的排行榜,但對(duì)“熱門”的定義發(fā)生了根本改變,互動(dòng)性成為更重要的價(jià)值因子,而且近年來(lái)在平臺(tái)中的份量越來(lái)越重。
“熱搜依據(jù)用戶的真實(shí)行為產(chǎn)生,這么說當(dāng)然沒有錯(cuò)。但哪些行為更重要?是一次搜索更能說明用戶的關(guān)注度,還是一次評(píng)論?”王茜說。
決定這一答案的,是算法公式。學(xué)者米歇爾·威爾森 (Michele Willson) 用一個(gè)更生動(dòng)的例子說明了算法的權(quán)力,他把用戶的原始行為、原始數(shù)據(jù)比喻為食材,把算法比喻為食譜,不同算法能烹飪出不一樣的菜肴,直接影響了最終呈現(xiàn)的內(nèi)容。王茜表示,算法正是以這種不可見的、隱蔽的方式進(jìn)行價(jià)值判斷。
在王茜看來(lái),熱搜的“搜索”是一種私下的行為,具有隱蔽性;而轉(zhuǎn)發(fā)點(diǎn)贊評(píng)論是公開互動(dòng),往往有公開表演的成分。公開“轉(zhuǎn)贊評(píng)”的內(nèi)容和私下“搜索”的內(nèi)容,其實(shí)可能有著很大不同。
從心理學(xué)的角度來(lái)看,人類為了生存,有需要感知威脅、躲避危險(xiǎn)的天性,這種“人性弱點(diǎn)”體現(xiàn)在社交平臺(tái)上,便是暗含危險(xiǎn)、憤怒的負(fù)性信息更容易獲得公開互動(dòng)。不少社會(huì)研究已經(jīng)證明了這一點(diǎn),先進(jìn)網(wǎng)絡(luò)分析研究小組(GANA)曾對(duì)約7000萬(wàn)條微博數(shù)據(jù)進(jìn)行情緒分析,結(jié)果表明,憤怒是網(wǎng)絡(luò)上相關(guān)性最強(qiáng)、最易傳播的情緒,遠(yuǎn)超過喜悅和低落。
另一方面,強(qiáng)調(diào)互動(dòng)數(shù)的熱搜算法,也放大了意見領(lǐng)袖(KOL)的影響力。“如果把熱搜看成一個(gè)話題投票箱,原本大家是一人一票,普通人搜索一次和名人搜索一次貢獻(xiàn)是一樣的。現(xiàn)在擁有更多粉絲和資源的人,比普通個(gè)體的權(quán)重更高。”王茜解釋。
根據(jù)互動(dòng)數(shù)劃分不同權(quán)重的邏輯,直觀體現(xiàn)在熱搜的頁(yè)面里。點(diǎn)進(jìn)熱搜詞條,除了熱搜主持人置頂?shù)奈⒉脩羰紫饶芸吹降谋闶?0~20條左右,互動(dòng)量高,它們左右著用戶對(duì)熱搜內(nèi)容的初印象。
有明星后援會(huì)的粉絲告訴21記者,這幾年算法機(jī)制變得越來(lái)越復(fù)雜,一條評(píng)論要在熱評(píng)區(qū)被優(yōu)先展示,除了需要有高贊數(shù)和高評(píng)論數(shù),賬號(hào)本身還需要大概650分的“信用分”,上熱門轉(zhuǎn)發(fā)則需要690分左右的“信用分”。決定信用分的,是賬號(hào)發(fā)微博的活躍度、社交關(guān)系、舉報(bào)扣分情況等一系列指標(biāo)。
換句話說,不是所有微博用戶都會(huì)被納入熱搜考量范圍,算法會(huì)篩選出“可信用戶”。“普通賬號(hào)的信用比較低的話,怎么評(píng)論都上不了熱門,微博也上不了熱搜廣場(chǎng),甚至可能被屏蔽。所以平時(shí)就要多發(fā)原創(chuàng)微博,多帶話題跟大V互動(dòng),提高賬號(hào)的權(quán)重。”前述粉絲說。
這也許能解釋為什么能吸引更多回復(fù)的,或者來(lái)自大V的評(píng)論總能被“頂”上前排,獲得更多曝光。
王茜說,微博最初發(fā)布這一規(guī)則時(shí),出發(fā)點(diǎn)是識(shí)別水軍、確保熱搜的真實(shí)性。“但大數(shù)據(jù)一定會(huì)抹除一些細(xì)節(jié)。如果要定義哪些是僵尸號(hào)水軍、哪些是活躍用戶,那些只看不常發(fā)微博的人就會(huì)被判定不可信,篩選出來(lái)的就是一批最活躍用戶的想法。”
算法抹除的不止用戶痕跡。海外社交平臺(tái)X(前Twitter)同樣具有熱搜功能,不過顯示的是詞語(yǔ),而微博熱搜通常是由熱搜主持人提前設(shè)定好的一句主、謂、賓語(yǔ)完整的句子。王茜指出,雖然這樣看起來(lái)提供了更多事實(shí),但仍然抹除了細(xì)節(jié)和語(yǔ)境,屬于一種印象式的消息,有時(shí)誤導(dǎo)性可能更強(qiáng)。
舉例來(lái)說,2021年的一個(gè)熱搜#大學(xué)教授說娶到大才女李清照是倒八輩子霉#看起來(lái)在批評(píng)李清照,其實(shí)原視頻中大學(xué)教授是在戲謔對(duì)比,但如果不點(diǎn)進(jìn)視頻,或者沒有點(diǎn)進(jìn)完整的熱搜頁(yè)面,很可能就會(huì)先留下先入為主的印象。
通過對(duì)內(nèi)容和用戶的一系列篩選,熱搜能呈現(xiàn)的往往就是一部分活躍用戶的、青年群體的、更有爭(zhēng)議性的內(nèi)容。
如今各大互聯(lián)網(wǎng)平臺(tái)都采用流量主導(dǎo)的熱搜算法,對(duì)商業(yè)發(fā)展而言是必然選擇。
蘇州大學(xué)傳媒學(xué)院執(zhí)行院長(zhǎng)陳龍認(rèn)為,Web2.0技術(shù)的普及解決了社交媒體互動(dòng)性問題。從“轉(zhuǎn)贊評(píng)”到“一鍵三連”,本質(zhì)都是流量?jī)?yōu)先的邏輯。通過增加用戶粘性,最終將注意力作為商業(yè)化的基礎(chǔ),實(shí)現(xiàn)自身的發(fā)展與擴(kuò)張。
陳龍告訴21記者,在多個(gè)社交平臺(tái)的競(jìng)爭(zhēng)下,爭(zhēng)奪用戶有限的注意力是一場(chǎng)零和博弈。越來(lái)越多用戶流向短視頻平臺(tái),原本屬于微博的的時(shí)間被吞噬。從2018年初開始,新浪股價(jià)一路下行,當(dāng)2021年新浪宣布退出美股時(shí),市值已經(jīng)萎縮了近五分之一。2023年第三季度最新財(cái)報(bào)顯示,微博營(yíng)收32.07億元人民幣,同比下滑了3%。如何保用戶、保營(yíng)收是經(jīng)營(yíng)者不得不思考的問題。
與此同時(shí),微博是為數(shù)不多的公共討論場(chǎng)地,在社會(huì)事件的傳播上有著難以替代的影響力。中國(guó)政法大學(xué)數(shù)據(jù)法治研究院教授張凌寒提醒,在缺乏監(jiān)管的情況下,沖突性的內(nèi)容泛濫是必然結(jié)果。而很多冷嘲熱諷、煽風(fēng)點(diǎn)火、陰陽(yáng)怪氣等言論一旦高強(qiáng)度聚集,會(huì)對(duì)社會(huì)事件的當(dāng)事人造成極大的傷害。
比如,在此前的粉紅頭發(fā)女孩被網(wǎng)暴事件、收件人被快遞員造謠出軌事件中,一條評(píng)論單看也許只是玩笑話,但海量的負(fù)面評(píng)論疊加,可能就會(huì)形成一場(chǎng)網(wǎng)暴。熱搜在網(wǎng)絡(luò)暴力的生成、傳播、聚合中,起著“放大鏡”的關(guān)鍵作用。
去年《關(guān)于依法懲治網(wǎng)絡(luò)暴力違法犯罪的指導(dǎo)意見(征求意見稿)》出臺(tái),嚴(yán)懲基于蹭炒熱度、推廣引流等目的,對(duì)于網(wǎng)暴信息不履行安全管理義務(wù)的行為。2022年《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》要求,要建立完善人工干預(yù)和用戶自主選擇機(jī)制,“在首頁(yè)首屏、熱搜、精選、榜單類、彈窗等重點(diǎn)環(huán)節(jié)積極呈現(xiàn)符合主流價(jià)值導(dǎo)向的信息內(nèi)容。”
盡管有了人工干預(yù),但難題仍然不少。張凌寒指出,治理最大的難題仍是在保障言論自由和維護(hù)秩序之間找到平衡。陰陽(yáng)怪氣、冷嘲熱諷的互聯(lián)網(wǎng)信息難以根治,一禁了之既不利于實(shí)現(xiàn)有效的公共討論,長(zhǎng)遠(yuǎn)而言也無(wú)益于和諧社會(huì)的建設(shè)。
張凌寒認(rèn)為,關(guān)鍵在于通過智能識(shí)別等技術(shù)對(duì)熱搜進(jìn)行及時(shí)、全面、準(zhǔn)確的分析研判,實(shí)現(xiàn)靈活有效的輿論治理。陳龍則建議,語(yǔ)言暴力的邊界難以界定,針對(duì)具體問題建立人工管理員或投票機(jī)制,也是一種方法。
多位受訪學(xué)者還不約而同地表示,平臺(tái)熱搜的商業(yè)性和公共性存在悖論。當(dāng)下亟需提高算法素養(yǎng),剝除算法客觀性的光環(huán)。社會(huì)各界也不以熱搜當(dāng)作傳播標(biāo)準(zhǔn),并一味追求上熱搜的KPI指標(biāo)。
“需要認(rèn)識(shí)到的是,盡管熱搜在大家心中扮演了民意風(fēng)向標(biāo)的角色,但事實(shí)上它沒法呈現(xiàn)完全的客觀性。每種算法都存在一定的缺陷和偏見,要理性看待熱搜的性質(zhì)。”王茜說。