0
本文作者: 張丹 | 2016-11-19 18:06 |
鐵打的“小鮮肉”、流水的“明星”;睡前兩小時打字最活躍;微信 QQ 多聊天,微博平臺多圍觀;鍵盤俠詞語熱度直線上升。你每天打出的文字,都是促成這些互聯(lián)網行為變化的一份子。
今天在人民大學舉行的“新中國輿論學研究三十年”論壇上,中國人民大學新聞與社會發(fā)展中心、搜狗輸入法大數據團隊聯(lián)合發(fā)布了《中國網民的信息生產及情感價值結構演變報告》。
據官方介紹,報告數據主要抽樣自搜狗輸入法在社交、購物、娛樂、工作平臺的用戶,以微信、微博和QQ等熱門社交平臺上的輸入數據為核心數據。由于微信開始產生影響是在2012年,所以數據時間段為2012年6月30日至2016年6月30日。數據先由人工進行關鍵詞分類,編碼后,再通過機器學習對高頻詞進行分類。
根據數據分析和詞云繪制分析,報告還對 70、80、90、00 后進行了人物畫像。
70 后充滿了激情的創(chuàng)業(yè)主義精神,馬云是典型代表。對互聯(lián)網的依賴度也不高,每天在網時間 4 個小時左右,遠低于 90 后的 6.5 個小時。70后更多地將互聯(lián)網作為一種新聞閱讀和社交聯(lián)絡工具。
80后主要關聯(lián)詞有:北京、我們、周杰倫、匆匆、飛行、攝影等,屬于電子移民,平均上網時長為 6.2 小時,對于互聯(lián)網屬于中度依賴群體。伴隨著讀圖時代成長的80后,是“視覺系”網絡行為的代表。
90后是在網時間最高的電子原住民。平均在網時長6.5個小時,所有的社會行為都是在網絡中完成。相比較70后和80后,90后更加灑脫和注重個性化表達,觀念較超前,賣的一手好萌。娛樂、吐槽和無節(jié)操的表達是其主要網絡行為。
00后是正在成長中的電子原住民,群體中的多數還在校園中,日均上網時長只有3.6個小時,偏向于反沉淀的社會關系網和追求自我的網絡行為模式。對微信、QQ 等固定的社會關系鏈依賴較輕,更喜歡“閱后即焚”類型的臨時構建的輕互聯(lián)網應用。
這是搜狗輸入法第一次與學術機構合作發(fā)布大數據分析報告,相關分析技術也主要由大數據研究院提供。搜狗 CTO 楊洪濤告訴雷鋒網,“大數據研究院目前沒有盈利方面的考慮,搜狗大數據方面的研究,最終都會為搜狗搜索引擎服務,搜狗輸入法的優(yōu)勢也在于此,以語音技術為例,2011年時搜狗才開始研究語音技術,由于技術不成熟,缺少語料庫,搜狗只能先用谷歌的接口,但搜索引擎很快就填補了數據空白?!?/p>
對于最近火起來的語音輸入法,楊洪濤認為,大家的識別準確率上沒有太大的差距,但是在未來的使用場景中,搜狗將更專注于互聯(lián)網領域,會更多的將語音技術運用在搜索引擎中。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。