0
本文作者: 張丹 | 2016-11-19 18:06 |
鐵打的“小鮮肉”、流水的“明星”;睡前兩小時打字最活躍;微信 QQ 多聊天,微博平臺多圍觀;鍵盤俠詞語熱度直線上升。你每天打出的文字,都是促成這些互聯(lián)網(wǎng)行為變化的一份子。
今天在人民大學(xué)舉行的“新中國輿論學(xué)研究三十年”論壇上,中國人民大學(xué)新聞與社會發(fā)展中心、搜狗輸入法大數(shù)據(jù)團隊聯(lián)合發(fā)布了《中國網(wǎng)民的信息生產(chǎn)及情感價值結(jié)構(gòu)演變報告》。
據(jù)官方介紹,報告數(shù)據(jù)主要抽樣自搜狗輸入法在社交、購物、娛樂、工作平臺的用戶,以微信、微博和QQ等熱門社交平臺上的輸入數(shù)據(jù)為核心數(shù)據(jù)。由于微信開始產(chǎn)生影響是在2012年,所以數(shù)據(jù)時間段為2012年6月30日至2016年6月30日。數(shù)據(jù)先由人工進行關(guān)鍵詞分類,編碼后,再通過機器學(xué)習(xí)對高頻詞進行分類。
根據(jù)數(shù)據(jù)分析和詞云繪制分析,報告還對 70、80、90、00 后進行了人物畫像。
70 后充滿了激情的創(chuàng)業(yè)主義精神,馬云是典型代表。對互聯(lián)網(wǎng)的依賴度也不高,每天在網(wǎng)時間 4 個小時左右,遠低于 90 后的 6.5 個小時。70后更多地將互聯(lián)網(wǎng)作為一種新聞閱讀和社交聯(lián)絡(luò)工具。
80后主要關(guān)聯(lián)詞有:北京、我們、周杰倫、匆匆、飛行、攝影等,屬于電子移民,平均上網(wǎng)時長為 6.2 小時,對于互聯(lián)網(wǎng)屬于中度依賴群體。伴隨著讀圖時代成長的80后,是“視覺系”網(wǎng)絡(luò)行為的代表。
90后是在網(wǎng)時間最高的電子原住民。平均在網(wǎng)時長6.5個小時,所有的社會行為都是在網(wǎng)絡(luò)中完成。相比較70后和80后,90后更加灑脫和注重個性化表達,觀念較超前,賣的一手好萌。娛樂、吐槽和無節(jié)操的表達是其主要網(wǎng)絡(luò)行為。
00后是正在成長中的電子原住民,群體中的多數(shù)還在校園中,日均上網(wǎng)時長只有3.6個小時,偏向于反沉淀的社會關(guān)系網(wǎng)和追求自我的網(wǎng)絡(luò)行為模式。對微信、QQ 等固定的社會關(guān)系鏈依賴較輕,更喜歡“閱后即焚”類型的臨時構(gòu)建的輕互聯(lián)網(wǎng)應(yīng)用。
這是搜狗輸入法第一次與學(xué)術(shù)機構(gòu)合作發(fā)布大數(shù)據(jù)分析報告,相關(guān)分析技術(shù)也主要由大數(shù)據(jù)研究院提供。搜狗 CTO 楊洪濤告訴雷鋒網(wǎng),“大數(shù)據(jù)研究院目前沒有盈利方面的考慮,搜狗大數(shù)據(jù)方面的研究,最終都會為搜狗搜索引擎服務(wù),搜狗輸入法的優(yōu)勢也在于此,以語音技術(shù)為例,2011年時搜狗才開始研究語音技術(shù),由于技術(shù)不成熟,缺少語料庫,搜狗只能先用谷歌的接口,但搜索引擎很快就填補了數(shù)據(jù)空白。”
對于最近火起來的語音輸入法,楊洪濤認為,大家的識別準(zhǔn)確率上沒有太大的差距,但是在未來的使用場景中,搜狗將更專注于互聯(lián)網(wǎng)領(lǐng)域,會更多的將語音技術(shù)運用在搜索引擎中。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。