-
社交媒体时代的强势崛起,产生了微博、Twitter、Facebook等典型新媒介平台和“用户生成内容”(User Generated Content,UGC)网络应用。社交媒体的使用和传播,是生成和促进用户在表达内容上的多样性、“部落化”?还是减少内容异质性与多样性,增强用户同质性和趋近性? 这个问题,在多种媒介理论和经验视点的碰撞下,存在着持续而且复杂的论争。
一方面,就互联网及社交网络平台特性而言,有学者认为,互联网能够促进多元意见的表达,提升公共讨论[1]。Lee 等[2]进行的一次全美概率抽样调查结果表明,在Facebook、Twitter和其他社交网站上,人们的交往网络更为多元化,回声室效应并不显著;在社交媒体中,获取新闻、发布新闻等与新闻、信息相关的活动能够促进社交网络的异质性。Barberá 研究得出:总体而言,社交媒体用户接收的观点是多元化的,并且随时间推移,那些嵌入在多样化网络中的美国用户会逐渐关注较少意识形态同质性的群体[3]。Brundidge 提出,人们在线上互动依据的是不经意原则(inadvertency),最终会导致多元化个人网络的形成[4]。另一方面,对立的观点和分析,则反对社交媒体过度理想化的“公共领域”和异质性。有研究者认为,互联网只是便利了选择性接触和近似观点的强化[5-7]。Freelon 等根据有关叙利亚的转发帖子衡量社交网络同质性是增加还是减少,发现研究的9个组整体上呈现出高度同质化和碎片化特征,并且8个组都直接形成同质化分组[8]。Leskovec 分析具有时态信息的四个大型社交网络,证实同质性的存在[9]。
本研究的主要观点是:(1)微博帖子或许存在着“碎片化”的异质性,但是如果将某个用户所有发帖从“碎片”组装还原为该用户的“内容整体”,那么用户会表现出越来越减少独特性、越来越趋同化的现象。(2)对于微博媒介的使用是用户“越使用、越趋同”的重要驱动机制。(3)微博中的媒介使用对用户产生的多种趋同化作用具有内在统一性。
-
Weng[30]在分析Twitter用户同质性时,将同质化定义为共享相似内容并因此表现出相似兴趣的趋势。在群体行为的“趋同”现象中,每个行动者都具有一定行为策略值;行动者在初步阶段可以任意选择自己的策略值,但是随着时间的发展他们最后会选择同一种策略值[31]。本文将微博用户内容“趋同化”定义为:用户在微博媒介使用程度较低时,其发布的内容较为独特化和异质化;而随着对微博使用度的不断加深,用户会减少内容的独特性和个性化差异,增加与他人的相似性。
1.全局相似度层面,也即用户和全体用户、“芸芸众生”的平均相似度越来越高,“泯然众人矣”而越来越磨灭自己的内容个性与独特性。
2.趋顶相似度层面,也即用户和某种使用度最高的用户群体(可理解为社会聚光灯下、远在普通人之上的那部分“典范”人群),其平均相似度越来越高。例如,注册时长越久的用户,他们会和注册时长最长的那部分用户越来越相似。
3.近邻相似度层面,也即用户和具有相近使用度的用户,其平均相似度越来越高。用户不仅在趋似于“芸芸众生”和典范性的“顶部用户”,也在趋似于媒介使用度方面和自己最为“邻近”的用户和社会层级。
4.层内相似度层面,也即用户所处的具有相同使用度的层级内部,其平均相似度会越来越高。例如,如果用户划分为“最低使用度”和“最高使用度”的不同的“阶层”,则“最低使用度”的阶层内部会比较松散,大家彼此各不相同的程度很高;但是“最高使用度”的阶层内部的各人则彼此更为相似,相互趋近的“密度”和“黏稠度”比“低使用度”阶层高。本段所述的层内相似度,既是一个相对独立的猜测,同时也是来自第1个和第3个假设的自然延伸:如果用户随着微博媒介的使用,而在内容生产上受到各种“消磨个性”“泯然众人矣”的作用,他们进行内容生产的“自我弹性”越来越小。这样能预期的是,初级、低级使用度的层级虽然是“大流”“主流”的用户层级,但是该层级反而是更为异质化的,而不是缺乏差别和个性的“群氓”。而与一般的直觉不同的是,高使用度的用户、各垂直领域的精英用户等中、高“社会层级”内部反而是越来越高度同质化。这一点也是本文对用户样本采取“分层”研究而不是个体研究的重要原因之一。
样本选取自新浪微博。作为中国互联网2.0时代的代表性社交媒体和自媒体平台,新浪微博发展至今,活跃用户数量超4亿,用户覆盖范围广。对于新浪微博使用程度的衡量,从以下方面进行。
1.最基本的层面,是对微博的媒介接触和“浸泡”、卷入,这里采取用户的微博账户注册天数来反映。
2.最基本的媒介接触并不意味着对媒介的使用活性,因此进一步考察其使用的活性,这里采用微博用户的账户经验值、微博用户关注他人数量来衡量。其中,各微博账户的经验值来自新浪微博的公开数据,直观地反映了用户在新浪微博的使用活跃性和经验,获得经验值的方式主要为:发微博,连续登录账号。而用户关注他人,反映了用户在新浪微博使用中的主动性,积极寻求和其他用户的信息传播、关注和建立一定社会连接。用户关注他人数存在大量低关注数的“长尾”,取常用的对数函数转换法,也即:xnew=log2(x+1)。
3.有媒介接触、媒介使用活性,并不就意味着拥有使用的效果,那么这种使用即使很持续、很活跃,但也可能只是一种低效的、低显示度的使用。因此,进一步考察新浪微博用户的使用效果和影响,一是采用该用户所有发帖的平均热度,也即某用户各帖子的被点赞数、被转发数及被评论数,分别由对数函数转换后在[0,1]区间归一化,并等权求均值,作为该用户的帖子平均热度值,即:xnew= [minmaxlog2(x1+1)+minmaxlog2(x2+1) +minmaxlog2(x3+1)]/3, 其中x1、x2、x3分别指用户的帖子平均转发数、平均评论数及平均点赞数,minmax()将数据在[0,1]区间予以最小最大归一化。二是采用用户的粉丝数作为直观指标之一,涨粉、粉丝量是微博用户影响力和网络话语地位的一个简单而有高区分度的指标,该指标和关注他人数一样符合大量长尾的幂律分布,也取对数函数转换得到,即:xnew=log2(x+1)。微博的使用度指标从三大方面、五个子指标构成,如表1所示。
表 1微博使用度指标
新浪微博用户的使用度 新浪微博用户的使用度子指标 媒介接触和浸泡 注册时长/天数 媒介使用的活性 微博账户经验值
关注他人数量媒介使用的效果 所发帖子平均热度
粉丝数量用户使用程度的上述指标量纲不一致,而且分布不一致,各个指标的随机波动也很大。为了简化研究,采用常用的“分箱化”策略,对用户在每一种使用度指标下,划分为等频(等人数)的由低到高的30个“社会层级”。
-
运用开源网页文本抓取工具“八爪鱼”,以及自行用python和selenium编写的动态网页抓取程序,抓取新浪微博用户资料及其发帖。从新浪微博首页 47 个内容版块(分别是:社会、国际、科技、科普、数码、财经、股市、明星、综艺、电视剧、电影、音乐、汽车、体育、运动健身、健康、瘦身、养生、军事、历史、美女模特、美图、情感、搞笑、辟谣、正能量、政务、游戏、旅游、育儿、校园、美食、房产、家居、星座、读书、三农、设计、艺术、时尚、美妆、动漫、宗教、萌宠、法律、视频、上海)中,持续一个月每天抓取2次帖子,从这些样帖整理得到 10 037 个发布者。本研究出于规模和成本所限,未采用大规模随机漫步等抽样方法,但采样时间持续了一个月,并非某个短时间内的抽取; 而且结合了新浪微博自身的内容分发系统,广泛而大致均衡地分布在 47 个大内容类型版块,因而也体现出较大覆盖面和良好程度的代表性。2018年10—12月期间,采集这些发布者用户的URL信息,并在此基础上进一步采集 10 037 个用户的用户名、性别、所在地、粉丝数、关注数、发布微博数、注册时间、等级及会员信息等多种信息;根据用户URL地址,对用户发帖进行抓取,得到去重后的微博数量 34 892 987 条。由于帖子过少可能难以充分反映出用户内容特征,所有只保留样本帖在 3 000 条以上的用户,剩下 7 825 个用户用于最终分析,并且每个用户一律随机抽取其中 3 000 条帖子,以增强口径的统一与横向可比较性。用 python 编程语言对文本进行繁体字简化,采用在学界和业界较为常用的 jieba 模块完成中文分词。
-
潜在语义分析(Latent Semantic Analysis, LSA)是一种文本降维和分布式语义表示方法[32]。一般的向量空间模型(Vector Space Model,VSM)高维、稀疏的文本表示方法不同的是,LSA利用在文本数据挖掘中广泛应用的奇异值分解(Singular Value Decomposition,SVD)技术,将文档的高维词频表示投影到低维的潜在语义空间中,通常可以把数万、数十万以上的高维、稀疏表示降到数千、数百的低维表示,而且这种低维向量反映着词汇在语义上的内在联系。其中,对于文档-词项的矩阵X进行奇异值分解可得:X=TΣDT。LSA 通过奇异值分解,保留前k个最大奇异值,通过降维后的k个潜在语义主题以代替、表示原有全部词项的信息;也即,通过TkΣkDkT来近似地表示原文档-词项构成的矩阵X。
本研究对每个微博用户,其所有样本帖 {x1,x2,x3,…,xn} 拼接为一个长文档,每个用户之间是有其区分度的。7 825 个用户共得到 7 825 个长文档,并通过向量空间模型将其转换为一个词频矩阵X,其中剔除出现频次少于 30 的词,降低噪音的干扰,也保留更为主要和有价值的信息。并对这个矩阵X通过 LSA 算法降为 7 825×500 的矩阵。LSA 降维工具采用 sklearn 中的 TruncatedSVD 模块。选择降到 500 维,是通过实验显示500 维处于一个误差的“拐点”,再增加维数对于保留原始信息已大幅放缓(如图3所示);而且降到 500 维时已达到 0.90 的解释方差比(explained_variance_ratio_,降维后各维数的方差值占总方差值的比例,最大值为1 ),对于原始信息已有足够充分的保留和反映,如表2所示。
表 2LSA降到不同维数时的解释比
降维后的维数 解释方差比 降维后的维数 解释方差比 100 0.69 1 100 0.96 200 0.79 1 200 0.97 300 0.84 1 300 0.97 400 0.87 1 400 0.98 500 0.90 1 500 0.98 600 0.91 1 600 0.98 700 0.93 1 700 0.98 800 0.94 1 800 0.99 900 0.95 1 900 0.99 1 000 0.96 2 000 0.99 -
对用户的内容相似度计算,选择在文本挖掘、语句相似度计算及自然语言处理中比欧氏距离更常用、也具有高度稳健性的余弦相似度。将用户的诸条帖子拼接为一条文档,并通过LSA的降维、转换后,将这个文档转为一个低维度向量。
任意两个用户m和n之间的内容相似度表示为R(m,n)。其中R(m,n) 的计算方法为: 将这两个用户m、n分别转换得到两个向量A、B之后,余弦相似度也即两个向量A、B之间夹角的余弦 cos(θ)
$$ {\rm{cos}}\left( \theta \right) = \frac{{{\boldsymbol{A}}\cdot{\boldsymbol{B}}}}{{\left\| {\boldsymbol{A}} \right\|\left\| {\boldsymbol{B}} \right\|}} $$ (1) 该值范围在[-1, 1],值越大表明这两个用户之间内容越相似。
在上述R(m,n)的基础上,任意一组用户G1(包含n1个用户)和另一组用户G2(包含n2个用户)的内容相似度表示为
$$ H\left({G}_{1},{G}_{2}\right)=\frac{1}{{n}_{1}{n}_{2}}\sum _{{x}_{i}\in {G}_{1}}\sum _{{x}_{k}\in {G}_{2}}R\left({U}_{{x}_{i}},{U}_{{x}_{k}}\right) $$ (2) 式(2)是在式(1)的基础上,采用衡量两组对象间的平均距离、平均相似度所常用的“类平均法”(或称“簇平均法”,Average Group Linkage)而得到。其中G1或G2都可以有且仅有一个用户,这种情况下也即:式(1)中所计算的个体与个体之间的两两相似度成为式(2)中n1和n2分别都为1时的特例。本研究中,由于用户分层后的层内人数通常不为1个,所以文中被直接应用的还是式(2)。
H(G1,G2)的值越大,表明两组用户之间两两的趋近、类同乃至重复程度越高;若两组用户的异质化内容越大,则平均相似度就会越低,也即H(G1,G2)的值越小。
将全体用户样本按照使用程度的高度分层后,任意一个用户层级Gi的不同的“趋同化”程度,计算方法如下:
1. 全局趋同化程度。Gi与全体用户G的平均相似度为
$$ H\left( {{G_i},G} \right) $$ (2.1) 2. 趋顶趋同化程度。Gi与顶部层级用户Gmax的平均相似度为
$$ H\left( {{G_i},{G_{\max}}} \right) $$ (2.2) 3. 近邻趋同化程度。Gi与高一层级的用户Gi+1的、低一层级的用户Gi-1,其相似度的平均值为
$$ {\rm{average}}(H\left( {{G_i},{G_i}_{ + 1}} \right) + H\left( {{G_i},{G_i}_{ - 1}} \right)) $$ (2.3) 4. 层内趋同化程度。Gi内部的本层级用户之间的平均相似度为
$$ H\left( {{G_i},{G_i}_{ + 1}} \right) $$ (2.4) -
根据前文提出的问题以及研究设计、整体研究路线,将问题(Q1,Q2,Q3)转换为如下可操作化的假设:
设新浪微博的用户样本集合(N=7825)为G,G中的每个用户Ui将其全部样帖聚合为一条文本Ti,通过文档-词项矩阵、潜在语义分析(LSA)方法,得到每个用户内容经降维、提取主要信息后的文本特征向量Vi。按照用户对于微博媒介使用度(媒介接触/使用活性/使用效果中的一个子指标)的高低程度,将全体用户G等频划分为m个具有相同或相近使用度的不同用户层级{G1,G2,G3,…,Gm}。并结合式(2)及其推演得到式(3)~式(6),计算各个用户层级与其他用户层级或全体用户的平均相似度,转换后的假设如表3所示。
表 3研究假设及其操作化的表述
原假设 转换 转换后可操作化的假设 Q1:用户在微博使用中,消减自身的独特内容,发生趋同化。 Q1→H1 H1:每个用户层级{G1,G2,G3,…,Gm}的某种使用度指标的平均值(质心)F为[f1,f2,f3,…,fm],F与各层级的不同类型的趋同化程度,分别都具有显著的线性正相关 Q1.1.受到全局媒介场的作用,和全体用户越来越相似与同质化(可称为全局趋同化) Q1.1→H1.1 H1.1.微博使用度和全局趋同化程度之间的正相关。各个用户层级与全局用户的平均相似度Simglobal,由式(3)可计算得到Simglobal=[S11,S12,S13,…,S1m]。则:F和Simglobal具有显著的线性正相关 Q1.2、趋向和最高使用度的“典范”用户层级越来越相似 (可称为顶部趋同化) Q1.2→H1.2 H1.2、微博使用度和顶部趋同化程度之间的正相关。各个用户层级与最高使用度层级用户的平均相似度Simmax,由式(4)可计算得到Simmax=[S21,S22,S23,…,S2m]。则:F和Simmax具有显著的线性正相关 Q1.3.朝向和自身属于同一能量位置,具有和自身相同或相近的媒介使用度的“邻近”用户的趋同化(可称为近邻趋同化) Q1.3→H1.3 H1.3.微博使用度和近邻趋同化程度之间的正相关。各个用户层级与高1级、低1级的近邻层级用户的平均相似度Simneighbour,由式(5)可计算得到Simneighbour=[S31,S32,S33,…,S3m]。则:F和Simneighbour具有显著的线性正相关 Q1.4、趋向和自身使用度相同的本层级用户的趋同化(层内趋同化) Q1.4→H1.4 H1.4.微博使用度和层内趋同化程度之间的正相关。各个用户层级在本层级内的的用户平均相似度Simself,由式(6)可计算得到Simself=[S41,S42,S43,…,S4m]。则:F和Simself具有显著的线性正相关 Q2.用户内容趋同化的四种路径的一致性:Q1.1 (全局趋同化)、Q1.2 (顶部趋同化)、Q1.3(近邻趋同化)、Q1.4(层内趋同化)不是矛盾的、相互掣肘的,也不是互不相关的,而是一致的、同步的。 Q2→H2 H2:各层级用户的四种趋同化程度(Simglobal,Simmax,Simneighbour,Simself),具有同步性和统一性。它们两两之间具有显著的线性正相关性,并且四者之间的Cronbach'sα系数为足够高的值 将表 3 中 H1、H2 的计算过程,在五种使用度子指标下分别计算一遍,即可以分析H1、H2 在这不同使用度指标下是否都成立。
-
将 7 825 个用户,按照其使用度等级的高低不同,将等使用度或相近使用度的用户划分到一个“用户层级”中,等频切分为30层。对假设H1.1、H1.2、H1.3、H1.4分别在 5 种媒介使用度指标下检验:对每一层的用户,取其使用度的平均值作为该层用户的使用度“质心”,再计算质心和该层用户的趋同化相似度之间的皮尔逊相关系数。例如,计算“微博用户经验值”是否和用户的全局相似度有相关性,是对30层用户每层得到其经验值的均值作为该层质心,得到数组A=[a1,a2,a3,…,a30]; 30层用户每层同样能计算得到该层和全体用户的“全局相似度”,得到顺序相对应的数组B=[b1,b2,b3,…,b30],然后对A、B求皮尔逊相关系数,结果为0.906(表中第2列第3行)。其他的变量也都依次类推。得到相关系数,如表4所示。
表 4用户的微博使用度和趋同化程度的皮尔逊相关系数表
变量 全局相似度 趋顶相似度 近邻相似度 层内相似度 注册天数 0.925** 0.776** 0.714** 0.770** 微博用户经验值 0.906** 0.912** 0.877** 0.926** 关注他人数 0.915** 0.922** 0.945** 0.942** 帖子平均热度 −0.080 0.792** 0.455* 0.468** 粉丝数 0.062 0.959** 0.390* 0.378* 注:**、*分别表示在1%、5%水平下显著;所有相关系数的计算中N=30。 在新浪微博中注册时长越久、“浸泡”越久的“老”用户,他们和以下 4 种用户的相似度、趋同度就越高:(1)和全局用户相似;(2)和注册时长最久的最顶一层用户相似;(3)和相邻正负一个层级的用户相似;(4)和具有相同或相近注册时长的本层用户相似。根据皮尔逊相关系数,注册时长指标和全局相似度的正相关系数高达 0.925,已经几乎是直线增长。和其他几种相似度的正相关系数也都达到了 0.714 以上不等。
随着用户使用微博的经验值日益提升,它们是不是也会表现出相应的四种相似度增加呢?皮尔逊相关系数分析显示,用户经验值和 4 种相似度全部呈正相关,相关系数最低也达到了 0.877(层内相似度),其他三种相似度全部高达 0.9 以上,P值全部都小于 0.001。这在社会科学研究中是比较突出的正相关。
新浪微博用户越是主动关注他人、显现出在社交媒体中的互动性和活性,是否就越是表现出更高的“趋同”度呢?结果是肯定的且是非常鲜明的。关注他人数和 4 种相似度,皮尔逊相关系数全部显著,而且均在0.915 以上。
发帖平均热度越高的用户层级,他们的趋顶相似度、近邻相似度、层内相似度就都显著地越高,而全局相似度的增加不明显。
粉丝数越高的用户层,尽管在全局相似度方面的增加不显著,但是在剩下的几个指标中全部显著,甚至和趋顶相似度的皮尔逊相关系数高达 0.959。
之所以发帖热度、粉丝数与全局相似度的相关系数不够显著,推测是由于过于“随大流”、与全局用户过于相似的用户,难以得到很高的粉丝量和帖子传播效果。但是即使这两个微观条件下不符合,也必须看到:其一,这两个指标下的其他三种趋同化依然是显著的,部分甚至是很高的相关;其二,至少这两个不显著相关系数未表现为负的相关系数,也即用户不会因为要达到高粉丝量、高帖子传播效果而保持一种“特立独行”的反趋同化。
总体而言,用户的使用度变量(5种) 和趋同化程度变量 (4种) 之间具有正相关性,5×4=20 组的相关系数分析中有18组 (90%)的皮尔逊相关系数显著,而且这些显著的相关系数平均值达到 +0.78,有 9 组相关系数达到了 +0.9 以上的高度正相关。
-
根据上文的分析,在根据 5 种微博使用度指标的切分中,用户在绝大多数情况下,随着微博使用程度的提升而表现出对总体用户、顶部用户、近邻用户和本层级用户的趋同程度增加。相关联的问题是:用户的 4 种“趋同化”作用,是各自独立、互不相关的;亦或相互制约和掣肘的;还是统一、同步的作用?
为了考察 4 种不同的“趋同化”路径和方向之间是否具有内部一致性,采用 Cronbach’s α 系数进行考察。尽管学术界对于 Cronbach’s α 系数能否很好地反映量表的内部一致性还存在一些不同看法,但是该方法在当前仍是普遍使用的简单有效方法之一。Cronbach’s α 值如果达到 0.6 以上是通常可接受的结果,达到 0.8 或 0.9 以上是很理想的值。
在 5 种分层指标下,分别对用户等频分层为 30 个“用户层级”,每个层级分别都能计算出 4 种趋同化的程度,也即能得到 30行×4列的数据表。对这 4 列变量计算 Cronbach’s α系数,最终结果如表5所示。
表 5趋同化程度之间的一致性分析
用户分层变量 4 种趋同化程度的 Cronbach'sα系数 项数 注册时长 0.974 4 微博用户经验值 0.967 4 关注他人数 0.971 4 帖子平均热度 0.807 4 粉丝数 0.859 4 无论按照哪种“使用度”作为依据,不同等级用户所朝向的全局趋同化、顶部趋同化、邻近趋同化、层内趋同化这四种“趋同化”的路径是一致、同步的,不存在“此消彼长”或“互不相干”等情况。5 种使用度指标下,即使按照“帖子平均热度”这个最不理想的情况,4 种趋同化程度的 Cronbach’sα系数也达到了 0.807,而在注册时长、微博经验值、关注他人数这三种指标下,Cronbach’sα系数甚至到 0.967 乃至 0.974 的高值。不同的趋同化路径与方向尽管“殊途”,但却显现出“同向”和“同步”。
Assimilation of Users in the Use of Microblog Media
-
摘要:在强势崛起的“人人时代”与微博内容生产中,用户是否发生着“泯然众人矣”趋同,这种削磨独特性与差异性的趋同具有怎样的路径和特征,是尚存争议的基本理论命题和亟需详细检验的现实问题。基于潜在语义分析(Latent Semantic Analysis)的文本挖掘和用户内容相似度计算,以及在对用户群体根据媒介使用度进行分层研究的基础上,深入分析微博用户在局部、全局意义上的多维趋同现象和路径。在此基础上,进一步分析了不同趋同化路径之间的内在关系,部分实证结果具有反经验直观性。用户在微博使用端作为“媒介的延伸”,存在着对微博媒介“越使用、越趋同”的现象,显现出社会化媒体“文化工业”对于主体性的“同一化”再生产。从三维使用度、四种趋同性的复合层面,对微博用户在媒介使用中产生内容趋同化的现象推进机理解析,实证审视多种趋同演化路径之间看似对立实则统一的作用机制,有助于深入认知社交媒体用户趋同结构的复杂机制和实践问题。Abstract:In the rise of “Here Comes Everybody” era and creation of social network content, whether the user content has the convergence of “devoid of all”, and what path and characteristics this convergence of sharpening uniqueness and difference has are the basic theoretical propositions and practical problems that need to be tested in detail. Based on the latent semantic analysis of text mining and user content similarity calculation, and hierarchical research of user groups according to media use degree, this study explicitly analyzed the multi-dimensional convergence phenomenon and path of microblog users in the local and global sense. On this basis, the internal relationship between different assimilation paths was further analyzed, and some empirical results are counter-empirical intuitive. As the “extension of media”, users have the discipline of “more use, more convergence” for microblog media, which shows that the “cultural industry” of social media reproduces the “identity” of subjectivity. This paper systematically and concretely promoted the analysis of the assimilation mechanism of microblog users in the use of media from the composite level of three degrees of use and four kinds of convergence, and empirically examined the seemingly opposite but actually unified mechanisms of action among various convergence evolution paths, which is conducive to understanding more deeply the complex mechanism and practical problems of the convergence structure of social media users.
-
表 1微博使用度指标
新浪微博用户的使用度 新浪微博用户的使用度子指标 媒介接触和浸泡 注册时长/天数 媒介使用的活性 微博账户经验值
关注他人数量媒介使用的效果 所发帖子平均热度
粉丝数量表 2LSA降到不同维数时的解释比
降维后的维数 解释方差比 降维后的维数 解释方差比 100 0.69 1 100 0.96 200 0.79 1 200 0.97 300 0.84 1 300 0.97 400 0.87 1 400 0.98 500 0.90 1 500 0.98 600 0.91 1 600 0.98 700 0.93 1 700 0.98 800 0.94 1 800 0.99 900 0.95 1 900 0.99 1 000 0.96 2 000 0.99 表 3研究假设及其操作化的表述
原假设 转换 转换后可操作化的假设 Q1:用户在微博使用中,消减自身的独特内容,发生趋同化。 Q1→H1 H1:每个用户层级{G1,G2,G3,…,Gm}的某种使用度指标的平均值(质心)F为[f1,f2,f3,…,fm],F与各层级的不同类型的趋同化程度,分别都具有显著的线性正相关 Q1.1.受到全局媒介场的作用,和全体用户越来越相似与同质化(可称为全局趋同化) Q1.1→H1.1 H1.1.微博使用度和全局趋同化程度之间的正相关。各个用户层级与全局用户的平均相似度Simglobal,由式(3)可计算得到Simglobal=[S11,S12,S13,…,S1m]。则:F和Simglobal具有显著的线性正相关 Q1.2、趋向和最高使用度的“典范”用户层级越来越相似 (可称为顶部趋同化) Q1.2→H1.2 H1.2、微博使用度和顶部趋同化程度之间的正相关。各个用户层级与最高使用度层级用户的平均相似度Simmax,由式(4)可计算得到Simmax=[S21,S22,S23,…,S2m]。则:F和Simmax具有显著的线性正相关 Q1.3.朝向和自身属于同一能量位置,具有和自身相同或相近的媒介使用度的“邻近”用户的趋同化(可称为近邻趋同化) Q1.3→H1.3 H1.3.微博使用度和近邻趋同化程度之间的正相关。各个用户层级与高1级、低1级的近邻层级用户的平均相似度Simneighbour,由式(5)可计算得到Simneighbour=[S31,S32,S33,…,S3m]。则:F和Simneighbour具有显著的线性正相关 Q1.4、趋向和自身使用度相同的本层级用户的趋同化(层内趋同化) Q1.4→H1.4 H1.4.微博使用度和层内趋同化程度之间的正相关。各个用户层级在本层级内的的用户平均相似度Simself,由式(6)可计算得到Simself=[S41,S42,S43,…,S4m]。则:F和Simself具有显著的线性正相关 Q2.用户内容趋同化的四种路径的一致性:Q1.1 (全局趋同化)、Q1.2 (顶部趋同化)、Q1.3(近邻趋同化)、Q1.4(层内趋同化)不是矛盾的、相互掣肘的,也不是互不相关的,而是一致的、同步的。 Q2→H2 H2:各层级用户的四种趋同化程度(Simglobal,Simmax,Simneighbour,Simself),具有同步性和统一性。它们两两之间具有显著的线性正相关性,并且四者之间的Cronbach'sα系数为足够高的值 表 4用户的微博使用度和趋同化程度的皮尔逊相关系数表
变量 全局相似度 趋顶相似度 近邻相似度 层内相似度 注册天数 0.925** 0.776** 0.714** 0.770** 微博用户经验值 0.906** 0.912** 0.877** 0.926** 关注他人数 0.915** 0.922** 0.945** 0.942** 帖子平均热度 −0.080 0.792** 0.455* 0.468** 粉丝数 0.062 0.959** 0.390* 0.378* 注:**、*分别表示在1%、5%水平下显著;所有相关系数的计算中N=30。 表 5趋同化程度之间的一致性分析
用户分层变量 4 种趋同化程度的 Cronbach'sα系数 项数 注册时长 0.974 4 微博用户经验值 0.967 4 关注他人数 0.971 4 帖子平均热度 0.807 4 粉丝数 0.859 4 -
[1] CORNFILED M, CARSON J, KALIS A, et al. Buzz, blogs and beyond: the internet and the national discourse in the fall of 2004[EB/OL]. [2020-05-20].http://www.pewinternet.org/ppt/buzz_blogs__beyond_Final05-16-05.pdf. [2] LEE J K, CHOI J, KIM C, et al. Social media, network heterogeneity, and opinion polarization[J]. Journal of Communication, 2014, 64(4): 702-722.doi:10.1111/jcom.12077 [3] BARBERA P. How social media reduces mass political polarization[EB/OL]. [2020-01-21].http://pablobarbera.com/static/barbera_polarization_APSA.pdf. [4] BRUNDIDGE J. Encountering ‘difference’ in the contemporary public sphere: the ccontribution of the internet to the heterogeneity of political discussion networks[J]. Journal of Communication, 2010, 60(4): 680-700.doi:10.1111/j.1460-2466.2010.01509.x [5] GARRETT R K. Echo chambers online? Politically motivated selective exposure among internet news users[J]. Journal of Computer-Mediated Communication, 2009, 14(2): 265-285.doi:10.1111/j.1083-6101.2009.01440.x [6] KENIX L J. Blogs as alternative[J]. Journal of Computer-Mediated Communication, 2009, 14(4): 790-822.doi:10.1111/j.1083-6101.2009.01471.x [7] WOJCIESZAK M E, MUTZ D C. Online groups and political discourse: do online discussion spaces facilitate exposure to political disagreement?[J] Journal of Communication, 2009, 59(1): 40-56.doi:10.1111/j.1460-2466.2008.01403.x [8] FREELON D, LYNCH M, ADAY S. Online fragmentation in wartime: a longitudinal analysis of tweets about syria, 2011–2013[J]. The ANNALS of the American Academy of Political and Social Science, 2015, 659(1): 166–179.doi:10.1177/0002716214563921 [9] LESKOVEC J, BACKSTROM L, KUMAR R, et al. Microscopic evolution of social networks[C]//Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Las Vegas, Nevada, USA, 2008: 462–470. [10] 马克斯·霍克海默, 西奥多·阿道尔诺. 启蒙辩证法: 哲学断片[M]. 渠敬东, 曹卫东, 译. 上海: 上海人民出版社, 2006. [11] 赫伯特·马尔库塞. 单向度的人[M]. 刘继, 译. 上海: 上海人民出版社, 2008. [12] 克莱·舍基. 人人时代: 无组织的组织力量[M]. 胡泳, 沈满琳, 译. 杭州: 浙江人民出版社, 2015. [13] HIMELBOIM I, MCCREERY S, SMITH M. Birds of a feather tweet together: integrating network and content analyses to examine cross-ideology exposure on twitter[J]. Journal of Computer-Mediated Communication, 2013, 18(2): 154-174. [14] 朱庆华, 袁园, 孙霄凌. 微博用户关注兴趣的社会网络分析[J]. 数据分析与知识发现, 2012(2): 68-75. [15] 陈福平, 许丹红. 观点与链接: 在线社交网络中的群体政治极化[J]. 社会, 2017, 37(4): 217-240.doi:10.3969/j.issn.1004-8804.2017.04.008 [16] 王晓光. 博客社区内的非正式交流: 基于网络链接的实证分析[J]. 情报学报, 2009, 28 (2): 248-256.doi:10.3772/j.issn.1000-0135.2009.02.014 [17] LAWRENCE E, FARRELL S H. Self-segregation or deliberation? Blog readership, participation and polarization in American politics[J]. Perspectives on Politics, 2010, 8(1): 141-157.doi:10.1017/S1537592709992714 [18] 翟秀凤. 创意劳动抑或算法规训?: 探析智能化传播对网络内容生产者的影响[J]. 新闻记者, 2019 (10): 4-11. [19] 蔡卫平. 传媒同质化现象动因探析[J]. 当代传播, 2008(3): 34-36. [20] 曹洵, 张志安. 社交媒体意见群体的特征、变化和影响力研究[J]. 新闻界, 2017(7): 24-30. [21] 罗春海, 刘红丽, 胡海波. 微博网络中用户主题兴趣相关性及主题信息扩散研究[J]. 电子科技大学学报, 2017, 46(2): 458-468.doi:10.3969/j.issn.1001-0548.2017.02.022 [22] 彭兰. 导致信息茧房的多重因素及“破茧”路径[J]. 新闻界, 2020(1): 30-38+73. [23] COLLEONI E, ROZZAA, ARVIDSSON A. Echo chamber or public sphere?Predicting political orientation and measuring political homophily in Twitter using big data[J]. Journal of Communication, 2014,64(2): 317-332. [24] CONOVER M, RATKIEWICZ J, FRANCISCO M, et al. Political polarization on twitter[C]//ADAMIC L, BAEZA-YATES R, COUNTS S (eds.). Proceedings of the fifth international AAAI conference on weblogs and social media. Palo Alto: AAAI Press, 2011: 89–96. [25] 彭兰. 连接与反连接: 互联网法则的摇摆[J]. 国际新闻界, 2019, 41(2): 20-37. [26] LIN Z, BROUCKE M, FRANCIS B. Local control strategies for groups of mobile autonomous agents[J]. IEEE Trans Automatic Control, 2004, 49(4): 622-629.doi:10.1109/TAC.2004.825639 [27] JIANG J, XIA X. Prominence convergence in the collective synchronization of situated multi-agents[J]. Information Processing Letters, 2009, 109(5): 278-285.doi:10.1016/j.ipl.2008.11.010 [28] JADBABAIE A, LIN J, MORSE A S. Coordination of groups of mobile autonomous agents using nearest neighbor rules[J]. IEEE Trans Automatic Control, 2003, 48(6): 998–1001. [29] JIANG Y, JIANG J. Contextual resource negotiation-based task allocation and load balancing in complex software systems[J]. IEEE Transactions on Parallel & Distributed Systems, 2009, 20(5): 641-653. [30] WENG J, LIM E, JIANG J, et al. Twitter rank: finding topic-sensitive influential twitterers[C]//Proceedings of the Third International Conference on Web Search and Web Data Mining. New York, 2010. [31] REYNOLDS C W. Flocks, herds and schools: a distributed behavioral model[J]. ACM SIGGRAPH Computer Graphics, 1987, 21(4): 25-34.doi:10.1145/37402.37406 [32] DUMAIS S T. Latent semantic analysis[J]. Annual Review of Information Science and Technology, 2004, 38(1): 188–230. [33] 阿尔都塞. 哲学与政治: 阿尔都塞读本[M]. 陈越, 编译. 长春: 吉林人民出版社, 2003. [34] 尼尔·波兹曼. 娱乐至死·童年的消逝[M]. 章艳, 吴燕莛, 译. 桂林: 广西师范大学出版社, 2009.