网络搜索大数据如何揭示社会心理?
网络搜索的广泛使用及其与大众日常生活的紧密交织,使得借助网络搜索大数据研究人类的社会心理与行为规律成为可能。针对网络搜索数据中所蕴含的潜在巨大学术价值,南开大学社会心理学系陈浩副教授与中山大学传播与设计学院赖凯声副研究员、新加坡国立大学心理学系余荣军教授等人,合作撰写了英文综述《网络搜索数据如何启示社会心理学》,近日发表在网络心理学国际著名刊物《网络心理、行为与社交网络》(Cyberpsychology, Behavior, and Social Networking, 简称Cyber)上。
这篇刊发于《Cyber》2017年第10期的综述文章,分别从网络搜索数据应用于性心理、自杀、心理健康、社会偏见与不平等、公共政策与公众舆论等诸多议题研究的前沿进展,其所具备的优势、面临的挑战以及未来方向等内容,对网络搜索大数据如何助力人类的社会心理与行为研究进行了较为系统的梳理、总结和评论。赖凯声为论文第一作者,陈浩和余荣军为论文共同通讯作者。
《Cyber》是关于社交网络对社会、行为和心理影响问题的权威同行评议期刊,过去二十年中一直是社交网络和虚拟现实研究成果的刊发重镇,它见证了心理学和传播学中有关技术、人类行为与社会间复杂交互关系研究的学术共同体的快速成长。《Cyber》2016年的SSCI影响因子为2.57,是心理学和传播学两大学科双一区期刊。
下文为该综述的中文概述翻译:
互联网的普及及其引发的信息技术革命,使得人们步入了信息充裕的大数据时代(Cukier, 2010)。作为人们获取日常信息的重要渠道,网络搜索数据客观、详尽地记录了用户的搜索行为和信息,这使得借助网络数字化痕迹资料来研究人类的心理与行为规律成为可能(Wilson, Gosling, & Graham, 2012; Asur & Huberman, 2010)。网络搜索是人们最为流行的网络行为活动之一。皮尤互联网研究中心2012年一份关于美国互联网用户搜索引擎使用调查的数据显示:近90%的美国互联网用户通过搜索引擎来获取信息(Purcell, Brenner, & Rainie, 2012)。人们可能借助网络搜索感兴趣的电影、关注的名人动态、最新的社会政策等。其内容涉及工作、学习、娱乐、消费等方方面面,与人们的日常生活有着广泛而密切的联系。
一、人们为什么要网络搜索?
作者认为,网络搜索本质上属于信息搜索或信息搜寻行为,可主要采用以下几种理论视角解释人们的网络搜索动机:
(1)进化视角的观点认为,拥有搜寻、管理和应用信息的能力有利于增加早期人类成功找到合适的配偶和食物的几率(Spink, 2010)。因此,信息搜索可以提高人类生存、发展和繁衍的优势,并满足人们适应和控制环境的基本需要。
(2)信息学的观点认为,人类具有与寻求答案、降低不确定感、意义寻求等动机相关的信息需求,因而信息搜寻行为即是满足和实现人们信息需求的过程(Case, 2007)。
(3)传播学的观点,把网络搜索视为一种媒介的消费行为。例如,游戏理论(Play Theory)倾向于将信息搜索视为一种娱乐媒介,而不是常规视角下关于现实信息的获取工具(Case, 2007)。
(4)教育学的观点,则认为网络搜索是为了满足人们在搜索中学习的需要。例如,根据学习动机由浅入深的程度将网络搜索活动分为:查询式搜索、学习式搜索和研究式搜索三种类型(Marchionini, 2006)。
那么,网络搜索的心理学内涵是什么?作者认为,用户的一次网络搜索,即意味着用户对该内容的一次关注或兴趣。从群体层面看,网络搜索引擎提供的针对特定搜索词的时空频率,即可反映特定用户群体在特定时间和空间内,对该问题的关注或兴趣程度。
二、网络搜索大数据的研究优势
作者认为,相较于社会科学传统研究中经常采用的问卷法、实验法而言,网络搜索大数据主要在数据客观性、生态效度、时效性以及宏观公共政策实践方面具有优势或独特价值。
(1)数据的客观性、生态效度高。网络搜索引擎数据的用户人群覆盖面大,数据客观性和生态效度均较高。
(2)时间精度高。网络搜索引擎在响应用户搜索指令的同时也实时产生了搜索记录,从理论上而言可实现对用户搜索行为的实时追踪。
(3)在区域公共政策层面的应用价值高。结合搜索行为发生的地理位置信息,网络搜索数据可实现对县、省市、州、国家等不同区域水平的研究议题进行操作化测量,为研究者挖掘宏观层面的社会心理现象及其时空变化规律提供新的证据资料。
三、基于网络搜索大数据的社会心理研究前沿与进展
作者分别从性心理与行为、自杀行为、心理健康、社会偏见与不平等议题、公共政策效果与公众反应等方面对当前研究进展进行了详细梳理。
(1)性心理与行为
由于网络搜索数据具有客观性优势,越来越多的社会科学研究者借助网络搜索数据来探索大规模人群的性心理及其相关行为的影响和作用规律。例如,Markey和Markey(2013) 通过色情词汇搜索量来研究人类性及求偶行为的季节变化规律,发现色情词汇在Google上的搜索量较为稳定地表现出以6个月为周期的波动特征,并且在夏天和冬天搜索量达到峰值。Markey和Markey(2010)还借助Google Trend数据研究了美国三次政治选举之后大众的色情信息寻求行为规律,结果发现如果某一州所支持的政党在选举中最终获胜,那么该州大众在大选后一周的色情相对搜索量显著高于所支持政党最终失败的州。该结果验证了进化心理学的“挑战假说”,即在竞争中获胜的个体,相对于在竞争中失败的个体拥有更多的睾丸素水平的提升以及对性行为兴趣的增强(Archer, 2006)。
此外,Maclnnis和Hodson(2015)利用Google搜索引擎上与性相关内容的搜索数据发现,州水平的宗教性与性相关内容的一般性网页搜索具有中高度的正相关,州水平的保守主义倾向与性相关图片的搜索也具有中高度的正相关。该研究结果表明,对于保守主义倾向和宗教性越强的州,其大众在匿名化的私人网络空间中对性相关内容的关注度反而越高。这与人们通常认为美国的宗教信仰程度和保守主义,与反对非传统性行为是密切相关的直觉是相反的,为此研究者还从精神分析理论的角度对该结果进行了解释。
(2)自杀行为
借助网络搜索数据揭示人类的自杀行为特征也是相关研究的一大热点。例如,McCarthy(2010)最早将自杀相关的Google搜索数据应用于自杀问题。他的研究结果发现,美国2004至2007年期间以“自杀”为关键词的Google搜索量,与美国疾控中心(Centers of Disease Control)提供的实际自杀和故意自残率存在一定的关联,但在不同人群中有所不同。自杀搜索量与整体人群的实际自杀率数据呈显著负相关,与故意自残率相关不显著;但“自杀”的搜索量与15-25岁的青少年群体的实际自杀率和故意自残率均呈显著正相关。与已有自杀研究中关注自杀相关搜索的时间序列数据不同,Gunn III和Lester(2013)则研究了不同地域的自杀搜索量与实际自杀之间是否存在关联。他们发现2009年,美国50个州的实际自杀率与“自寻了断”等搜索量呈现正相关。
(3)心理健康
网络搜索数据也被用于探索各地区、国家水平的抑郁、焦虑等心理健康特征。例如,人们普遍认为高纬度的个体在冬季更容易陷入情绪低落状态,但之前并没有实证研究在全球范围内检验人们的情绪随季节变化的规律。因此,Yang,Huang,Peng和Tsai(2010)以“抑郁(depression)”为关键词的Google搜索量作为测量抑郁的代理指标,考察了2004年1月1日至2009年6月30日期间,全球54个国家抑郁的季节与地域波动规律。结果发现南北半球的抑郁波动规律相反,且抑郁的搜索量与气候中的温度呈显著负相关。但是抑郁与温度之间的负相关强度是依赖于纬度的。纬度越高的地区,抑郁的搜索量与温度的负相关程度越高;纬度低的地区,二者的关系则减弱了。
(4)社会偏见与不平等
社会偏见与不平等问题是社会心理学的重要研究议题之一,研究者也尝试发挥网络搜索证据的优势,并展开了一系列的探索。例如,Stephens-Davidowitz(2014)认为,在研究社会偏见问题时,问卷调查法具有社会称许性反应,人们倾向于隐藏社会不接受的态度,例如对黑人的负面感受。相比其他方式而言,人们在Google上进行色情等敏感性搜索的方式更容易表达其真实的兴趣。因此,他搜集了美国2004~2007年期间有种族歧视性语言的关键词搜索量作为测量一个地区种族歧视的代理指标,并进一步探讨了种族歧视给黑人总统候选人带来了多大程度的负面影响。研究结果发现,在控制了其他变量的情况下,种族歧视搜索量仍能稳健地负向预测奥巴马的投票支持率,并且种族歧视使得奥巴马在2008和2012的选举中付出了大约4个百分点的大众选票损失代价。
在社会不平等方面,已有研究证据表明:社会不平等会使得人们更加关注社会等级,进行更多的社会比较,从而导致阶层竞争(例如,Bowles & Park, 2005)。Walasek和Brown(2015)根据社会等级假说(social rank hypothesis)出发,认为处于不平等社会的个体更倾向于把资源投入到地位寻求行为(status-seeking behaviors),例如更加关注从表面上看来与地位直接相关的商品上。在控制了各州的人均收入等社会经济变量的条件下,他们借助基于Google网络搜索数据发现,来自收入越不平等的州,人们对于阶层相关物品的关注越高,对奢侈品等与外在地位直接相关的物品搜索量越大,从而在宏观州层面验证了社会等级假说。此外,他们关于收入不平等与阶层物品关注之间的关系在国家水平上也得到了进一步的验证。
(5)公共政策与公众反应
网络搜索数据还可用于探索人们对于健康类公共政策的行为反应规律,检验烟草、堕胎等公共政策的实际效果。例如,Huang,Zheng和Emery(2013)利用搜索数据(百度指数和Google搜索指数)考察中国网民对室内公共场所禁止吸烟政策的反应。结果发现,关于“禁烟”、“电子烟”以及“戒烟”的网络搜索量与媒体报道量显著正相关,证明了至少在短期内,禁烟政策对大众的吸烟行为有显著影响。Reis和Brownstein(2010)利用Google上“堕胎”的网络搜索数据,研究了美国国内50个州以及37个国家的堕胎搜索量与当地实际堕胎率、堕胎政策(是否合法)的之间的关系。研究结果发现,无论是在美国国内,还是全球不同国家之间,堕胎的网络搜索量与当地堕胎政策的合法性或堕胎服务可得性有着直接关联,并且与实际堕胎率之间均呈现显著的负相关。他们认为,在堕胎合法的地区,人们越容易通过直接渠道获得堕胎服务,因而相对于堕胎不合法的地区的堕胎网络搜索量会更少。该研究结果验证了已有研究认为本地堕胎限制政策会导致人们向外地寻找堕胎服务的观点(例如,Haas-Wilson, 1993)。可见,网络搜索数据可作为评估公共健康政策效果的一种经济、便捷的重要数据来源之一。
(6)小结
根据研究目的和视角的不同,网络搜索数据目前应用于社会心理问题的研究可归纳为描述性、相关性、因果推断性、预测性以及政策效果评估性五种类型。其中,描述性研究主要借助网络搜索数据来揭示人们对某一议题本身的关注度或其背后的心理特征,随时间和空间变化的规律(例如,Yang, Huang, Peng, & Tsai, 2010)。相关性研究旨在挖掘人们针对某一主题的网络搜索行为与其他行为(尤其是线下实际行为)之间的相关关系(例如,McCarthy, 2010)。因果推断研究的开展通常基于一定的假设推导或理论观点,希望借助网络搜索数据指标代理大众的特定心理与行为变量,挖掘其与其他变量之间的关系,从而为变量之间的因果关系提供客观数字轨迹证据(例如,Walasek & Brown, 2015)。预测性研究主要是基于网络搜索数据能较好地反映人们在从事重要行为决策(例如,自杀)当时或之前心理状态的假设,因此希望通过网络搜索数据对宏观人群的重要行为问题进行预测(例如,Hagihara, Miyazaki, & Abe, 2012)。政策效果评估性研究,充分发挥了网络搜索数据可低成本实现对大范围人群针对某一社会议题的关注度进行跨时间、跨地域追踪研究的优势,主要探索公众对特定政策的实际反馈行为在特定时空中的映射模式(例如,Huang, Zheng, & Emery, 2013)。
四、挑战与未来方向
最后,作者总结了网络搜索研究需要注意样本的代表性偏差、在构建网络搜索指标时面临的信效度挑战、相关研究的可重复性问题与预测陷阱、分析水平局限等问题。例如,在分析水平上,绝大多数已有的网络搜索研究主要在州、国家等群体层面展开,相关结论能否推论到个体水平仍有待后续研究进行检验。当然,这种局限在一定程度上与出于数据隐私等因素考虑,当前研究者仅能获取群体水平的匿名化数据有一定关系。
在未来研究方面,作者认为未来的网络搜索大数据研究,应该充分发挥其在数据获取的时间和地理颗粒度、获取成本等方面的优势,去探索已有传统问卷调查、实验等手段无法或者很难实现的未知领域。例如,网络搜索数据在揭示社会偏见、性偏好等私秘程度和社会赞许程度较强的研究主题上具有独特的方法论价值。此外,未来的网络搜索研究可进一步整合社会心理学相关理论资源,提升大数据研究的理论价值。例如,已有研究者借助网络搜索的数据资源优势在宏观群体层面检验了“挑战假说”、“社会等级假说”,有效地整合了大数据的技术优势与社会科学的问题意识和理论优势。
五、结语
基于网络搜索大数据的社会心理学研究,为探究大规模群体层面的学术问题,尤其是敏感性议题,开辟了新的路径,从而能够与传统的研究方法相互补充。它将传统关注个体水平的社会心理学研究,进一步拓展至各种不同规模群体的分析水平下来理解人类行为,这无疑将会深化我们对于互联网时代背景下社会行为和群体心理机制的理解。
原文内容参见:Lai, K., Lee, Y., Chen, H., & Yu, R. (2017). Research on web search behavior: How online query data inform social psychology. Cyberpsychology, Behavior, and Social Networking, 20(10), 596-602.
期刊网站链接:2019/20190426A/F0114568
编辑:潘雨 江祥雪
· · · · · ·