Research
来自计算网络心理实验室
目录
理论研究
网络行为特征指标体系
在探讨网络用户的网络使用行为与其自身心理特征的关系时,既有研究在提取能够表征网络用户的心理特征的网络使用行为特征时缺乏理论体系框架的指导,致使网络使用行为特征提取的主观随意性较大,网络使用行为特征提取的种类有限。鉴于此,我们开展相关研究,旨在建立一个基于心理学理论视角的网络使用行为指标体系,从而指导网络使用行为特征的提取,进而提升基于网络使用行为的心理特征预测模型的精度。
网络内容心理语义分析
用户在网络上发表的内容与其心理特征具有一定的相关性,我们提出了基于词语心理学类别标注的网络内容心理分析,研发了基于LIWC的中文心理分析词典、微博心理分析词典和“文心”中文心理分析系统,并拟开展基于Topic Model的词库扩展技术研究。
网络人格结构
人格作为心理学研究领域当中的一个重要组成部分,对于解释和预测人的行为有着重要意义。网络的发展与人的交互作用日益显著,网络语境与现实语境存在着较大的差异,而现有的人格结构主要是从现实语境中产生的,在解释网络用户行为过程中常常遇到困难,研究网络人格结构将有助于我们从心理层面识别网络用户身份,深入了解网络用户的行为特征并预测用户的网络行为。实验室在网络人格结构方面的研究分为两个步骤,第一步是根据词汇学假设建立微博人格结构,第二步将利用深度学习(Deep Learning)的方法从用户的网络行为直接建立人格结构的特征表达向量,以期建立一个网络用户心理体系。
计算建模
在进行网络用户心理特征建模时,我们需要开展用户实验,招募一定数量的被试,同时获得他们的心理特征标注及网络行为特征,并利用机器学习方法,以用户的网络行为特征为输入变量,以用户的心理特征标注为目标变量,建立用户心理特征预测模型。为了能够以最小的成本,建立能够高效、准确预测用户心理特征的模型,我们分别引入了主动学习、半监督学习、迁移学习、多任务学习等方法。
机器学习方法研究
主动学习
在进行用户实验时,需要进行用户抽样,在抽样过程当中,可能会引入抽样偏置;此外,在开展心理学实验时,对每个用户进行心理特征标注需要花费的成本较高。为了尽可能地减小抽样偏置,并选取、邀请有效的用户参加心理学实验,从而节省实验成本,并获得对建模更有价值的数据,我们采用了机器学习领域的“主动学习”方法。
半监督学习
在网络心理研究中,用户标注数据具有成本高、标注数据少的特点,而无标注数据则成本低、数据量大,为了能够在这样的数据集上,充分利用无标注数据,建立更有效的用户心理特征预测模型,我们引入机器学习领域的“半监督学习”方法,从与标注数据相关的无标注点中获得知识,提升预测模型的有效性。
迁移学习
在现实世界中,广泛存在人们用来训练模型的数据集与待推广领域的数据集的数据分布或特征空间不一致的情况,这时候由于不满足机器学习的独立同分布假设,传统监督学习方法常常表现不佳。为了处理这类问题,迁移学习研究受到大量关注并逐渐发展起来。迁移学习一般是指利用与目标任务相关的辅助数据集帮助目标任务上的学习和预测。而在利用因特网的网络行为预测用户的心理特征时,同样存在着网络行为的测试集与训练集的分布或特征空间不同的情况,需要引进迁移学习来改进心理特征预测模型。
多任务学习
人格、心理健康和社会态度等心理属性皆是多维度指标,各个指标之间虽然相对独立,却存在某种较为紧密的联系。在实际建模预测中,属于多个具有相关性的任务在同一训练集的同时学习问题。传统的思路是在训练集上对各个任务分别训练模型。这种方法仅仅考虑了各个任务的特定信息;忽略了任务之间的相关性,没有考虑到任务之间的某些共享信息。因而为了提高学习效果,就需要考虑多任务学习。
网络用户心理建模
网络用户心理特征建模是我们研究的核心内容,基于用户网络行为数据,建立了用户人格、心理健康、主观幸福感及群体社会态度的预测模型。
人格预测
本课题组已经尝试在局域网网关、网络新媒体、网络浏览器等不同颗粒度层次的网络平台上开展了相关的研究。以网络新媒体(新浪“微博”)为例,我们从1953485名新浪“微博”活跃用户中随机选取了547名用户作为被试,下载其“微博”行为记录,并且进一步由原始记录中提取839种行为特征,以此作为预测变量;同时,对全体被试施测人格问卷,获取其在各人格维度上的得分,以此作为结果变量。分别利用“支持向量机”(Support Vector Machine, SVM)与“Pace回归”(Pace Regression)算法训练基于“微博”行为的人格特征预测模型。研究结果表明,基于“微博”行为的人格特征预测模型具有良好的测量属性,通过网络使用行为来预测用户的人格特征是完全可行的。
心理健康预测
利用被试的微博行为代替通过问卷收集的答案,并且用机器学习的方法建立基于网络行为的心理健康(抑郁)预测模型,通过模型计算得出被试的心理健康(抑郁)状态评分。
主观幸福感预测
我们在个体层面上对社会媒体用户进行主观幸福感的预测,通过划分不同的特征集合:人口统计学信息、用户微博行为特征、用户微博内容特征,以其主观幸福感作为目标变量,通过StepWise、LASSO、Support Vector Regression、Multivariate Adaptive Regression Splines等机器学习算法来进行建模。利用这种方法,在人数规模为1785的用户样本上,取得的预测效果能够达到其他研究者以居民人均收入、受教育水平等客观统计指标达到的最佳预测准确度水平,预测模型得到的预测分数与心理学量表得到的测评分数之间的相关系数达到0.6。
群体社会态度预测
根据先前研究的经验,社会态度的指标体系包含了四方面的指标,分别为社会状况评价、社会风险判断、经济发展信心和对政府执政的满意程度。本研究在广东省开展用户实验,并采集了2018个合格样本。利用微博数据,采用多任务回归进行群体社会态度的预测。预测结果和标注结果的平均相关系数达0.41,平均预测误差率为15.5%。本研究利用网络数据的可回溯性,尝试描述某地群体社会态度随时间的变化情况。
移动心理健康
通过对相关领域研究的深入调研,我们提出基于认知行为疗法(CBT)进行心理自助调节的研究解决方案,设计并实现在Android移动终端上进行用户短信收集、心理调查及反馈、心理自助调节服务等系统。
研究应用
心导网
经过数次专家研讨与审核确定了开发方案,在此基础上研发了基于中文语境的自助式网络心理咨询程序(“走出抑郁”与“克服焦虑”)([1]),旨在针对抑郁情绪问题与焦虑情绪问题进行在线干预。
心理地图WebAPP
基于科研成果建立了“心理地图”应用([2]),利用小规模用户的微博数据及其对应的心理特征标注,利用机器学习方法,建立了心理特征预测模型。利用建立的模型,就可以对其他的未填写过心理学量表的用户进行心理特征的预测。
文心:中文语言心理分析系统
为了建立中文语言心理特征分析的“一揽子”解决方案,并将我们的研究成果共享给其他的研究者,我们开发了“文心”(TextMind)中文心理分析系统。除用于第三方调用的程序库外,我们还建立了“文心”系统的Web版([3]),供所有用户便捷地使用我们的研究成果。
网络用户自杀预防
随着近年来越来越多的社交网络平台给人们更多机会在虚拟集群中吐露自己的感受和观点,不同于传统研究方法的被动性,通过社交网络能主动寻找有潜在自杀倾向的个体,并对他们产生影响。实验室在自杀预防方面的工作主要从三个层面开展:1)研究自杀意念与心理特征之间的影响关系;2)发现自杀用户在行为和内容表达上与普通用户的差异;3)建立用户自杀意念的识别系统。
- 本页面最后修改于2014年7月31日 (星期四) 16:40。
- 本页面已经被访问过53,465次。