文心系统 TextMind

中文心理语言分析系统 / SCLIWC2024 词典

SCLIWC2024 心理语义检测 116 心理类别 文本分析

简介

文心(TextMind)是面向简体中文的心理语言分析系统,基于 LIWC(Linguistic Inquiry and Word Count)方法论,通过统计文本中不同心理语言类别的词频比例,揭示文本背后的心理特征与表达偏好。

系统搭载最新修订的 SCLIWC2024 词典。该词典以 LIWC-22 英文词典为参照,在 CLIWC2015 与 SCLIWC 词典基础上,经过系统翻译、人工筛选、词向量扩展及专家校验四个阶段修订而成,共收录 19952 个词条,覆盖 116 个心理语言类别,涵盖语言维度、心理过程、社会过程、认知过程、感知过程、个人关注等多个层面。

使用协议

使用文心系统及其词典,即视为同意以下条款:

  1. 本系统及词典仅限学术研究用途,不得用于商业目的,不得将词典的部分或全部内容转移给第三方。
  2. 在研究成果中使用了本系统或词典,请在报告中作相应引用
  3. 本系统使用了 NLPIR(非商业免费)和 LTP(学术免费)等第三方组件,请同时遵守其使用协议。
  4. 为保障用户数据隐私安全,本网站不提供在线文本分析服务。页面上的"在线试用"仅使用内置示例文本在浏览器本地运行,不会上传任何数据。如需分析自有文本,请下载系统在本地离线使用。

如有问题或建议,请联系:cuixt@psych.ac.cn / tszhu@psych.ac.cn

下载

📦

文心系统

完整程序包,含 textmind.exe、NLPIR 分词引擎及 SCLIWC2024 词典,解压即用。适用于 Windows。

95 MB 下载
📖

SCLIWC2024 词典

最新版词典,基于 LIWC-22 修订,19952 词条,116 个心理语言类别。

149 KB 下载

在线试用

选择一个示例文本,体验 SCLIWC2024 心理语言词频分析。分析完全在浏览器本地完成,不上传任何数据。

分词方式 (在线演示使用简易分词,精确分析请下载桌面程序)
特征提取粒度

使用说明

文心中文心理分析系统是绿色版软件,不需要安装,直接打开 textmind.exe 运行即可。

常见问题

Q使用 LTP 分词器,按文件计算特征时程序崩溃?
A单个文件过大,导致 LTP 错误。建议换用 NLPIR 分词或将大文件拆分为多个小文件处理。
QLTP 分词器 / NLPIR 分词器变灰色,无法选择?
A无法正确加载分词器,分词器模型损毁或者 NLPIR 授权过期,请从 NLPIR GitHub 下载最新授权文件,或联系我们。
Q输出结果全为 0?
A检查 dic 目录下词典文件是否完整(应包含 dic.scliwc2204.ccpl.words、map.textmind.ALL、sym.Punctuation)。
Q文本出现乱码?
A确保输入文件编码为 ANSI / GBK / UTF-8 / Unicode 之一。不支持无 BOM 的 UTF-8 编码格式。

词典说明

SCLIWC2024 词典

SCLIWC2024(Simplified Chinese Linguistic Inquiry and Word Count 2024)是面向简体中文的心理语言词典,旨在为中文文本的心理语义分析提供标准化工具。

近年来,LIWC 工具在注意力网络、认知过程、情感调节、社会行为、思维方式、心理健康等领域得到广泛应用,并在人格预测、沟通行为分析、政治竞选分析等场景中构建了有效的预测模型。最新版 LIWC-22 词典新增了大量评估社会心理结构的变量,进一步拓展了应用潜力。

为推动 LIWC 工具的中文化进程,SCLIWC2024 词典在 CLIWC2015 和旧版 SCLIWC 基础上,参照 LIWC-22 进行了系统修订,历经四个阶段:整合已有中文 LIWC 词典并新增 LIWC-22 类别、融合 LIWC-22 词典结构与新旧词更新、基于腾讯 AI Lab 词向量模型扩展词条、陈旧词清理与词典结构校验。最终形成包含 116 个心理语言类别、19952 个词条的词典。

类别体系

SCLIWC2024 的类别维度按 LIWC-22 划分为 Basic(基础)和 Expanded(扩展)两大层级,涵盖以下主要维度:

维度包含类别
语言维度 (Linguistic)function, pronoun, ppron, i, we, you, shehe, they, ipron, number, prep, auxverb, adverb, conj, negate, verb, quantity 等
驱动力 (Drives)affiliation, achieve, power, reward, risk
认知过程 (Cognition)cogproc, insight, cause, discrep, tentat, certitude, differ, memory, allnone
情感过程 (Affect)tone_pos, tone_neg, emotion, emo_pos, emo_neg, emo_anx, emo_anger, emo_sad, swear
社会过程 (Social)socbehav, prosocial, polite, conflict, moral, comm, socrefs, family, friend, female, male
文化 (Culture)politic, ethnicity, tech
生活方式 (Lifestyle)leisure, home, work, money, relig
生理 (Physical)health, illness, wellness, mental, substances, sexual, food, death
感知与相对性 (Perception)attention, motion, space, visual, auditory, feeling
时间焦点 (Time)focuspast, focuspresent, focusfuture
状态与动机 (States & Motives)need, want, acquire, lack, fulfill, fatigue, curiosity, allure
会话特征 (Conversation)netspeak, assent, nonflu, filler

引用

如在研究中使用了文心系统或 SCLIWC2024 词典,请引用:

崔雪婷, 陈思仪, 赵楠, 刘晓倩, 朱廷劭. (2024). 简体中文LIWC2024 (SCLIWC2024) 词典的修订与验证. ChinaXiv:202404.00159v1.
https://psych.chinaxiv.org/abs/202404.00159