中文心理语言分析系统 / SCLIWC2024 词典
文心(TextMind)是面向简体中文的心理语言分析系统,基于 LIWC(Linguistic Inquiry and Word Count)方法论,通过统计文本中不同心理语言类别的词频比例,揭示文本背后的心理特征与表达偏好。
系统搭载最新修订的 SCLIWC2024 词典。该词典以 LIWC-22 英文词典为参照,在 CLIWC2015 与 SCLIWC 词典基础上,经过系统翻译、人工筛选、词向量扩展及专家校验四个阶段修订而成,共收录 19952 个词条,覆盖 116 个心理语言类别,涵盖语言维度、心理过程、社会过程、认知过程、感知过程、个人关注等多个层面。
使用文心系统及其词典,即视为同意以下条款:
如有问题或建议,请联系:cuixt@psych.ac.cn / tszhu@psych.ac.cn
选择一个示例文本,体验 SCLIWC2024 心理语言词频分析。分析完全在浏览器本地完成,不上传任何数据。
文心中文心理分析系统是绿色版软件,不需要安装,直接打开 textmind.exe 运行即可。
dic 目录下词典文件是否完整(应包含 dic.scliwc2204.ccpl.words、map.textmind.ALL、sym.Punctuation)。SCLIWC2024(Simplified Chinese Linguistic Inquiry and Word Count 2024)是面向简体中文的心理语言词典,旨在为中文文本的心理语义分析提供标准化工具。
近年来,LIWC 工具在注意力网络、认知过程、情感调节、社会行为、思维方式、心理健康等领域得到广泛应用,并在人格预测、沟通行为分析、政治竞选分析等场景中构建了有效的预测模型。最新版 LIWC-22 词典新增了大量评估社会心理结构的变量,进一步拓展了应用潜力。
为推动 LIWC 工具的中文化进程,SCLIWC2024 词典在 CLIWC2015 和旧版 SCLIWC 基础上,参照 LIWC-22 进行了系统修订,历经四个阶段:整合已有中文 LIWC 词典并新增 LIWC-22 类别、融合 LIWC-22 词典结构与新旧词更新、基于腾讯 AI Lab 词向量模型扩展词条、陈旧词清理与词典结构校验。最终形成包含 116 个心理语言类别、19952 个词条的词典。
SCLIWC2024 的类别维度按 LIWC-22 划分为 Basic(基础)和 Expanded(扩展)两大层级,涵盖以下主要维度:
| 维度 | 包含类别 |
|---|---|
| 语言维度 (Linguistic) | function, pronoun, ppron, i, we, you, shehe, they, ipron, number, prep, auxverb, adverb, conj, negate, verb, quantity 等 |
| 驱动力 (Drives) | affiliation, achieve, power, reward, risk |
| 认知过程 (Cognition) | cogproc, insight, cause, discrep, tentat, certitude, differ, memory, allnone |
| 情感过程 (Affect) | tone_pos, tone_neg, emotion, emo_pos, emo_neg, emo_anx, emo_anger, emo_sad, swear |
| 社会过程 (Social) | socbehav, prosocial, polite, conflict, moral, comm, socrefs, family, friend, female, male |
| 文化 (Culture) | politic, ethnicity, tech |
| 生活方式 (Lifestyle) | leisure, home, work, money, relig |
| 生理 (Physical) | health, illness, wellness, mental, substances, sexual, food, death |
| 感知与相对性 (Perception) | attention, motion, space, visual, auditory, feeling |
| 时间焦点 (Time) | focuspast, focuspresent, focusfuture |
| 状态与动机 (States & Motives) | need, want, acquire, lack, fulfill, fatigue, curiosity, allure |
| 会话特征 (Conversation) | netspeak, assent, nonflu, filler |
如在研究中使用了文心系统或 SCLIWC2024 词典,请引用:
崔雪婷, 陈思仪, 赵楠, 刘晓倩, 朱廷劭. (2024). 简体中文LIWC2024 (SCLIWC2024) 词典的修订与验证. ChinaXiv:202404.00159v1.
https://psych.chinaxiv.org/abs/202404.00159