Predicting the Hate_ A GSTM Model based on COVID-19 Hate Speech Datasets

阅读笔记作者：金地

1 原文作者

Xiao-Kun Wu (School of Journalism & Communication, South China University of Technology, China),

Tian-Fang Zhao (School of Journalism & Communication, Jinan University, China),

Lu Lu (School of Computer Science and Engineering, South China University of Technology, China),

Wei-Neng Chen (School of Computer Science and Engineering, South China University of Technology, China),

2 论文来源

IPM 2022 (CCF-B)

3 论文地址

https://www.sciencedirect.com/science/article/pii/S0306457322001121?via%3Dihub

4 论文简介

现有的对社交媒体中仇恨言论的分析可以大致分为两类：

这类研究具有良好的社会学意义，但研究成果的拓展和积累相对薄弱。研究结论和结果不能直接转移到其他案例。

这类研究更加注重方法，但对研究成果的解读相对简单，缺乏深入探讨。

跨学科研究可以突破上述两类研究瓶颈。

社会科学角度——全面收集和分析社会数据，发现信息传播规律，得出社会学结论【全面分析COVID中的仇恨情绪】

计算科学角度——将研究成果的规律和结论转化为可重用的模型和方法【进行自动化的形势分析和规律揭示，有助于预防社会危机】

5 解决问题

社会科学角度——全面收集和分析社会数据，发现信息传播规律，得出社会学结论【全面分析COVID中的仇恨情绪】

计算科学角度——将研究成果的规律和结论转化为可重用的模型和方法【进行自动化的形势分析和规律揭示，有助于预防社会危机】

6 本文贡献

7 论文方法

本文提出高斯时空混合模型GSTM，共分为时间原理、空间原理、混合部分三个部分。

时间测量主要是用来估计曝光峰和情绪峰之间的平均时间。在X轴上考虑了两个时间序列：由T_1=[t_1,1,t_1,2,…,t_(1,m)]构成的曝光峰，以及由T_2=[t_2,1,t_2,2,…,t_(2,m)]构成的每个曝光峰后的相应推文高峰（m>=1），各高峰之间的时间间隔为：

根据前期的分析，间隔时间的数值围绕一个固定点波动，符合高斯分布。因此，曝光峰和鸣叫峰之间的时间间隔的概率分布由以下公式表示。

残差平均值Mean

均方根误差RMSE