我通过机器学习工具分析了数几百个推特账号,取得了初步证据表明,中国政府目前在推特上宣传对台湾的群体灭绝的言论,并可能要给台湾民众一个有中国极端性民族主义者大量涌现的印象。

接下来有证据解释与研究方法说明

[续下]
首先回顾一周前我分享的一个趋势,即2020年1月至今,在推特上“留岛不留人“这个提倡对台湾人实行群体灭绝的口号出现次数暴增(见图)

关键问题是,该趋势是中国极端性民族主义者真正的体现还是有中国政府在背后操纵?

为了回答这个问题,我对部分推文做进一步深刻的分析。

[续下]
我仔细分析了二月314条推文的内容,分为两组,提倡”留岛不留人”的账号,及批评或反应提倡者的账号。共261账号,163为提倡组,98为反应组。

通过机器学习工具 @botometer发现提倡组的可疑或像机器人的特征明显比反应组多。下面图中,右为提倡组,左为反应组,颜色越红可疑特征越多,越蓝越少。

[续下]
这个机器学习工具对推特账号提供的指数,5代表最可疑,0代表最像真人。

提倡组中50%的账号至少有两个特征的指数在4到5之间,即非常可疑或似机器人的行为。

然而,反应组中仅有4%的账号至少有两个特征的指数在4到5之间。

[续下]
该机器学习工具也计算推特账号完全自动化的可能性(叫做CAP)。CAP在提倡组与反应组之间也有很明显的区别(见图)。

倡导群体灭绝的账号当中,完全自动化的可能性在20%以上的账号有三分之一。而反应组相若比例才百分之四。

[续下]
如何解读上述数据?

我们能确定2020年1月以来,对台湾的极端性民族主义和提倡群体灭绝的简体中文推文大幅度地增加。现在根据样本,知道相关账号存在很多可疑的特征。

这些推文并不是针对一两个新闻,但大部分是针对台湾,比如蔡英文的帐号、有关台湾的新闻或中国威胁台湾的军事演习。

[续下]
这个初步分析如果反映中国政府操纵的活动,可能意味着中共要给台湾人的印象是大量中国人近期涌现于推特以表达支持武统甚至群体灭绝。

此趋势在蔡英文第二次胜选以后加速,中共也许是想通过推特行动让台湾人更害怕中国极端性民族主义,以此减少台湾民众对蔡英文立场的支持。

[续下]
这次研究结果也许还有好的一面,如果推特上大部分支持战争或“杀光台湾人”的声音是伪造的,便中国真正老百姓当中或许没这么多极端分子是为了要威胁杀害他人而翻墙上推。

[续下]
我没有推特公司大规模的数据,所以我这次有限的分析应该只是冰山一角,希望能够鼓励别人进一步探索。当然,最能够了解中国政府是否用推特扩大群体灭绝声音才是推特公司本身 @TwitterSafety

[续下]
【研究方法】

分析了2020年2月有“留岛不留人”的314条推文,给每一条代码,(1)为提倡“留岛不留人”,(2)为批评或反应提倡者。先给代码才分析相关账号可疑特征,以此减少偏见。

这些推文涉及261个不同账号,我把每一个输入机器学习工具: https://botometer.iuni.iu.edu/#!/ 

截图是工具所提供的分析数据:

[续下]
我记录了账号不同特征的指数,也记收集日期,机器学习工具在不同日期会提供不一样的指数,经时间与学习它的算法有所变化。更多说明: https://botometer.iuni.iu.edu/#!/faq 

之所以选此工具是因为一些正面评论以及它多样性的数据。专业研究机构Pew曾用过Botometer识别机器账号: https://www.pewresearch.org/fact-tank/2018/04/19/qa-how-pew-research-center-identified-bots-on-twitter/

[续下]
这次研究只是针对2月的推文,假定是1月到4月的情况都类似。此研究并非全面,也许错过其他月份的一些趋势。

下面的截图表示提倡组(1)与反应组(2)的一些基本统计数据。

要看我收集的数据,请点击: https://www.dropbox.com/s/vqpnksxpskwzagk/Feb2020-data-set.xlsx?dl=0

[完]
上述推文的英文版可见: https://twitter.com/KevinSlaten/status/1253351325234081802
You can follow @KevinSlaten.
Tip: mention @twtextapp on a Twitter thread with the keyword “unroll” to get a link to it.

Latest Threads Unrolled: