一个QQ群里的消息有时候太多,尤其是大型QQ群。那么这些消息记录有什么用呢?今天我们就来看看它。
首先从 QQ 消息管理器中导出消息记录,保存的文本类型选择 txt 文件,命名为“全部消息记录”。把她先放在一边,打开R,引入需要的扩展包,没有的可以用install.packages(”扩展包名”) 安装。
然后引入消息记录文件
qqsrcdata<-readLines("C:\\Users\\joe\\Desktop\\全部消息记录.txt",encoding="UTF-8")
然而我们更关心谁在什么时间说话,所以要把它提取出来。
srcdata<-qqsrcdata[grep("^\\d{4}-\\d{2}-\\d{2} \\d+:\\d{2}:\\d{2} .+$",qqsrcdata)]
今天暂时先对发言人进行分析
id<-sub("\\d{4}-\\d{2}-\\d{2} \\d+:\\d{2}:\\d{2} ", "", srcdata)
user <- as.data.frame(table(id))
user <- user[order(user$Freq,decreasing=T),]
user[1:10,]
这样就可以得到发言前十的人,这和群里面的每个人的发言等级也是类似的。
至于发言时间以及两者的混合,下次再说。