聊天记录里的小秘密(1)-qq聊天记录文件名

一个QQ群里的消息有时候太多,尤其是大型QQ群。那么这些消息记录有什么用呢?今天我们就来看看它。

聊天记录里的小秘密(1)

首先从 QQ 消息管理器中导出消息记录,保存的文本类型选择 txt 文件,命名为“全部消息记录”。把她先放在一边,打开R,引入需要的扩展包,没有的可以用install.packages(”扩展包名”) 安装。

聊天记录里的小秘密(1)

然后引入消息记录文件

qqsrcdata<-readLines("C:\\Users\\joe\\Desktop\\全部消息记录.txt",encoding="UTF-8")

然而我们更关心谁在什么时间说话,所以要把它提取出来。

srcdata<-qqsrcdata[grep("^\\d{4}-\\d{2}-\\d{2} \\d+:\\d{2}:\\d{2} .+$",qqsrcdata)]

聊天记录里的小秘密(1)

今天暂时先对发言人进行分析

id<-sub("\\d{4}-\\d{2}-\\d{2} \\d+:\\d{2}:\\d{2} ", "", srcdata)

user <- as.data.frame(table(id))

user <- user[order(user$Freq,decreasing=T),]

user[1:10,]

聊天记录里的小秘密(1)

这样就可以得到发言前十的人,这和群里面的每个人的发言等级也是类似的。

至于发言时间以及两者的混合,下次再说。

推荐阅读