RMRB Discourse Console
多短语时间对比
时间分布
柱形为该时间窗口内的命中文章数(绝对篇频);折线为命中文章数 ÷ 同期全部文章数 × 100%,表示该话语在同期文章中的占比。
版面分布
观察是否集中在一版、理论版或其他固定版位;版面号按从小到大排列。
样本文档
随当前短语对比自动刷新,按时间顺序显示第一个检索词的命中文章。
共现时间分布
每个时间窗口内,同时包含全部词项的文章数。
同文共现
统计多个词同时出现在同一篇文章中的时间分布,并估算样本文内最小字符距离。
近邻时间分布
每个时间窗口内,全部词项在正文 IK 分词 token 间隔内共同出现的文章数。
近邻版面分布
按版面号从小到大排列,帮助判断近邻话语是否具有版位集中性。
近邻样本文档
显示符合当前最大 token 间隔的样本文档和高亮片段。
词表计数
对用户输入的词项逐个统计当前时间范围内的命中文档数;完成统计后可生成两种字号映射的词云。
词云:绝对值映射
字号按文档数线性映射,适合保留头部词项的真实差距。
词云:对数映射
字号按 log10(文档数 + 1) 映射,适合同时观察长尾词项。