近期发表在TM的两篇有关主题挖掘的研究,一篇主要是研究酒店的FGC(企业生成内容)的文本主题的用户参与度,一篇是对LDA、BERT、和GPT主题挖掘性能进行比较分析。
下面是第一篇的标题和主要内容:
标题:Topic-based engagement analysis: Focusing on hotel industry Twitter accounts
主要内容:
研究主要是基于LDA模型对推特上的西班牙连锁酒店的官方推特账号的推送内容进行主题挖掘,对主题演变进行分析,然后分析各个主题下面的用户参与度,这个参与度就是针对该主题下面每条推文的用户反应包括回复、转发、喜欢和引用。(“ the engagement generated by each tweet (Ei) was quantified as the sum of the number of reactions (replies, likes, retweets, quotes) that it provoked:”)
这篇的创新在于:a) 通过自然语言处理探索连锁酒店 FGC 中的潜在主题;b) 考虑到 COVID-19 的影响,评估消息中每个主题的权重和时间演变;c) 通过使用为此目的设计的新指标评估每个主题产生的参与度来确定内容策略的有效性,以及 d) 品牌分配的主题重要性与每个主题产生的参与度之间的比较。
第二篇:
标题:Facilitating topic modeling in tourism research:Comprehensive comparison of new AI technologies
主要内容:
研究主要就是利用几个不同特性的数据集来比较LDA、BERT(BERTopic)和GPT在识别主题上的性能差异。因为使用的GPT有字数限制和token消耗,所以在使用GPT进行分析时,作者使用的步骤如下三个步骤:主题提取、主题合并、主题对应到文档