JTR-目的地竞争力提升:基于因果反事实人工智能分析的洞察

APA引用格式:
Xia, H., Muskat, B., Karl, M., Li, Q., & Li, G. (2025). Destination competitiveness improvement: Insights from causal counterfactual AI analysis. Journal of Travel Research, 60(X), 1–20. https://doi.org/10.1177/0047287525XXXXXX


1. 简介

在体验经济时代,提升目的地竞争力对旅游地获取有利市场地位至关重要。传统研究主要聚焦于识别和优先处理竞争劣势(如重要性-绩效分析IPA),但存在两个关键局限:第一,单纯关注"最需改进"的触点可能并非最优策略,因为其改进成本可能高于多触点组合优化;第二,现有方法假设游客同质性,忽视了不同游客群体对旅行体验的关注差异。

本文提出一个创新的因果反事实AI分析框架,通过整合用户生成数据(UGC)、方面级情感分析(Aspect-Level Sentiment Analysis)和基于优化的因果反事实算法,识别针对不同游客群体的、仅需最小改动即可提升目的地竞争力的精准策略。

研究问题:

  1. 针对不同游客群体,目的地应采用何种最小改动策略以将竞争力提升至期望水平?
  2. 各策略项需要多大的具体改进幅度?
  3. 各维度(如设施、服务、性价比)需要多大的总体改进?

主要发现(以澳大利亚四目的地为例):

  • 最小改动原则:相比传统"最需改进"方法(如改进评分最低的触点),因果反事实AI识别的组合策略通常需要更小的总体改动量(如大洋路G1群体仅需改进"拥挤度"0.501个单位,而非同时改进"台阶"和"厕所"共1.492个单位)。
  • 群体异质性:不同游客群体需要针对性策略。例如,大洋路G2群体需改进"设施"(厕所),而G3群体需改进"服务"(巴士)。
  • 维度级洞察:设施(Facilities)和性价比(VFM)是多数目的地的主要改进维度。

方法论创新:

  • 因果反事实AI算法:构建包含L2范数(最小化改动幅度)和L1范数(最小化改动触点数量)的优化目标函数,求解使不满意游客(标签=0)转变为满意(标签=1)的最小改动向量。
  • 三层神经网络:预测游客满意度,并作为优化问题的约束条件。
  • K-means聚类:基于方面级情感得分向量对游客分群,识别不同体验关注点的群体。

2. 理论背景与研究问题

2.1 理论框架

image.png

触点理论(Touchpoint Theory):将旅游体验解构为游客与目的地在关键触点(如员工、设施、交通)的直接或间接互动。目的地竞争力可基于游客在这些关键触点的满意度来衡量(需求视角),而非仅依赖专家评估的宏观指标(供给视角)。

因果反事实理论(Causal Counterfactual Theory):探讨"如果改变某些因素,结果会如何"的反事实情境。若事件Y(游客满意)在现状下未发生,但在反事实情境(改进特定触点)下发生,则这些触点构成Y的原因。通过构建优化问题,算法可自动搜索使Y=0转变为Y=1的最小改动组合。

"全球在地化"视角(Glocalization):承认游客异质性,不同群体对体验触点的关注不同(如家庭游客关注设施,背包客关注性价比),因此需要针对性策略而非"一刀切"方案。

2.2 研究假说

  • H1(最小改动假说):相比仅关注最需改进的单一触点,优化组合多触点的改进策略能在更小的总体改动幅度下实现相同的竞争力提升效果。
  • H2(群体异质性假说):不同游客群体(基于触点满意度向量聚类)的最优改进策略存在显著差异,针对性策略比通用策略更有效。

3. 数据来源和变量界定

3.1 数据来源

用户生成数据(UGC):通过Google Maps平台爬取澳大利亚四个目的地(大洋路、菲利普岛、摇篮山、罗特尼斯岛)的旅游服务提供商(酒店、景点)在线评论和评分。

样本特征(Table 1):

  • 大洋路:8,589条评论,24.05%不满意游客,36个服务提供商,2013-2023年
  • 菲利普岛:2,813条评论,35.37%不满意游客,10个服务提供商,2013-2023年
  • 摇篮山:765条评论,30.58%不满意游客,5个服务提供商,2016-2023年
  • 罗特尼斯岛:365条评论,29.04%不满意游客,4个服务提供商,2016-2023年
  • 总计:12,532条评论,不满意率27.13%
    image.png

数据清洗:仅保留英文评论,剔除少于10词的短评。

3.2 核心变量定义

因变量(标签)

  • 游客满意度:基于评论者给出的总体评分与服务提供商平均评分比较。若个人评分<平均评分,标记为0(不满意);否则为1(满意)。

核心解释变量(触点层面)

  • 归一化群体触点评分(Normalized Group Touchpoint Opinion Score)
    S(t_i, c_i) = \varphi\left(\frac{c_i}{n} \times \sum_{j=1}^{c_i} \Phi(t_{ij})\right)
    其中,c_i为提及触点t_i的评论数,n为总评论数,\Phi为情感极性(-1负向,0中性,+1正向),\varphi为Sigmoid函数将得分映射至(0,1)区间。
  • 解释:得分接近1表示该触点是竞争优势(高关注且高满意),接近0表示竞争劣势(高关注且低满意),0.5为分界线。

体验维度(Dimension)
通过编码将触点聚合至更高维度(见原文Table 4):

  • 设施(Facilities):停车场、厕所、步道、观景台等
  • 餐饮(Food & Drink):早餐、咖啡、餐厅等
  • 服务(Service):预订、交通、拥挤度等
  • 员工(Staff):导游、司机、工作人员态度等
  • 性价比(Value for Money, VFM):价格、费用等
  • 活动(Activities):特定体验项目(仅部分目的地)

可改进触点掩码(Mask Vector)
识别哪些触点是可改变的(如在岗培训、设施升级),哪些是不可改变的(如地理位置、天气)。掩码向量a中,可改变触点=1,不可改变=0。


4. 研究设计与识别策略

4.1 分析框架

本文采用触点评分→游客聚类→反事实优化→策略生成的三阶段分析框架(见原文Figure 1和Appendix 1)。

步骤1:目的地竞争力分析

  • 方面级情感分析:使用Yang et al. (2021)的开源工具提取评论中的方面(如"员工""停车场")及情感极性。
  • 关键触点识别:设定频率阈值\epsilon(密集数据集如大洋路设为10,稀疏数据集设为3-5),筛选高频触点作为关键体验触点。
  • 游客聚类:使用K-means算法基于游客在各触点的得分向量e^i进行聚类,仅针对不满意游客(标签=0)。通过肘部法则确定聚类数k(大洋路k=5,其余三目的地k=4)。

步骤2:反事实优化策略识别
构建双层优化问题(原文Equation 4):

\min_{\Delta} \|a \odot \Delta\|_2^2 + \beta\|a \odot \Delta\|_1 + \text{BCE}(f(g^j, d^k + a \odot \Delta|\Theta), 1)

其中:

  • 目标函数
    • \|a \odot \Delta\|_2^2(L2范数):最小化改动幅度(欧几里得距离)
    • \|a \odot \Delta\|_1(L1范数,放松版):最小化改动的触点数量(稀疏性)
    • \beta:平衡参数
  • 约束条件(BCE损失):确保改动后的目的地竞争力向量d^k + \Delta能使该群体原型g^j的预测满意度为1(满意)
  • f(\cdot):三层前馈神经网络,使用Adam优化器训练,预测游客满意度
  • Hadamard积(\odot:确保仅改变可改变触点(不可改变触点乘以掩码0)

求解:对每个游客群体求解20次优化问题,选择最成功的策略(成功率>85%,平均97%,见原文Table 6)。

4.2 与传统方法的比较

基准方法("最需改进"法):识别评分最低的n个触点(n等于本文方法识别的触点数),将其提升至最高分(1.0),计算所需总改动量。

比较维度

  1. 总改动量:本文方法 vs. 最需改进法的L2范数和
  2. 成功率:神经网络预测的满意度提升成功率

5. 主要实证结果和结论

5.1 目的地竞争优劣势识别(描述性分析)

image.png

四目的地归一化群体触点评分分布直方图
说明:展示大洋路(a)、菲利普岛(b)、摇篮山(c)、罗特尼斯岛(d)的触点评分分布。X轴为评分(0-1),Y轴为触点频率。可见多数触点集中在0.5-0.6区间(中性偏正),但存在明显的竞争劣势触点(<0.5)和优势触点(>0.8)。

关键发现(Table 3):

  • 大洋路:优势在"景观""风景""巧克力""员工";劣势在"台阶""拥挤""厕所""巴士"。
  • 菲利普岛:优势在"袋鼠""企鹅""员工";劣势在"拥挤""成本""服务"。
  • 摇篮山:优势在"员工""导游""穿梭巴士";劣势在"食物""饮料""价格""天气"。
  • 罗特尼斯岛:优势在"员工""导游""短尾矮袋鼠";劣势在"价格""巴士""苍蝇""餐厅"。
    image.png

5.2 针对游客群体的最小改动策略

image.png

肘部法则确定聚类数(K-means)
说明:展示四个目的地的肘部曲线(群内平方和vs聚类数),确定最优聚类数(大洋路k=5,其余k=4)。

image.png

触点评级竞争力改进策略
说明:展示针对各游客群体的最小改动策略。例如,大洋路G1群体仅需改进"拥挤度"(+0.501),而G4群体需同时改进"拥挤度"(+0.537)和"台阶"(+0.705)。数值表示将当前得分提升至1.0所需的归一化改动量。

核心结果(见原文Table 8对比分析):

  • 效率优势:本文方法所需总改动量普遍小于"最需改进"法。
    • 大洋路G1:0.501 vs. 1.492(改进台阶+厕所)
    • 菲利普岛G1:1.519 vs. 1.557(改进拥挤+成本+厕所)
  • 成功率:本文方法对各群体的成功率普遍为100%,而"最需改进"法在某些群体失败(如菲利普岛G3预测结果为0,即未能提升满意度)。

群体异质性(Table 5):

  • 大洋路
    • G1/G3/G5关注"服务"维度(需改进拥挤度/巴士)
    • G2/G4关注"设施"维度(需改进厕所/台阶)
  • 菲利普岛
    • G1/G2/G4对"性价比"敏感(需降低成本)
    • G3关注"服务"和"餐饮"(拥挤度+小吃)
  • 摇篮山
    • G1/G3关注"设施"(厕所)
    • G2/G4关注"信息"或"食物"
  • 罗特nest岛
    • G1需改进"员工"和"设施"(司机+餐厅)
    • G2需改进"设施"和"性价比"


      image.png

5.3 维度级策略与资源分配建议

image.png

四目的地各维度所需总改动量
说明:柱状图展示(a)大洋路、(b)菲利普岛、(c)摇篮山、(d)罗特尼斯岛在设施、服务、性价比、餐饮、员工等维度的累计改动需求。例如,罗特尼斯岛设施维度需改动1.509,性价比需0.532。

维度级发现(Table 9):

  • 大洋路:设施(1.227)> 服务(1.040)
  • 菲利普岛:服务(1.039)> 性价比(0.514)> 设施(0.503)> 餐饮(0.500)
  • 摇篮山:餐饮(0.509)> 性价比(0.500)≈ 设施(0.500)> 服务(0.490)
  • 罗特尼斯岛:设施(1.509)> 性价比(0.532)> 服务(0.502)> 员工(0.500)
    image.png

政策启示

  1. 精准营销:针对不同群体(如价格敏感型vs体验敏感型)设计差异化改进方案,而非统一促销。
  2. 资源配置:优先投资"设施"(大洋路、罗特尼斯岛)或"服务"(菲利普岛)等关键维度,避免在已优势维度过度投资。
  3. 最小化干预:与其全面翻新所有酒店(高成本),不如针对性调整价格、增加穿梭巴士或改善厕所(低成本高效益)。

6. 结论与局限

理论贡献

  • 首次将因果反事实AI(Prescriptive AI)引入目的地竞争力研究,超越传统的描述性(关联规则)和预测性(LSTM)AI应用。
  • 挑战"最需改进即最优"的传统观点,提出"最小改动"新范式。
  • 整合市场细分理论,证实游客异质性对竞争力策略的调节作用。

局限与未来方向

  • 基于模拟数据,尚未通过实地实验验证策略实施效果。
  • 维度编码依赖研究者主观判断,未来可探索数据驱动的维度划分。
  • 未纳入游客人口统计特征(年龄、国籍),未来可整合多源数据提升分群精度。

tips:机器学习里面的反事实解释和经济学的反事实因果推断不同,之前没有太过了解过,今天看了一下大概了解了,就是在机器学习的预测任务中假定某个特征改变下的结果会
反事实解释(Counterfactual Explanations, CFEs)是一种用于解释机器学习模型预测结果的方法。它通过创建假设场景并在这些场景下生成预测,帮助用户理解模型的因果逻辑。这种方法特别适合非技术背景的用户,例如业务人员或普通用户。
反事实解释的核心思想是针对单个预测生成局部解释。通过改变输入特征的某些值,观察模型输出的变化,从而揭示哪些特征对预测结果起到了关键作用。例如,在分类任务中,可以通过调整输入特征来生成不同的分类结果,从而理解模型的决策边界。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容