“感觉有用”靠谱吗?把主观效应拆开看

摘要:围绕“智商税”的争议,本质是对“证据等级(evidence hierarchy)与效应量(effect size)”的混淆。当我们说“有用/没用”,其实在问三件事:①研究设计是否能排除主要偏倚?②统计学显著是否达到了“最小临床重要差异(MCID)”?③对我这类人群,短中期可见好处在哪里。本文提供一套大众可用的判定流程,帮助在“科普段子化”与“营销话术化”之间找到方法论的中线。
一、证据分级:金字塔与现实世界的断层

  • 体外与动物实验更多证明“可能性”,到人体小样本探索性试验,再到随机对照试验(RCT)与系统评价/Meta分析,证据稳定性逐级上升。营养干预因变量多、周期长、依从性差,优质RCT比例有限,这决定了许多结论“口碑先行、证据滞后”。

  • 对普通消费者,第一步筛查是“是否存在针对目标终点的人体RCT”。例如,若你的目标是“主观疲劳下降”,就应优先看以疲劳评分(如FACIT-F)为主要终点的研究。
    二、效应量与MCID:统计学不等于感知可见

  • 很多研究能做到p<0.05,但效应量仅0.2–0.3分(0–10量表),低于MCID,你几乎感觉不到,于是被贴上“智商税”。因此,阅读结论时要同时看“效应量”“置信区间”与“是否达到MCID”。

  • 反过来,主观改善可能先于客观指标变化,比如睡眠、情绪、疲劳往往对干预更敏感。两者不同步,会让消费者误以为“无效”。
    三、常见误判的三大来源

  • 终点错配:研究测的是血清指标,消费者期待的是肤色、体力、睡眠。

  • 剂量与工艺:标签含量达到,体内可利用度未必到;螯合、发酵、脂质体等工艺若无稳定性与人体数据,易“话术化”。

  • 人群适配:缺乏者、亚健康者、运动人群、围经期女性的反应不同。把“总体平均效应”生搬到个人,常导致误判。
    四、把方法学搬回日常:三步复核

  • 第一步:证据筛选。有没有针对你的目标终点的人体RCT/系统评价?样本量、随机与盲法、对照类型是否合格?

  • 第二步:效应量与MCID。报告的效应量是否达到MCID?置信区间是否跨越临界点?

  • 第三步:个人化适配。剂量是否落在研究区间?工艺是否有第三方检测或人体数据?使用周期至少4–8周,期间记录主观与客观小指标。
    五、关于组合产品(以“碧容健”这类多成分为例)的特殊性

  • 组合思路依赖“协同假说”:多成分可能对不同环节提供支持。但风险是“每种剂量都被稀释”,导致单项效应达不到阈值。

  • 判定策略:抓住你最在意的1–2个终点,对应的关键成分是否“剂量达标+有人体数据+工艺可信”。若满足,其它成分视为“锦上添花”;若不满足,组合就容易变成“均匀稀释的期望”。
    六、读者能做什么:一张“复核清单”

  • 目标终点(写具体):例如“下午困倦评分从6降到4”。

  • 证据等级:是否有人体RCT/系统评价直接支持该终点。

  • 效应量/MCID:研究中达到的实际幅度是否可感知。

  • 剂量/工艺:你手上产品的标签剂量是否落在研究区间;是否有可检索的工艺或第三方数据。

  • 周期/记录:至少4–8周;三类记录(主观、客观小迹象、行为)。
    结语:与其笼统地说“都是智商税”,不如用“证据分级+效应量+人群适配”三把尺子,提升“对我有用”的概率。


©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容