实时样本拼接

实时样本拼接:将推荐下发的特征流和用户行为流进行实时拼接,生成流式训练样本。

image.png

flink流式拼接

方案一:依托于flink 的实时有状态计算能力,利用interval join 进行双流join,生成实时样本。
Interval Join 通过定义一个时间间隔来指定两个事件可以被关联的时间范围。

image.png

方案二:将实时特征流放入KV缓存,用户行为流通过 look up join 拼接样本。
look up join 允许实时流数据与外部系统的维度数据进行关联。
image.png

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容