尝试使用关键字对应的方式进行query和title的对应,可以得到非常准确的结果,关联到的query有8127条,商品有18.8w条,其中有2496条query关联到的商品超过90条,这些query与商品的关联完全可以通过这种方式来进行。4345条query对应的商品数量超过30条,这些query可以通过这种方式得到最相近的title,其他的结果可以通过dssm的方式得到。其他的query只能使用神经网络的方式进行对应。结果在hs_tmp_339中。
| query_id | query_ws | video_id | video_ws |
inference_query : hs_dssm_dic_query_inf_7 - | query_id | query |
hs_dssm_dic_query_inf_11 : | id | query_emb |
inference_title : hs_dssm_dic_title_inf_10 - | item_id | title |
hs_dssm_dic_title_inf_14 : | id | title_emb |
create table hs_tmp_341 as select
c.query_id, c.query_emb as query_ws, c.title_id as video_id, d.title_emb as video_ws from
(select a.*, b.query_emb from hs_tmp_336 a join hs_dssm_dic_query_inf_11 b on a.query_id = b.id)c join hs_dssm_dic_title_inf_14 d on c.title_id = d.id;
create table hs_tmp_345 as select c.query, d.title, c.query_id, c.video_id from
(select a.*, b.query from (select * from hs_dssm_result_5 where score = 1)a join hs_dssm_dic_query_inf_7 b on a.query_id = b.query_id)c join hs_dssm_dic_title_inf_10 d on c.video_id = d.item_id;