上节目
工业级的信息检索或个性化系统是一个复杂的系统工程,深度学习的工业级应用需要具备三个条件:强大的系统计算能力,优秀的模型设计能力和合适的应用场景。今天,我们邀请了阿里搜索事业部资深算法专家三桐,介绍阿里在深度学习系统、深度学习算法和搜索应用落地的进展和思考,希望对大家有所启发。,我自己是名大数据程序员,建了一个大数据资源共享群593188212 每天分享大数据学习资料和学习方法 欢迎初学和进阶中的小伙伴。分享一点专业知识
在对话
一.深度学习在搜索的应用概括起来包括4个方面:1.系统.2.搜索应用3.性能优化上做的工作4.排序平台化
机场
二.下面是搜索系统和算法的简图。系统包括:1. 离线数据平台ODPS 2. 离线机器学习平台PAI 3. 流式计算和在线学习平台 Porsche 4.在线服务平台
三.系统进展:机器学习平台和在线预测平台
机器学习平台。搜索训练样本主要来自用户行为,由于用户行为是流式数据,适合做在线深度学习,但当模型参数非常庞大需要海量的样本时在线学习需要很长的时间才能收敛,这时一般是先做离线预训练再结合增量或在线学习,
四.算法:智能交互、语义搜索、智能匹配和搜索策略四个方向
五.语义搜索的范围主要包括:1. query tagging和改写 2. 商品内容理解和语义标签 3. 语义匹配 4.query 改写
从上面可以看到querytagging、query相似度、语义匹配和语义相关性是多个目标不同但关联程度非常高的任务。下一步计划用统一的语义计算框架支持不同的语义计算任务,
六.智能匹配。这里主要是指个性化和排序
七.多智能体协同学习实现智能决策
八.阿里巴巴人工智能搜索应用的未来计划
1.通用用户表征学习 2.搜索链路联合优化 3.跨场景联合优化 4.多目标联合优化 5.智能交互
“搜索排序做的再好,搜索也只是一个工具”,如何把搜索从工具做成私人导购助手,能够听懂你的语言,了解你的情绪,能够对话和多轮交互,解决售前售后困惑,推荐更加个性化的商品应该是搜索未来的另外一个主要发展方向