240 发简信
IP属地:广东
  • Resize,w 360,h 240
    Elasticsearch 无法支持document partially update

    众所周知,ES的 index_API 和 update_API, 去更新一个文档的某个属性的时候,其实都是需要把整个文档重新load回来,去替换...

  • Resize,w 360,h 240
    Spark Structured Streaming 写checkpoint 到HDFS 抖动的排查

    问题描述 我们最近有个项目,需要实时消费订单成单的消息,提炼完数据后把结果写入HDFS,因此checkpointConfiguration 自然...

    0.7 3053 0 10
  • Resize,w 360,h 240
    Spark Structured Streaming 2.4 踩的一些坑

    最近参与一个公司大数据项目开始入坑Spark,Spark从2.0开始从RDD 的底层API转向了面向Dataset/Dataframe 的高级A...

  • [转载][复习] Lucene索引实现之posting list和bitmap及其性能对比

    昨天下午被@loogson 兄追着问了一些ES下nested的性能问题,和他一起深钻进去一下子把posting list 机制和filter c...

  • One query thread per Shard?

    One query thread per Shard? https://discuss.elastic.co/t/one-query-threa...

  • Resize,w 360,h 240
    Elasticsearch的Query Cache 知识梳理

    双十一来临,大家应该要对所有索引都做做健康检查了,由于最近压力上不去,所以盯上了Query Cache,由于之前Query Cache没有怎么注...

    8.4 9030 3 33
  • Terms Aggregation 性能问题帖子收集

    如果你也遇到这类问题希望下面几篇帖子能帮到你 Global ordinals全局顺序 Terms aggregation performance...

  • Resize,w 360,h 240
    Elasticsearch 5.x 源码分析(14)你一定需要使用nested 类型吗?

    很早之前就听说nested字段的查询效率要慢一个数量级,parent-children 查询要慢2个数量级,一直是将信将疑的,知道最近的一些慢查...

    0.3 5042 3 7 1
个人介绍
VIP唯品会 Senior Java Developer

目前从事唯品会搜索服务平台Elasticsearch相关开发工作


微信请扫