JanusGraph---批量导入数据优化

批量导入配置项

storage.batch-loading =true

导入的数据必须具有一致性并且和已存在的数据必须具有一致性。（比如：name数据是具有唯一索引（a unique composite index），那么导入的数据在name属性上上和已有的数据不能重复）
下面是优化配置，优化的目的，就是减少批量导入时间。

ids.block-size

配置项，JanusGraph实例通过id池管理对象从id blocks中获取ids值为新加入的vertex、edge分配唯一id，为了保证库唯一性，所以获取id block（id块）是昂贵的（因为存在多个实例竞争），所以增加block-size可以减少获取block的次数，但是值过大会导致多余的id被浪费掉。
一般情况下事务的负载，ids.block-size的默认值是满足要求的。但是对于批量导入时，需要调节值为每个JanusGraph实例需要添加节点和边数的10倍。
该配置项在集群中所有实例上值必须唯一。

1) ids.authority.wait-time

2) ids.renew-timeout

storage.buffer-size  缓存大小

storage.read-attempts   读尝试的次数
storage.write-attempts  写尝试次数
storage.attempt-wait  ：两次尝试之间的时间间隔，在批量导入情况下，此值可以设置大一些

最后编辑于：2018.03.08 14:49:11

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。