felix_feng - 简书

发简信

1
关注
19
粉丝
88
文章
48950

字数
48

收获喜欢
1

总资产

IP属地：宁夏

felix_feng

2025-11-19 starrocksCompaction 文件合并
数据表物理结构Table->Partition->Tablet->Rowset->Segment Compaction 文件合并 Tablet是StarRocks中数据均衡的...

148 0 0
felix_feng

在建设AI知识库目前遇到的一些问题随笔
知识库问题是：文档在逐步增多之后，造成了知识交叉，很多问题答案被污染了。如何解决。由于文档在创建时缺乏规范，导致无法按逻辑切分，切块后不完整，导致回答内容缺失。该如何清...

177 0 0

felix_feng

2024-03-05 dify二次开发记录
文档内容增加-文件名称在切分段内容中。 word文档按格式切分，无格式按语义切分。文档中表格优化，按json格式保存，保证内容完整连贯。 pdf文档按语义切分。文档构建Q...

2100 0 0
felix_feng

分布式Alluxio配置部署
alluxio 分布式配置分布式Alluxio： 1.下载Alluxio发布版本并解压到各个节点2.进入各个节点的解压后的文件夹，该文件夹中包含所有的Alluxio源文件和...

日常采坑君
2329 0 2
felix_feng

2023-11-13 优化tidb写操作
tidb集群，版本5.2 ，24个节点，全SSD配置，单机4个tikv实例，对应4块2T的SSD。 yto-bigdata-tidb-TiKV-Details/Schedul...

209 0 0
felix_feng

2023-11-13 测试任务并发大小对HADOOP集群的性能影响
集群使用CDH5.16.1版本。hadoop2.6.0 spark1.6 hive1.1规模290节点，单台分配384G内存，48VCORE （内存:CORE比 8:1）n...

172 0 0
felix_feng

2023-09-14 hive on spark执行RunningTasksCount数逐渐减少问题
目前发现hive on spark任务执行时，有几率会在执行过程中RunningTasksCount数逐渐减少，导致任务执行效率降低。通过排查资源，未发现资源不足，hdfs ...

359 0 0

felix_feng

2023-09-11 为什么在hadoop中会出现大量冗余块产生？
为什么在hadoop中会出现大量冗余块产生？在hive中，使用动态分区方式在hdfs中写入大量数据（5T），namenode出现service rpc线程队列顶满排队，数据无...

130 0 0
felix_feng

2023-09-06 max process参数过小异常与hive配置文件更改
CDH 在修改了hive-site.xml中的参数后，需要在hive配置修改后，点击【操作】->【部署客户端配置】，将所有gateway节点进行同步。在ulimit中修改了...

145 0 0
felix_feng

2023-05-22 presto加载多个mysql数据源
只需要在配置etc/catalog中配置多个mysql相关properties,前缀名字区分。内部connect.name统一都配置mysql 使用时通过配置文件前缀进行区分...

362 0 0
felix_feng

2022-11-14cdh5.16环境下使用spark3,Kyuubi 环境搭建
只记有问题的点。首先配置spark3的环境变量在$KYUUBI_HOME/conf/kyuubi-env.sh 配置$KYUUBI_HOME/conf/kyuubi-def...

566 0 0
felix_feng

2023-03-29 split-table
1、split-table为每个 table 建立单独的 Region。针对创建表（新生数据）：此table下的regions（多个），每个region都只保存此tabl...

283 0 0

felix_feng

2023-03-29参数SHARD_ROW_ID_BITS = 4
聚簇索引 (clustered index) 是 TiDB 从 v5.0 开始支持的特性，用于控制含有主键的表数据的存储方式。通过使用聚簇索引，TiDB 可以更好地组织数据表...

478 0 0
felix_feng

2023-03-16 dbeaver连接kyuubi时kerberos认证出现问题
目前我们的kyuubi提供了JDBC服务，通过dbeaver作为客户端进行连接。但是出现了无法认证的情况，连接日志没有到kyuubi服务端就异常了。但是如果在dbeaver上...

756 0 1
felix_feng

2023-03-03 Prometheus Alertmanager Webhook与钉钉结合
首先配置alertmanager.yml 其次配置alertmanager与prometheus相结合，在prometheus.yml中增加然后还是配置prometheus...

703 0 0
felix_feng

2023-03-03 服务发现
在prometheus.yml中配置的静态功能static_configs 来手工添加主机IP地址与端口。首先在应用JVM中配置，例如在namenode中配置在promet...

149 0 0
felix_feng

2023-02-16 tispark使用时需要注意分区裁剪问题
tispark使用时需要注意分区裁剪问题，在tispark中的分区裁剪只能使用在to_day方式进行的分区表。不能用unix_timestamp限制的。而且在tidb中产生的...

177 0 0

felix_feng

2022-12-30 加载外部表
创建资源。StarRocks 支持创建以下资源：Apache Spark™、Apache Hive™、Apache Iceberg、 Apache Hudi 和 JDBC。其...

234 0 0
felix_feng

2022-12-22数据倾斜问题排查
explain分析Explainselect order_channel_code,order_date,rpt_date,count(seller_id) as wa...

184 0 0
felix_feng

2022-12-22 建表参数解析
replication_num 副本数 dynamic_partition.enable 开启动态分区dynamic_partition.start 动态分区的开始时间。以...

311 0 0

暂无个人介绍