墨线宝 - 简书

发简信

墨线宝

9
关注
23
粉丝
388
文章
211126

字数
235

收获喜欢
100

总资产

IP属地：福建

墨线宝

CentOS 7 老树开新花：从零部署 Dify 全栈应用（含 Go/Rust/GCC 升级避坑）
CentOS 7 老树开新花：从零部署 Dify 全栈应用（含 Go/Rust/GCC 升级避坑）本文档适用于在 CentOS 7 环境下使用源代码部署 Dify 应用，对...

33 0 0
墨线宝

Hadoop安全模式详解
Hadoop安全模式详解安全模式是 Hadoop HDFS 中的一种特殊运行状态，主要用于保障 NameNode 启动过程中文件系统元数据的一致性和完整性，同时确保数据块的...

100 0 0

墨线宝

Hadoop RPC深度解析：分布式通信的核心机制
Hadoop RPC深度解析：分布式通信的核心机制在分布式系统中，节点间的高效通信是核心需求。Hadoop 作为典型的分布式系统，其内部组件（如 NameNode 与 Da...

64 0 0
墨线宝

Hadoop 1.x 与 2.x 版本对比：架构演进与核心差异解析
Hadoop 1.x 与 2.x 版本对比：架构演进与核心差异解析 Hadoop 从 1.x 到 2.x 的演进是一次架构级别的重大升级，核心目标是解决 1.x 版本的性能瓶...

106 0 0
墨线宝

Google Bigtable深度解析：分布式存储的设计典范
Google Bigtable深度解析：分布式存储的设计典范 Google Bigtable 作为分布式结构化数据存储的里程碑技术，其设计理念深刻影响了 HBase、Cass...

75 0 0
墨线宝

Google GFS 深度解析：分布式文件系统的开山之作
Google GFS 深度解析：分布式文件系统的开山之作 Google 文件系统（GFS）作为分布式存储领域的里程碑技术，其设计理念深刻影响了 HDFS、TFS 等后续系统。...

78 0 0
墨线宝

flume拓扑结构详解：从简单串联到复杂聚合的完整指南
flume拓扑结构详解：从简单串联到复杂聚合的完整指南 Flume 作为分布式数据采集工具，其拓扑结构直接决定了数据流转的效率、可靠性和扩展性。官网定义了三种核心拓扑结构：简...

78 0 0

墨线宝

flume扩展实战：自定义拦截器、Source 与 Sink 全指南
flume扩展实战：自定义拦截器、Source 与 Sink 全指南 Flume 内置的组件虽然能满足大部分场景，但在复杂业务需求下（如特殊格式数据采集、定制化数据清洗），需...

126 0 0
墨线宝

flume接收处理器：构建高可用与高性能的数据链路
flume接收处理器：构建高可用与高性能的数据链路在大规模数据采集场景中，单点故障和性能瓶颈是两大核心挑战。Flume 通过 Sink Group + 接收处理器（Proc...

89 0 0
墨线宝

flume事务机制详解：保障数据可靠性的核心逻辑
flume事务机制详解：保障数据可靠性的核心逻辑在数据采集过程中，“不丢数据、不重数据” 是核心需求。Flume 之所以能在分布式环境下保证数据可靠性，关键在于其内置的事务...

101 0 0
墨线宝

flume监控文件写入 Kafka 实战：解耦应用与消息队列的最佳实践
flume监控文件写入 Kafka 实战：解耦应用与消息队列的最佳实践在日志采集场景中，直接让应用程序通过 log4j2 写入 Kafka 会导致应用与 Kafka 强耦合...

81 0 0
墨线宝

flume监控目录文件实战：三种 Source 方案对比与配置指南
flume监控目录文件实战：三种 Source 方案对比与配置指南在实际业务中，监控目录文件变化并实时采集数据是常见需求（如应用日志、业务数据文件等）。Flume 提供了三...

89 0 0

墨线宝

flume实战：从零配置到启动运行的完整指南
flume实战：从零配置到启动运行的完整指南掌握 Flume 的核心组件后，实际配置和运行才是关键。本文将通过一个简单案例，带你从零开始配置 Flume Agent，理解配...

113 0 0
墨线宝

日志数据链路的 “搬运工”：Flume 分布式采集的组件分工与原理
flume详解：分布式日志采集的核心原理与组件解析在大数据体系中，日志采集是数据处理的第一步。Flume 作为 Apache 旗下的分布式日志采集工具，以高可用、高可靠、易...

117 0 0
墨线宝

手把手配置：Jenkins 代码提交后自动构建的两种方案（附步骤）
jenkins自动构建配置：代码提交后自动触发构建的两种方案在实际开发中，手动点击 “立即构建” 显然不够高效。理想的流程是：当代码推送到 Git 仓库（如 Gitee、G...

152 0 0
墨线宝

jenkins 入门指南：从安装到启动的完整教程
jenkins 入门指南：从安装到启动的完整教程持续集成（CI）是现代开发流程中的核心环节，而 Jenkins 作为一款开源的 CI 工具，凭借简单安装、开箱即用、插件丰富...

25 0 0
墨线宝

副本数不足就拒写？HDFS 安全模式的 “保守” 设计是否合理？
安全模式 NameNode在启动的时候，首先将映射文件fsimage载入内存，并执行编辑日志edits中的各项操作，一旦在内存中成功建立文件系统元数据的映射，则创建一个新的f...

59 0 0

墨线宝

Hadoop RPC 分层设计的哲学：高内聚、低耦合的最佳实践
Hadoop RPC Hadoop RPC主要分为四个部分，分别是序列化层、函数调用层、网络传输层和服务器端处理框架，实现机制为：序列化层：主要作用是将结构化对象转为字节流...

21 0 0
墨线宝

Hadoop 版本进化论：从 1.0 到 2.0，架构革命全解析
Hadoop版本 hadoop1.x版本由三部分组成 Common(辅助工具) HDFS(数据存储) MapReduce(计算和资源调度) 存在的问题 JobTracker...

73 0 0