Aurora_NeAr - 简书

发简信

Aurora_NeAr

0
关注
0
粉丝
47
文章
122567

字数
35

收获喜欢
12

总资产

IP属地：福建

Aurora_NeAr

2025-09-21
核心组件的运行机制架构总览与核心交互模式声明式API (Declarative API)：用户向系统提交一个“期望状态”（如：要有3个Nginx副本）。系统持续工作，驱动...

100 0 0
Aurora_NeAr

Kubernetes权威指南-深入理解Pod & Service
深入掌握Pod Pod的基本概念与本质 “逻辑主机”模型核心思想：Pod的设计源于一个简单的观察：在现实应用中，多个进程往往需要紧密协作才能提供一个完整的服务。例如，一个主应...

130 0 0

Aurora_NeAr

Kubernetes权威指南-基础篇
Kubernetes入门 Kubernetes简介背景与起源Borg系统的开源版本：Kubernetes的思想源于Google内部运行了十几年的大规模集群管理系统Borg，...

118 0 0
Aurora_NeAr

Golang并发编程及其高级特性
并发编程模型线程模型：Go的Goroutine Goroutine（M:N 模型）package mainimport ( "fmt" "runtime" ...

115 0 0
Aurora_NeAr

对比Java学习Go——函数、集合和OOP
函数（Function）函数声明与调用对比函数声明对比// 语法：// func 函数名([参数列表]) [返回值列表] {// // 函数体// }// 示例1...

105 0 1
Aurora_NeAr

对比Java学习Go——程序结构与变量
程序基础结构 Hello, World! 程序对比 Java 的 HelloWorld.java// 1. 声明这个类所在的包（目录结构）package com.exampl...

130 0 1
Aurora_NeAr

对比Java学习Go——基础理论篇
第1章：为什么Java开发者要学习Go？ Go语言的诞生背景与设计哲学简单（Simplicity）继承：Go没有“类”(class) 和传统的继承体系。它使用组合(Comp...

269 0 1

Aurora_NeAr

大数据之路：阿里巴巴大数据实践——元数据与计算管理
元数据元数据概述核心定义：“描述数据的数据”——记录数据的结构、含义、血缘、生命周期等核心属性。元数据分类类型描述典型数据平台工具技术元数据数据的物理存储与结构信息表结...

187 0 0
Aurora_NeAr

大数据之路：阿里巴巴大数据实践——事实表设计
事实表基础事实表的本质与目标本质：记录业务过程可度量的事件，如交易支付、用户点击。设计目标目标实现手段业务场景高性能查询预聚合 + 分区剪枝双11实时大屏响应<1秒低成本存...

124 0 1
Aurora_NeAr

大数据之路：阿里巴巴大数据实践——OneData数据中台体系
OneData概述核心痛点：指标口径混乱、模型重复建设、数据孤岛、开发效率低下。 OneData：阿里巴巴内部进行数据整合及管理的方法体系和工具。规范定义层（治本之策）业...

175 0 3
Aurora_NeAr

大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU...

48 0 1
Aurora_NeAr

大数据之路：阿里巴巴大数据实践——实时技术与数据服务
实时技术流式技术架构数据采集：数据的源头，一般来自于各个业务的日志服务器，这些数据被实采集到数据中间件（Kafka）中，供下游实时订阅使用。DB变更日志：比如 MySQ...

251 0 0

Aurora_NeAr

大数据之路：阿里巴巴大数据实践——离线数据开发
数据开发平台统一计算平台 MaxCompute：主要服务于海量数据的存储和计算，提供完善的数据导入方案，以及多种经典的分布式计算模型，提供海量数据仓库的解决方案，能够更...

129 0 1
Aurora_NeAr

大数据之路：阿里巴巴大数据实践——日志采集与数据同步
第1章综述数据采集层 Aplus.JS：Web端日志采集技术方案。 UserTrack： APP端日志采集技术方案。 TimeTunnel：DB增量数据传输及日志数据传输...

261 0 0
Aurora_NeAr

Apache Iceberg数据湖高级特性及性能调优
Performance Tuning（性能调优）索引优化标准布隆过滤器（Bloom Filters）：概率型数据结构，快速判断值不存在于文件中，适用于高基数列（如ID、邮...

285 0 1
Aurora_NeAr

Apache Iceberg数据湖基础
Introducing Apache Iceberg 数据湖的演进与挑战传统数据湖（Hive 表格式）的缺陷：分区锁定：查询必须显式指定分区字段（如 WHERE dt='2...

319 0 0
Aurora_NeAr

Spark SQL架构及高级用法
Spark SQL 架构概述架构核心组件 API层（用户接口）输入方式：SQL查询；DataFrame/Dataset API。统一性：所有接口最终转换为逻辑计划树（Lo...

213 0 0

Aurora_NeAr

Trino权威指南
Trino Introducing 定义：Trino（原Presto SQL）是一个开源的分布式SQL查询引擎，专为大数据联邦查询设计。核心目标：支持秒级查询海量数据（PB...

310 0 2
Aurora_NeAr

Spark RDD 及性能调优
RDD Programming RDD 核心架构与特性分区（Partitions）：数据被切分为多个分区；每个分区在集群节点上独立处理；分区是并行计算的基本单位。计算函数...

180 0 1
Aurora_NeAr

Apache Spark详解
Apache Spark Introduction Spark Introduction 定义： Apache Spark 是一个开源的、分布式、统一的计算引擎，专为大规模数...

226 0 0