梧桐数据库小规模试点验证项目案例分享

应用案例背景

        随着企业数据量的迅速增长和业务需求的不断演变,传统的数据仓库技术面临性能瓶颈和扩展性限制。为了应对这些挑战,企业启动了梧桐数据库小规模试点验证项目,旨在评估梧桐数据库的性能、扩展性、兼容性和总体拥有成本。

        当前资产中心现网环境有4个oracle集群,支撑含日报、快报等B域大部分业务,资产中心数仓当前存在业务支撑方面存在性能瓶颈(过亿级表、多表关联时延达小时级)、硬件扩容困难(不支持按需扩展存算资源、不支持在线扩容)、集群间数据共享低效(集群间数据拷贝、dblink传输效率低)、以及产品建设成本高、非自主可控等问题。

        从数仓技术架构演进和实现降本增效的需求出发,故开展本次“梧桐”国产数仓产品小规模验证,测试的目的是通过B域内的典型应用场景(资产中心)验证该产品能否支撑实际生产业务开展,同时与现有资产中心在用数据库的使用进行对比,为数据库选型提供依据。

注:当前资产中心业务一小时并发峰值存过达到300个,相对于标签生成客户群业务、位置实时处理业务,资产中心业务的作业并发度、任务数、单个作业处理逻辑复杂度(多表关联处理)更高,能够充分检验数据库系统能力。


应用案例目标

1.验证梧桐数据库在处理大规模数据集时的性能表现。

2.评估梧桐数据库的存算分离架构在实际业务场景中的应用效果。

3.测试梧桐数据库与其他系统集成的兼容性和数据迁移的可行性。

4.对比分析梧桐数据库与传统数据库的成本效益。


应用案例实施步骤

环境搭建与数据迁移:在指定的硬件环境中部署梧桐数据库,并配置所需的网络和存储资源。

总体规模:联创数据库本期规划36节点,其中计算 节点23台, 存储节点 4台,管理节点9台。

计算节点:计算节点主要承载大量的数据计算任务,包括业务汇总、关联计算,属于高CPU、高内存业务处理,规划优先选用C3型主机。

管理节点:管理节点主要用作数据库会话的连接和元数据的存储,不进行大量的计算任务,所以采用B1性主机。

存储节点:主要用于存储数据,由于联创数据库采用分布式共享存储架构,所以采用大存储,低计算B2型主机。

注:因苏州资源池暂时只有B2服务器,当前集群全部基于B2服务器搭建,后期资源池资源充足,可将计算节点换成C3或者B1服务器。


功能验证:对梧桐数据库的基础功能进行测试,包括数据查询、数据更新、事务处理等。

1、函数支持

支持窗口函数、复杂函数等常用函数;

支持自定义函数,可以在数据库直接创建,不需要java或者C编译;

兼容常用测试sql。

2、分区支持

在国产数仓中存储Oracle抽取过来的多个分区的数据,能够满足对所有分区的查询性能不降低。

3、易用性支持

图形化客户端;

如PL/SQL一样,方便开发人员使用。

4、锁机制

Oracle为行级锁,不同分区并发不会产生锁等待,验证国产数仓对同一个表执行多个sql是否支持分区锁。

性能测试:模拟实际业务场景,对梧桐数据库进行压力测试和性能评估。

1、数据抽取

• 测试场景:测试国产数仓的数据抽取效率,并与Oracle做对比;

• 数据量:万级、百万级、千万级、亿级、十亿级。

2、数据加载

• 测试场景:测试国产数仓的数据加载效率,并与Oracle做对比;

• 数据量:万级、百万级、千万级、亿级、十亿级。

3、数据处理

• 测试场景:测试区分数据转换、单表汇总、两表关联、三表关联等不同场景下国产数仓的数据处理效率,并与Oracle做对比;

• 数据量:万级、十万级、百万级、千万级、亿级、十亿级。

注:由于Oracle对百亿数据量无法支持,故此量级不做比对。

4、实时写入

• 测试场景:通过Flink将数据实时写入国产数仓,记录执行时间,观察CPU/IO等资源消耗,并和Ignite进行对比;

• 数据量:千万级、亿级、十亿级、百亿。

注:由于Oracle对百亿数据量无法支持,故此量级不做比对;从位置中心实时抽取数据至Ignite支撑网格通业务。

5、实时读取

测试场景:实时读取数据,验证连接数使用(N多并发是否会把连接数占满),单表、多表关联等场景数据读取效率,并和Starrocks进行对比;

• 数据量:千万级、亿级、十亿级、百亿。

注:从话单、位置集群实时抽取数据至Starrocks,支撑行程码明细归集查询。

6、批量业务场景

• 测试场景:进行生产实际运行业务的批量验证;

• 作业量:本次进行典型存过的验证,并确保任务定周期运行。

扩展性测试:验证梧桐数据库的存储和计算资源能否按需进行扩展。

• 存储资源、计算资源分别扩容的情况下,是否需要停机操作,对已部署流程执行效率的影响;

应用案例成果

• 梧桐数据库在处理大规模数据集时表现出良好的性能,响应速度快,满足业务需求。

• 存算分离架构有效提升了系统的扩展性和资源利用效率。

• 数据迁移过程顺利,数据完整性和一致性得到保障。

应用案例结论

结论一:经验证,梧桐国产数仓在功能特性方面满足使用需求,对比Oracle在性能、拓展性、架构等方面具备更优的特性,但在实时入库能力、复杂函数兼容性、易用性等方面存在优化空间。

结论二:基于Gbase现场使用反馈,梧桐国产数仓功能架构更优,迁移改造工作量对比Gbase手工改造有所降低。注:本次验证因B1、B3服务器资源有限,无法部署Gbase数据库。

后续建议

• 基于试点验证的结果,建议在更多业务场景中推广梧桐数据库的应用。

• 继续与梧桐数据库团队合作,针对发现的问题进行优化和改进。

• 定期评估梧桐数据库的版本更新,确保系统功能与业务需求保持同步。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,904评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,581评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,527评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,463评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,546评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,572评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,582评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,330评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,776评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,087评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,257评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,923评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,571评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,192评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,436评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,145评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352