梧桐数据库中表关联使用过程中注意事项整理

一、表关联简单说明

表关联通常是通过 JOIN 操作来实现的。JOIN 操作可以基于两个或多个表之间的共同字段来组合这些表中的行。以下是几种常见的 JOIN 类型:

INNER JOIN (内联接): 仅返回两个表中匹配的行。

LEFT JOIN (左联接): 返回左表的所有行,即使右表中没有匹配的行。

RIGHT JOIN (右联接): 返回右表的所有行,即使左表中没有匹配的行。

FULL OUTER JOIN (全外联接): 返回两个表中的所有行,无论它们之间是否有匹配。

这边不具体展开讲解具体用法,可参考帮助手册。

二、表关联使用中一些注意事项

1.表连接中的每个表应指定缩写的别名,别名的命名尽量清晰可辨别;

SELECT e.employee_id, e.employee_name, d.department_name

FROM employees e

INNER JOIN departments d ON e.department_id = d.department_id;

2.建议一个 SQL 语句中多表关联的关联表不要超过10张表;

3.几个大小差不多的表做关联时,过滤性较强的优先做 JOIN ;

4.在大/大/小三个表内关联时,避免先把两个大表进行 JOIN ,除非过滤性非常强;

SELECT *

FROM (SELECT * FROM large_table1 a INNER JOIN small_table b ON a.key = b.key) a

INNER JOIN large_table2 c ON a.key = c.key

5.在大/小/小三个表内联时,优先把两个小表进行 JOIN :

SELECT *

FROM (smalltableA AS A INNER JOIN smalltableB AS B ON A.key=B.key)

INNER JOIN bigtable AS C ON C.key=A.key

6.在关联大表的时候,左右两个连接表的关联字段不能同时存在高重复值的情况,以免因重复记录关联产生巨大的中间结果,造成磁盘占用比例的大幅增长;例如:如果一个100万的重复记录表和一个1万的重复记录表关联,结果会高达100万*1万=100亿条记录;

在使用小表 LEFT JOIN 超大表(记录数过亿)时,强烈建议把 LEFT JOIN 修改为先 INNER JOIN ,再 LEFT JOIN 的方式实现。这样既可以提高性能,也能避免梧桐数据库产生大量的临时文件;因为在梧桐数据库中,对于 LEFT JOIN 语句,服务器会固定使用右表的记录,构造 Hash 表,然后用 Hash Join 的方式实现关联;如果右表非常大,会导致 Hash 表需要占用大量的内存,如果内存超出限制,系统会把 Hash 表的内容,写入到文件系统的临时文件中,如果右表是一个超大表,可能在执行此语句的时候,系统会写入大量临时文件,造成系统占用空间大幅增加; 如果是 INNER JOIN 语句,系统会自动选择用小表建立 Hash 表。

例如:如下 LEFT JOIN 语句:

select a.col.. from fileinter.test1 as a left join fileinter.test2 as b on a.id1=b.id1 and a.id2=b.id2;

如果 fileinter.test2 是一个超大表,那么 LEFT JOIN 可以改写如下 :

select a.col.. from fileinter.test1 as a left join (select b.id1,b.id2 from fileinter.test1 as a join fileinter.test2 as b on a.id1=b.id1 and a.id2=b.id2) as b on a.id1=b.id1 and a.id2=b.id2

7.表如果通过分布键关联时,不要使用表达式字段的方式进行关联,这是因为当分布键和关联键不一致时,数据需要重新分布以达到关联的效果,这可能会导致性能下降和资源浪费否则会导致数据重分布,举例如下:

错误的关联方式,导致数据重分布

Select a.col.. from fileinter.test1 AS A LEFT JOIN temp_result AS B ON trim(A.ci_cust_no)=B.ci_cust_no

正确的关联方式 ,为了避免数据重分布,建议在设计表结构和查询时,尽量使分布键和关联键一致。这样可以减少跨库查询的需要,提高查询效率。

Select a.col.. from fileinter.test1 AS A LEFT JOIN temp_result AS B ON A.ci_cust_no=B.ci_cust_no



author:xufeng

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,904评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,581评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,527评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,463评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,546评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,572评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,582评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,330评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,776评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,087评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,257评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,923评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,571评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,192评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,436评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,145评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352

推荐阅读更多精彩内容