为什么传统数据库具有不可以替代的地位呢?
这里有一个深层次的原因,不管从业务还是从技术的角度来说,数据的价值都是第一位的,要保证数据的价值,准确性是前提条件。而对于如何保证数据准确性,需要我们认识并分解数据的结构。数据分析领域,我们要分析一批数据,首先要了解数据的结构再写程序处理,将数据结构化才能被我们认识数据,有了结构逻辑才能被程序计算处理,将非结构化数据结构化是数据分析的上半阶段。所谓数据的结构化,就是数据的维度化,关系表数据是标准的结构化数据,xml、json、日志等是半结构化数据,但半结构化数据要复杂分析,同样要将半结构变成完全结构,非结构化数据如图像、音频、视频,分析视频首先是将视频分解成连续的图像,音频也是变成图像,连续的图像,然后统一使用图像分解的技术,纹理、轮廓、色阶等维度分解,最后转成高纬度的矩阵(类似表)来计算。所以,无论是什么数据,没有结构就无法分析,无论什么数据,我们最终的目标都是将数据结构化,结构化后数据才是可计算,可认知。
SQL:结构化查询语言(Structured Query Language),正因为有了结构化,数据才能用简洁的SQL操作。