240 发简信
IP属地:吉林
  • 正则表达式

    常见正则表达式 hive 关键字REGEXP https://blog.csdn.net/knqiufan/article/details/80...

  • WordCount

    sparkCore:算子实现: SparkSql 实现: java 实现:MapReduce mapper reduce driver

  • hadoop之Sqoop

    Sqoop原理: 将导入导数命令翻译成MR程序来实现,翻译出的MR主要是针对InputFormat和OutputFormat进行定制的; sqo...

  • hadoop之Yarn

    资源调度器:(面试重点) 主要有三种:FIFO,capacityScheduler Fair Scheduler FIFO(先进先出调度器):...

  • Resize,w 360,h 240
    计算机网络

    OSI七层模型: 物理层、数据链路层、网络层、传输层、会话层、表示层、应用层 TCP/IP四层模型: 网络接口层、网络层、传输层、应用层 物理层...

  • 数据库相关

    事务ACID: 原子性:要求操作要么全部执行,要么全部不执行 一致性:事务提交前后只存在两个状态,提交前的状态和提交后的状态,不会有中间状态 隔...

  • Resize,w 360,h 240
    hadoop之Hbase

    Hbase特点: 海量存储:适合PB级别的海量数据,,hbase有良好的扩展性列式存储:根据列族来存储数据的极易扩展:高并发:稀疏存储:数据为空...

  • Resize,w 360,h 240
    hadoop之MapReduce

    MR核心编程思想: MR一般需要分成两个阶段,Map和reduce,map阶段,map task完全并行运行,互不干扰,reduce阶段,red...

  • Resize,w 360,h 240
    hadoop之HDFS

    HDFS基础: 分布式文件系统,适合一次写入,多次读出的场景,适合用来做数据分析 HDFS的组成架构: Namenode:是master,存储元...