各存储引擎优缺点

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

MPP的优缺点

MPP解决了单个SQL数据库不能存放海量数据的问题但是也存在一些问题例如

当节点数达到100左右时MPP有些仍会遇到SQScalability的问题速度变慢或者不稳定。

当增加或者删除节点的时候需要的维护工作仍然比较大集群会遇到数据迁移和重新平衡的问题

MPP数据库适合存储高密度价值数据并且是长期存储和多次使用所以MPP并行数据库会花大量的精力在Load阶段把数据处理成适合分析格式。带来的优点就是从查询速度快通常在秒级甚至毫秒级以内就可以返回查询结果。缺点是不支持细粒度的容错。

Hive的优缺点

一、优点

1.操作接口采用类SQL语法提高快速开发的能力简单、容易上手

2.避免了去写MapReduce减少开发人员的学习成本

3.Hive擅长处理大数据对小数据处理没有优势因为Hive的延迟比较高

二、缺点

1.Hive的HQL表达能力有限迭代算法无法表达

2.不擅长数据挖掘方面由于MapReduce数据处理流程的限制效率更高的算法却无法实现

3.Hive自动生成的MapReduce作业通常情况下不够智能化

4.Hive调优比较困难粒度较粗

5.Hive不擅长处理实时性高的场合

ClickHouse优缺点

一、优点

  1. 为了高效的使用CPU数据不仅仅按列存储同时还按向量进行处理
  2. 数据压缩空间大减少IO处理单查询高吞吐量每台服务器每秒最多数十亿行
  3. 索引非B树结构不需要满足最左原则只要过滤条件在索引列中包含即可即使在使用的数据不在索引中由于各种并行处理机制ClickHouse全表扫描的速度也很快
  4. 写入速度非常快50-200M/s对于大量的数据更新非常适用。

二、缺点

  1. 不支持事务不支持真正的删除/更新
  2. 不支持高并发官方建议qps为100可以通过修改配置文件增加连接数但是在服务器足够好的情况下
  3. SQL满足日常使用80%以上的语法join写法比较特殊最新版已支持类似SQL的join但性能不好
  4. 尽量做1000条以上批量的写入避免逐行insert或小批量的insertupdatedelete操作因为ClickHouse底层会不断的做异步的数据合并会影响查询性能这个在做实时数据写入的时候要尽量避开
  5. Clickhouse快是因为采用了并行处理机制即使一个查询也会用服务器一半的CPU去执行所以ClickHouse不能支持高并发的使用场景默认单查询使用CPU核数为服务器核数的一半安装时会自动识别服务器核数可以通过配置文件修改该参数。

        全量数据导入数据导入临时表 -> 导入完成后将原表改名为tmp1 -> 将临时表改名为正式表 -> 删除原表

        增量数据导入 增量数据导入临时表 -> 将原数据除增量外的也导入临时表 -> 导入完成后将原表改名为tmp1-> 将临时表改成正式表-> 删除原数据表

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6