Hi!欢迎光临陕西省的权威思科、华为、Oracle、红帽、深信服、微软认证培训中心!
| 029-88235527
您现在所在位置:首页 > 新闻资讯 > 最新资讯 >

鸥鹏it教育简析Java大数据开发必须掌握的四种数据库

发布日期:2021-07-14 09:33:51点击次数:

分享到:

  大数据的典型特征,包括数据量大、数据类型多、价值密度低等,而具备这样特征的数据,在进入到存储阶段时,就需要根据数据类型及场景,来匹配适当的数据存储解决方案。今天我们西安it培训中心来讲讲Java大数据开发当中,必须掌握的四种数据库。
  大数据时代的数据,我们可以大致分为结构化数据和非结构化数据。其中,结构化数据,主要是依靠传统的关系型数据库去存储,比如说Oracle、MySQL、PostgreSQL等,都是关系型数据库的代表
  而比结构化数据,更加庞大的非结构化数据(其中也包括半结构化数据),则主要依靠非关系型数据库来完成存储。对于大数据开发者而言,非关系型数据库(NoSQL)也有不同的类型,需要匹配不同的场景需求来进行选择。

java大数据开发

Java大数据开发之MongoDB

  MongoDB。可以说是大数据时代的数据库代表作了。MongoDB数据库特点是表结构灵活可变,字段类型可以随时修改。MongoDB中的每一行数据只是简单的被转化成Json格式后存储,没有表结构的限制。

  没有表结构这一点,对于MongoDB来说,带来了优势,当然也存在一定的缺陷,比如说在多表查询、复杂事务等高级操作上,MongoDB就显得不够优秀了。

  得益于MongoDB的这些特点,MongoDB很适合那些表结构经常改变,数据的逻辑结构又没那么复杂不需要多表查询操作,数据量又比较大的应用场景。

Java大数据开发之Redis

  Redis是现在热门的key-value数据库。Redis的特点当然就是key-value存储所带来的简单和高性能了。

  所谓key-value存储,就是每一条记录只包含一个用于查询数据的Key,以及与之对应的存储数据的value,就如同现实生活中的门牌号与住户,而没有诸如表、字段这些常规数据库中必需有的复杂概念,所有的查询都仅仅依赖于key值。

  得益于这种简单的结构,再加上Redis会把所有数据加载到内存中的,Redis相比常规数据库的读写性能得到了极大的提升。并且,Redis还支持数据持久化,list、set等多种数据结构,主从复制备份等功能,堪称简单易用。

  同样地,因为数据结构的简单,Redis对复杂查询的支持也有限,不能支持多列查询、区段查询等。总的来说,Redis更适用于读写性能要求极高,且数据表结构简单、查询条件也同样简单的应用场景。

Java大数据开发之ElasticSearch

  ElasticSearch,严格来说,其实不算是数据库,而是搜索引擎,这个产品本身也是围绕搜索来设计的。

  ES的典型优势就是,支持全文搜索,在对中文的支持上也比较友好(单是中文分词器就有很多种)。ES通过建立倒排索引实现全文搜索,以实现对存入ES中的所有数据进行快速检索,就算是非常复杂的聚合查询也可以得到不错的性能。

  当然,ES也同样有不足,明显的就是字段类型无法修改、写入性能较低和高硬件资源消耗。这就注定了ES不适用于数据价值不高、对写入性能有要求、数据量大而成本受限的场景下。

Java大数据开发Hbase

  HBase作为Hadoop生态当中的重要组件,说是大数据必学,相信没有人会反对。HBase优点,就是对海量数据的支持,以及极强的横向(存储容量)扩展能力。

  Hbase的存储和Redis类似,为每一行数据定义一个key,之后所有的查询都依赖这个key进行。但是Hbase的不同在于,一行数据还可以有非常多的列项,数据会按照列进行分组和存储,同一列的数据存储在同一个地方。

  HBase的列式存储特性带来了海量数据规模的支持和极强的扩展能力,但是也给数据的读取带来很大的局限。由于只有同一列族的数据才会被存放在一起,而且所有的查询都必须要依赖Key,这就使得很多复杂查询难以进行。