- 相關推薦
Java程序員使用大數(shù)據(jù)工具匯總
在許多情況下,使用SQL數(shù)據(jù)庫用于存儲/檢索數(shù)據(jù)就足夠了。但在另一些情況下,要么SQL數(shù)據(jù)庫規(guī)模不夠,要么還有更好的工具。這一切都取決于使用情況。
現(xiàn)在讓我們來討論一下存儲/處理數(shù)據(jù)用的不同的非SQL工具——NoSQL數(shù)據(jù)庫,內(nèi)存緩存,全文搜索引擎,實時流,圖形數(shù)據(jù)庫,等等。
MongoDB
一種流行的,跨平臺的面向文檔的數(shù)據(jù)庫。
Elasticsearch
專為云而構建的分布式REST風格搜索引擎。
Cassandra
一個開源的分布式數(shù)據(jù)庫管理系統(tǒng),最初由臉譜網(wǎng)開發(fā),被設計用來處理橫跨多個商用服務器的大量數(shù)據(jù),提供了無單點故障的高度可用性。
Redis
一個開源的(BSD許可),內(nèi)存數(shù)據(jù)結(jié)構存儲,作為數(shù)據(jù)庫、緩存和消息代理使用。
Hazelcast
基于Java的開源內(nèi)存數(shù)據(jù)網(wǎng)格。
EHCache
一種被廣泛使用的開源Java分布式緩存,用于通用緩存、Java EE和輕量級容器。
Hadoop
用Java編寫的一個開源軟件框架,用于分布式存儲和對在計算機集群上的超大型數(shù)據(jù)集的分布式處理。
Solr
一個開源的企業(yè)搜索平臺,用Java編寫的,來自于Apache Lucene項目。
Spark
Apache Software Foundation中最活躍的項目,一個開源的集群計算框架。
Memcached
一個通用的分布式內(nèi)存緩存系統(tǒng)。
Apache Hive
提供了Hadoop之上類似于SQL的層。
Apache Kafka
一個高通量、分布式的發(fā)布-訂閱式消息系統(tǒng),最初開發(fā)在LinkedIn上。Windows上脫離Cygwin運行Apache Kafka。
Akka
一個工具包和運行時,用于在JVM上構建高度并行的、分布式的、有彈性的消息驅(qū)動的應用程序。
HBase
一個開源的,非關系型的,分布式數(shù)據(jù)庫,在谷歌的BigTable后建模,用Java編寫,并運行在HDFS上。
Neo4j
用Java實現(xiàn)的開源圖形數(shù)據(jù)庫。
CouchBase
一個開源的、面向文檔的分布式NoSQL數(shù)據(jù)庫,特別為了交互式應用而優(yōu)化。
Apache Storm
開源的分布式實時計算系統(tǒng)。
CouchDB
使用JSON來存儲數(shù)據(jù)的面向文檔的開源NoSQL數(shù)據(jù)庫。
Oracle Coherence
一個內(nèi)存的數(shù)據(jù)網(wǎng)格解決方案,通過提供快速訪問常用數(shù)據(jù)的渠道,使得企業(yè)可預測地擴展關鍵任務應用程序。
Titan
一個可擴展的圖形數(shù)據(jù)庫,優(yōu)化的目的在于存儲和查詢包含數(shù)千億頂點和邊的圖形,分布在多機集群。
Amazon DynamoDB
一個快速、靈活、完全管理的NoSQL數(shù)據(jù)庫服務,用于在任何規(guī)模需要一致的、個位數(shù)毫秒延遲的所有應用程序。
Amazon Kinesis
用于在AWS上的流數(shù)據(jù)的實時平臺。
Datomic
一個用Clojure寫的完全事務式的,支持云的,分布式數(shù)據(jù)庫。
【Java程序員使用大數(shù)據(jù)工具】相關文章:
Java程序員必備的開發(fā)工具09-09
JAVA認證基礎知識:JSP使用數(shù)據(jù)庫操作06-10
繪制工具的介紹及使用技巧08-06
coreldraw使用曲線工具教程06-20
illustrator縮放工具使用教程12-27
美甲工具的使用方法05-05
word畫圖工具使用教程案例07-24