常见大数据产品
常见大数据产品 大数据产品提供数据存储、处理、分析和可视化功能,支持从海量数据中提取价值。包括Hadoop、Spark等处理框架,HDFS、HBase等存储系统,Hive、Impala等数据仓库工具,Kafka、Flink等流处理平台,以及Hue、Ambari等管理和监控工具。广泛应用于商业智能、机器学习、实时分析等领域。
开源产品 Apache Hadoop
分布式存储与计算平台
Apache Spark
大数据处理框架
Apache Flink
实时数据处理引擎
Apache HBase
分布式非关系数据库
Apache Kafka
流处理平台
Apache Hive
数据仓库工具
Apache Storm
实时计算系统
Apache Druid
实时分析数据库
Apache Solr
搜索平台
Apache Kudu
存储引擎
Apache Impala
实时查询分析
Apache Oozie
工作流调度系统
Apache Beam
统一的模型进行批处理和流处理
Apache Airflow
工作流管理平台
Apache Pulsar
云原生分布式消息传递和流数据平台
Apache Pig
Hadoop平台脚本语言
Apache Tez
扩展数据处理框架
Apache Ambari
管理与监控Hadoop集群
Apache Chukwa
数据收集系统
Apache Cassandra
分布式NoSQL数据库
Apache Avro
数据序列化系统
Prestodb
分布式SQL查询引擎
DuckDB
轻量便捷OLAP数据库
Greenplum
大规模分布式数据仓库
这些产品里除了轻量便捷的DuckDB、基于PG改造的Greenplum外,基本都是 Hadoop 生态产品。站在个人角度比较认同 DuckDB 的观点,对于大部分的中小企业来说,数据分析不会太复杂,很多分析操作都是即时性、快捷的。
商业产品 Teradata
分析型数据库
Snowflake
云数据仓库
Databricks
大数据处理和分析
Cloudera
Hadoop发行版
Splunk
数据分析和情报
Elasticsearch
分布式搜索引擎
Confluent Platform
企业级流处理
Qlik
数据集成和分析
Tableau
数据可视化平台
Power BI
商业分析服务
帆软BI
企业级数据可视化平台
TIBCO Spotfire
数据分析与可视化
SAS
分析解决方案
云产品 Amazon Redshift
云数据仓库
Google BigQuery
云数据仓库
Amazon EMR
大数据处理服务
Google Cloud Dataproc
管理的Spark和Hadoop服务
Azure HDInsight
云中的Hadoop服务
IBM Db2 Warehouse
数据仓库数据库
Microsoft Azure Synapse Analytics
无限数据仓库和分析
捐赠本站(Donate) 如您感觉文章有用,可扫码捐赠本站!(If the article useful, you can scan the QR code to donate))