常见大数据产品

    常见大数据产品 大数据产品提供数据存储、处理、分析和可视化功能,支持从海量数据中提取价值。包括Hadoop、Spark等处理框架,HDFS、HBase等存储系统,Hive、Impala等数据仓库工具,Kafka、Flink等流处理平台,以及Hue、Ambari等管理和监控工具。广泛应用于商业智能、机器学习、实时分析等领域。

    开源产品 Apache Hadoop

    分布式存储与计算平台

    Apache Spark

    大数据处理框架

    Apache Flink

    实时数据处理引擎

    Apache HBase

    分布式非关系数据库

    Apache Kafka

    流处理平台

    Apache Hive

    数据仓库工具

    Apache Storm

    实时计算系统

    Apache Druid

    实时分析数据库

    Apache Solr

    搜索平台

    Apache Kudu

    存储引擎

    Apache Impala

    实时查询分析

    Apache Oozie

    工作流调度系统

    Apache Beam

    统一的模型进行批处理和流处理

    Apache Airflow

    工作流管理平台

    Apache Pulsar

    云原生分布式消息传递和流数据平台

    Apache Pig

    Hadoop平台脚本语言

    Apache Tez

    扩展数据处理框架

    Apache Ambari

    管理与监控Hadoop集群

    Apache Chukwa

    数据收集系统

    Apache Cassandra

    分布式NoSQL数据库

    Apache Avro

    数据序列化系统

    Prestodb

    分布式SQL查询引擎

    DuckDB

    轻量便捷OLAP数据库

    Greenplum

    大规模分布式数据仓库

    这些产品里除了轻量便捷的DuckDB、基于PG改造的Greenplum外,基本都是 Hadoop 生态产品。站在个人角度比较认同 DuckDB 的观点,对于大部分的中小企业来说,数据分析不会太复杂,很多分析操作都是即时性、快捷的。

    商业产品 Teradata

    分析型数据库

    Snowflake

    云数据仓库

    Databricks

    大数据处理和分析

    Cloudera

    Hadoop发行版

    Splunk

    数据分析和情报

    Elasticsearch

    分布式搜索引擎

    Confluent Platform

    企业级流处理

    Qlik

    数据集成和分析

    Tableau

    数据可视化平台

    Power BI

    商业分析服务

    帆软BI

    企业级数据可视化平台

    TIBCO Spotfire

    数据分析与可视化

    SAS

    分析解决方案

    云产品 Amazon Redshift

    云数据仓库

    Google BigQuery

    云数据仓库

    Amazon EMR

    大数据处理服务

    Google Cloud Dataproc

    管理的Spark和Hadoop服务

    Azure HDInsight

    云中的Hadoop服务

    IBM Db2 Warehouse

    数据仓库数据库

    Microsoft Azure Synapse Analytics

    无限数据仓库和分析

    捐赠本站(Donate) 如您感觉文章有用,可扫码捐赠本站!(If the article useful, you can scan the QR code to donate))