比较Apache火花TM 和砖


Apache Spark功能提供了速度, 易用性和广泛的使用优势,包括支持一系列用例的api:

  • 数据集成和ETL
  • 互动分析
  • 机器学习和高级分析
  • 实时数据处理

v


砖构建于Spark之上,并添加:

  • 高可靠性和高性能的数据管道
  • 大规模的生产性数据科学

想了解更多? 访问mg游戏的 平台页面.

特征比较

砖

了解更多

是的 No
运行多个Spark版本 是的 No
内置为云存储访问优化的文件系统(AWS S3, Redshift, Azure Blob) 是的 No
无服务器池为SQL和Python工作负载提供自动配置资源 是的 No
spark本地细粒度资源共享,以实现最佳利用 是的 No
计算资源故障隔离 是的 No
更快地写入S3 是的 No
在连接和过滤器期间进行计算优化 是的 No
快速的发布周期 是的 No
伸缩计算 是的 No
伸缩本地存储 是的 No
集群的高可用性 是的 No
多用户共享集群 是的 No
在现货和按需实例之间自动迁移 是的 No
第二级计费 是的 No

是的 No

ACID事务 是的 No
模式管理 是的 No
批处理/流读/写支持 是的 No
数据版本控制 是的 No
性能优化 是的 No

是的 No
交互式笔记本,支持多种语言(SQL, Python, R和Scala) 是的 No
实时协作 是的 No
笔记本修订历史和GitHub集成 是的 No
一键式可视化 是的 No
将笔记本发布为交互式仪表板 是的 No

是的 No
Spark作业监视警报 是的 No
从笔记本电脑到Spark Jobs的一键式部署 是的 No
在笔记本中构建工作流的api 是的 No
带监控的生产流 是的 No

了解更多

是的 No
对笔记本、集群、作业和结构化数据的访问控制 是的 No
审计日志 是的 No
使用SAML 2进行SSO.0支持 是的 No
数据加密(静态和动态) 是的 No
符合标准(HIPAA, SOC 2 2型) 是的 No

是的 No
通过认证的ODBC/JDBC连接其他BI工具(Tableau, Looker等) 是的 No
REST API 是的 No
数据源连接 是的 No

是的 No
Spark工程师的提交者的帮助和支持 是的 No
SQL支持 是的 No

额外的资源

云环境下的大数据SQL平台基准测试

博客

 

酒店如何.Com增加了20倍的数据分析,没有性能问题

客户的故事

 

管理三角洲湖:最好的数据湖、仓库和流系统.

演示