欢迎使用 DC/OS Apache Spark 服务文档。有关新特性和更新特性的详细信息,请参阅 发布说明。
Apache Spark 是一种用于大数据的快速通用集群计算系统。它提供 Scala、Java、Python 和 R 的高级 API,以及支持数据分析一般计算图形的优化引擎。它还支持丰富的高级工具,包括用于 SQL 和 DatAframes 的 Spark SQL、用于机器学习的 MLlib、用于图形处理的 GraphX 和用于流处理的 Spark Streaming。有关详细信息,请参阅 Apache Spark 文档。
DC/OS Apache Spark 包括 Apache Spark和几个自定义提交 和 DC/OS 特定包装。
DC/OS Apache Spark 包括:
- Mesos 集群调度器
- Spark History Server
- DC/OS Apache Spark CLI
- 交互式 Spark shell
优势
- 利用率:DC/OS Apache Spark 利用 Mesos 在与其他 DC/OS 服务相同的集群上运行 Spark
- 提高效率
- 简单管理
- 多团队支持
- 通过笔记本电脑进行交互式分析
- UI 集成
- 安全,包括基于文件和环境的密钥
特征
- 多版本支持
- 运行多个 Spark 调度器
- 针对多个 HDFS 集群运行
- 计划排程改进的后端端口
- 简单安装所有 Spark 组件,包括调度器和历史服务器
- 调度器和历史服务器的集成
- Zeppelin 集成
- Kerberos 和 SSL 支持
相关服务
快速入门
Spark 入门…Read More
安装和自定义
使用 Web 界面或 DC/OS CLI 安装 Spark…Read More
使用示例
使用示例…Read More
与 HDFS 集成
了解如何通过 DC/OS Apache Spark 配置 HDFS…Read More
Spark History 服务器
为 Spark History 服务器启用 HDFS…Read More
安全
保护您的服务…Read More
已升级
升级您的 DC/OS Apache Spark 服务…Read More
卸载
卸载 DC/OS Apache Spark 服务…Read More
运行时配置更改
运行时自定义 Spark…Read More
运行 Spark 作业
运行 Spark 作业…Read More
交互式 Spark Shell
在 Spark shell 中交互运行 Spark 命令…Read More
自定义 Docker 镜像
自定义 Spark 图片…Read More
容错
了解 DC/OS Apache Spark 上的容错…Read More
作业计划
作业计划选项的概述…Read More
Kerberos
通过 Spark 使用 Kerberos…Read More
故障排除
诊断 Spark…Read More
版本政策
支持的版本…Read More
限制
已知和已测试限制…Read More
版本注释
Spark 和 Spark 历史版本 2.3.1-2.2.1-2…Read More
为 Spark 配置 DC/OS Access
ENTERPRISE
# 版本…Read More