网站首页  软件下载  游戏下载  源码下载  词典软件  教程攻略

请输入您要查询的软件:

 

软件 Apache Spark(数据处理引擎) v2.0 官方安装免费版
图标
分类 软件下载-应用软件-编程开发-编程工具 编程工具
语言 简体中文
大小 175MB
软件类型 国产软件
发布时间
用户评分 3
备案号
官方网址
软件授权 免费软件
操作系统 Windows平台
厂商
下载
介绍

Apache Spark是一款非常好用且功能强大的大规模数据处理引擎,拥有简单、高效、易用的特点,理论上要比Hadoop MapReduce快上百倍,可以方便开发者快速地编写和测试Java、Scala、Python、R程序,有从事编程开发的朋友一定要前来下载使用哦。

软件特色
1、高速:运行程序的速度在存储器中比Hadoop MapReduce快上百倍,在磁盘中比Hadoop MapReduce快数十倍。
Spark 拥有一个先进的DAG执行引擎,支持循环数据流和内存计算。
2、易用:编写Java、Scala、Python、R程序快速高效。
Spark提供超过80个易于构建并行应用程序的高阶运算符,你也可以在Scala、 Python和R shells中对它进行交互使用。
3、通用:可结合SQL、流媒体和复杂的分析。
Spark支持一系列元件库堆栈,包括SQL与 DataFrames,用于机器学习的MLlib ,GraphX,Spark Streaming。你可以在同一个应用程序无缝地结合这些元件库。
4、无处不在:Spark可以运行在Hadoop、Mesos、standalone以及云端。它可以访问包括 HDFS、 Cassandra、 HBase和S3在内的不同数据源。
你可以使用其独立集群模式来运行Spark,运行在 EC2、 Hadoop YARN还是Apache Mesos都不是问题。它可以访问HDFS、Cassandra、HBase、Hive、Tachyon等任意的Hadoop数据源。

主要功能
1.更高的性能,因为数据被加载到集群主机的分布式内存中。数据可以被快速的转换迭代,并缓存用以后续的频繁访问需求。很多对Spark感兴趣的朋友可能也会听过这样一句话——在数据全部加载到内存的情况下,Spark可以比Hadoop快100倍,在内存不够存放所有数据的情况下快 Hadoop 10倍。
2.通过建立在Java、Scala、Python、SQL(应对交互式查询)的标准API以方便各行各业使用,同时还含有大量开箱即用的机器学习库。
3.与现有Hadoop v1 (SIMR) 和2.x (YARN) 生态兼容,因此机构可以进行无缝迁移。
4.方便下载和安装。方便的shell(REPL: Read-Eval-Print-Loop)可以对API进行交互式的学习。
5.借助高等级的架构提高生产力,从而可以讲精力放到计算上。
同时,Apache Spark由Scala实现,代码非常简洁。

截图
随便看

 

网盟-旗舰软件下载站,将绿色免费商业版破解软件、共享软件、游戏、电影、电视剧一网打尽!

 

Copyright © 2002-2024 cnnbu.com All Rights Reserved
更新时间:2025/4/7 1:55:11