失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > anaconda r 语言_Centos7系统下R Rstudio及sparklyr的安装与配置

anaconda r 语言_Centos7系统下R Rstudio及sparklyr的安装与配置

时间:2019-08-10 12:18:35

相关推荐

anaconda r 语言_Centos7系统下R  Rstudio及sparklyr的安装与配置

最初想学大数据技术是因为受不了ArcGIS进行空间连接(spatial join)时要长长的等待,有时甚至直接死机。R里有空间连接的包,试了下比ArcGIS要好多,但还是慢,刚好spark支持R就学起来,但是这环境的配置真的是想吐槽。

之前已经安装并配置好Hadoop和Spark伪集群,其实Spark里已经内置了SparkR用于实现R与Spark的连接。网上很多安装方式都是利用yum命令从epel仓库下载,因没有root权限,执行不了yum安装R的命令。第二种方式是用源码编译安装,但是依赖包太多了,并且有的包有版本对应,不停的有新错误出现,陶腾了二天放弃了。最后采取了第三种方式,通过conda命令安装。

1.下载Miniconda3-latest-Linux-x86_64.sh,下载源为清华大学的镜像网站https://mirrors.tuna./anaconda/miniconda/

2 .安装:sh Miniconda3-latest-Linux-x86_64.sh

3.添加镜像源及查看

conda config --add channels https://mirrors.tuna./anaconda/pkgs/free/

conda config --add channels https://mirrors.tuna./anaconda/cloud/conda-forge

conda config --set show_channel_urls yes

conda config –show

conda clean -i

4.环境管理

conda create -n R-4.0.2 # 创建名为R3.5的环境

source activate R-4.0.2

conda search r-base #查找安装包

condainstall r-base #安装R语言(默认安装3.6)

conda install r-base=4.0.2 #指定版本

conda deactivate # 退出当前

conda activate r-4.0.2 #进入该环境

5.安装包的过程中出现HTTP 000 CONNECTIONFAILED for url问题,vi~/.condarc,打开后把所有内容删除,把清华Anaconda 镜像使用帮助的所有channels:复制到condarc里,保存退出。

6.再次安装conda install r-base=4.0.2,并会自动安装相关依赖包。在使用过程中,还是因为包依赖问题,自动选择更换了版本为3.6.

7.安装后,输入大写的R就可以进入R环境。q()退出环境。

8. conda install r-rstudio,安装成功后,输入rstudio回车,弹出rstudio界面。

9.在rstudio里安装install.packages(c(“sf”,”sparklyr”,”geospark”)

10. 启动spark,/home/spark/sbin/start-all.sh

浏览器输入:http://10.103.104.183:8080

11 在rstudio里输入如下命令:

library(sparklyr)

library(sf)

library(geospark)

sc

polygons %

read.table(sep="|", col.names = c("area","geom"))

points %

read.table(sep = "|", col.names = c("city","state", "geom"))

polygons_wkt

points_wkt

12 copy_to()上传的是data.frame格式的,不能直接上传空间数据。

如果觉得《anaconda r 语言_Centos7系统下R Rstudio及sparklyr的安装与配置》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。