这个问题在网上大部分人都是说 Java_Home 配置的有问题,或者调节 Java_Home 和 Spark_Home 顺序来表示执行优先级,但是我试了各种方法之后都没有成功。尝试阅读 Pyspark.cmd 源码仍然无法解决这个问题。
然后我就准备把 Spark 整个卸载重装试试,卸载完了清空了环境变量,然后 cmd 输入 pyspark.cmd 没想到竟然能执行!整个人都懵了,我检查了一遍环境变量,没有任何问题,怎么可能还能跑呢……我就试着用 everything 搜了一下 spark-shell.cmd,发现在Python 脚本文件夹里面有这个脚本,进去执行了一下发现版本和我自己安装的都是对应的!woc,没想到坑在这里,因为我之前为了学 Spark 安装了一个原生的 Spark 包,使用 Scala 进行编程,然后换 Python 的时候,顺手pip install pyspark
了,发现是个 200多M的大包,当时也没感觉什么奇怪,现在终于挖坑了。
之后我也没在安装 Spark,就使用 Python 自带的 Spark 也是能够正常运行的:
大功告成!在这里我仅提供一个思路,如果有同学和我是一样安装了 Spark 和 Pyspark 可以看看是不是这个问题~
如果觉得《Pyspark 报错 “系统找不到指定的路径“》对你有帮助,请点赞、收藏,并留下你的观点哦!