中文字幕第五页-中文字幕第页-中文字幕韩国-中文字幕最新-国产尤物二区三区在线观看-国产尤物福利视频一区二区

怎么讓CDSW的PySpark自動適配Python版本

今天就跟大家聊聊有關怎么讓CDSW的PySpark自動適配Python版本,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

站在用戶的角度思考問題,與客戶深入溝通,找到鎮雄網站設計與鎮雄網站推廣的解決方案,憑借多年的經驗,讓設計與互聯網技術結合,創造個性化、用戶體驗好的作品,建站類型包括:成都做網站、成都網站制作、成都外貿網站建設、企業官網、英文網站、手機端網站、網站推廣、域名與空間、網絡空間、企業郵箱。業務覆蓋鎮雄地區。


   

在CDH集群中Spark2的Python環境默認為Python2,CDSW在啟動Session時可以選擇Engine Kernel版本Python2或者Python3。當選擇Python3啟動Session時,開發PySpark作業在運行時會報“Python in worker has different version 2.7 than that in driver 3.6, PySpark cannot run with different minor versions.Please check environment variables PYSPARK_PYTHON and PYSPARK_DRIVER_PYTHON are correctly set”,為解決Python版本適配的問題,需要進行如下調整來使我們的應用自動的適配Python版本。

集群部署多個Python版本    

   

基于CDH提供的Anaconda Parcels包來安裝Python,通過在CDH集群同時安裝兩個Python版本的Parcel包來解決多個版本的問題。如果需要在Spark中默認的支持Python2或者Python3版本則激活相應版本的Parcel即可,在我的集群默認激活的為Python2版本的Parcel包,在接下來的操作主要介紹Python3的環境準備。

怎么讓CDSW的PySpark自動適配Python版本

Spark2默認使用的Python2環境變量

怎么讓CDSW的PySpark自動適配Python版本

1.Python2版本的Anaconda下載地址如下:

https://repo.anaconda.com/pkgs/misc/parcels/Anaconda-2019.07-el7.parcel
https://repo.anaconda.com/pkgs/misc/parcels/Anaconda-2019.07-el7.parcel.sha
https://repo.anaconda.com/pkgs/misc/parcels/manifest.json

2.Python3版本的Anaconda下載地址如下:

https://repo.anaconda.com/pkgs/misc/parcels/archive/Anaconda-5.1.0.1-el7.parcel
https://repo.anaconda.com/pkgs/misc/parcels/archive/Anaconda-5.1.0.1-el7.parcel.sha
https://repo.anaconda.com/pkgs/misc/parcels/archive/manifest.json

3.將下載好的parcel包部署到集群的私有HTTP服務上

怎么讓CDSW的PySpark自動適配Python版本

4.使用管理員賬號登錄Cloudera Manager進入Parcel包管理界面配置Anaconda地址

怎么讓CDSW的PySpark自動適配Python版本

5.完成Parcel地址配置后完成對應版本Parcel包的下載分配即可

怎么讓CDSW的PySpark自動適配Python版本

上述操作不需要激活,在不激活的情況下PySpark默認使用的Python2環境,如果激活則使用的是Python3環境。

6.確認集群所有節點已存在Python2和Python3的環境

怎么讓CDSW的PySpark自動適配Python版本

CDSW自動為Spark適配Python版本    

   

為了能讓我們的Pyspark程序代碼自動適配到不同版本的Python,需要在我們的Spark代碼初始化之前進行環境的初始化,在代碼運行前增加如下代碼實現適配不同版本的Python。

import os
py_environ=os.environ['CONDA_DEFAULT_ENV']
if py_environ=='python2.7':
  os.environ['PYSPARK_PYTHON'] = '/opt/cloudera/parcels/Anaconda/bin/python'
else:
  os.environ['PYSPARK_PYTHON'] = '/opt/cloudera/parcels/Anaconda-5.1.0.1/bin/python'

怎么讓CDSW的PySpark自動適配Python版本

驗證程序自動適配Python版本    

   

1.選擇Python2環境啟動Session

怎么讓CDSW的PySpark自動適配Python版本

2.運行PySpark作業測試正常運行

怎么讓CDSW的PySpark自動適配Python版本

3.選擇Python3環境啟動Session

怎么讓CDSW的PySpark自動適配Python版本

4.運行PySpark作業測試正常運行

怎么讓CDSW的PySpark自動適配Python版本

總結    

在集群中同時部署多個版本的Python,通過在Pyspark代碼中使用Python命令動態的指定PYSPARK_PYTHON為我們需要的Python環境即可。

看完上述內容,你們對怎么讓CDSW的PySpark自動適配Python版本有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注創新互聯行業資訊頻道,感謝大家的支持。

分享標題:怎么讓CDSW的PySpark自動適配Python版本
文章來源:http://m.2m8n56k.cn/article0/jdcsio.html

成都網站建設公司_創新互聯,為您提供商城網站定制網站App設計動態網站服務器托管網站制作

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

成都定制網站建設
主站蜘蛛池模板: 九九色网站 | 67194国产精品| 三级三级三级网站网址 | 日韩美女一级片 | 亚洲精品成人网 | 国产精品亚洲专一区二区三区 | 99久久精品自在自看国产 | 波多野结衣视频免费在线观看 | 国产日韩欧美在线 | 毛片免费看看 | 免费看成人毛片 | 亚洲一区 中文字幕 久久 | 怡红院免费播放全部视频 | 成人18在线视频播放 | 在线精品日韩一区二区三区 | 黄色国产在线观看 | 在线日韩中文字幕 | 国产一区二区三区成人久久片 | 国产一级第一级毛片 | 国产成人精品久久一区二区三区 | 国产欧美亚洲精品一区 | 欧美成人精品一级高清片 | 欧美三级免费 | 欧美激情性色生活片在线观看 | 在线视频一区二区三区 | 亚洲综合无码一区二区 | 国产 magnet| 欧美一级看片免费观看视频在线 | 自偷自偷自亚洲永久 | 久久国产免费一区二区三区 | 欧美成人a | 高清日本在线成人免费视频 | 九九精品视频在线观看九九 | 亚洲美女福利视频在线 | 日韩三级黄色 | 久久w5ww成w人免费不卡 | 国产精品久久久久久久久久久久 | 成人毛片1024你懂的 | 亚洲精品在线观看视频 | wwwav视频| 日韩欧美在线视频 |