我有3個prédictor(原因、wt0、dbp0)和gfr0m作為**值:# import numpy, pandas, and ggplot
import numpy as np
from pandas import *
from ggplot import *
# create python dataframe
cause = prepared_data.map(lambda p: (p.features[0])).collect()
dbp0 = prepared_data.map(lambda p: (p.features[0])).collect()
gfr0m = prepared_data.map(lambda p: (p.label)).collect()
preda = predictionsa.select("prediction").map(lambda r: r[0]).collect()
predb = predictionsb.select("prediction").map(lambda r: r[0]).collect()
pydf =
dataframe()
# create scatter plot and two regression models (scaling exponential) using
ggplot
p = ggplot(pydf, aes('cause','wt0','dbp0','gfr0m')) +
geom_point(color='blue') +
geom_line(pydf, aes('cause','wt0','dbp0','preda'), color='red') +
geom_line(pydf, aes('cause','wt0','dbp0','predb'), color='green') +
scale_x_log10() + scale_y_log10()
display(p)
此**不會執行其show me:「dataframe」物件在新增.rdd時沒有屬性「map」prefore.map它顯示我為錯誤:org.apache.spark.sparkexception:由於階段失敗而中止作業:階段34.0中的任務0失敗1次,最近的失敗:階段34.0中丟失的任務0.0(tid 34,localhost,執行人驅動程式:org.apache.spark.api.python.pythonexexception:回溯(最近的呼叫最後一次):
如果有人能在這種情況下幫助我:)
Python矩陣回歸並視覺化
from matplotlib import pyplot as plt import numpy as np from mpl toolkits.mplot3d import axes3d fig plt.figure figsize 10 6 ax axes3d fig 列出實驗資料 point...
Python 資料視覺化
資料視覺化指的是通過視覺化表示來探索資料,它與資料探勘緊緊相關,而資料探勘指的是使用 來探索資料集的規律和關聯。資料集可以是用一行 就能表示的小型數字列表,也可以是數以吉位元組的資料。漂亮地呈現資料關乎的並非僅僅是漂亮的。以引人注目的簡潔方式呈現資料,讓人能夠明白其含義,發現資料集中原本未意識到的規...
python 視覺化庫
在做titanic分析的過程中,看了一些大神的想法,發現在分析資料的過程中,許多大神會使用到seaborn,plotly這些庫,而我等小白僅僅知道matplotlib這個唯一的資料視覺化庫而已。上網查詢資料後整理如下 資料視覺化庫可以根據其應用場景來分為以下幾類 基礎的2d,3d圖繪製庫,互動資訊視...