趁著今天電腦進水 進去檢修,寫點平時用的東西。在進行資料分析的時候會遇到字段型別是相反的,之前我顯示出來的報表呈現欄位是這樣的 :
table name : t1
column name :robot , not_robot
最後效果是:
robot not_robot
30 40
這樣子有缺點就是檢視總覺得少點什麼,於是最近使用spark dataframe實現了這樣的功能:
table name : t1
column name :robot , not_robot
最後效果是:
act_type act_num
robot 30
not_robot 40
這樣子就實現了兩個不同的子段在一列 ,在別人看檢視的時候可以去選擇看robot的連續時間段內的變化情況。非常的方便。
實現過程:使用withcolumn和withcolumnnewname方法 就是這兩個方法,可能字母有誤,,沒在電腦旁邊。
就這樣吧。
資料分析入門 pandas之合併函式merge
merge有點類似sql中的join,可以將不同資料集按照某些字段進行合併,得到新的資料集 1.引數一覽表 2.一對一連線 預設情況下,會按照相同欄位的進行連線 例如有相同欄位emp的兩個df,merge的時候就會根據emp進行連線,且根據引數知道,預設是內連線 使用預設的不是很明了,通常情況下,我...
資料分析之遊戲內關鍵資料分析
什麼是遊戲的相關性,作為乙個分析的 偵探 那麼遊戲的相關性也就是線索,熟悉遊戲的相關性的 心法 就可以快速和正確選擇分析的切入點。本文主要通過找到lol遊戲中角色金幣,進而演示。基礎篇 演示直接找到角色金幣邏輯,高階篇 中將會演示如何通過金幣的和交易邏輯的相關性找到角色的裝備 1 選定第乙個裝備欄位...
資料分析之Pandas
from pandas import series,dataframe import pandas as pd import numpy as np states california ohio oregon texas year 2000,2001,2002,2003 value 35000,71...