測試環境,由3臺虛機(vmware),每台記憶體3g
作業系統:centos7
軟體:
a、jdk1.7
b、hadoop-2.5.0-cdh5.3.6
c、hive-0.13.1-cdh5.3.6.tar
d、scala-2.11.4
e、zookeeper-3.4.5-cdh5.3.6
f、kafka_2.9.2-0.8.1
g、flume-ng-1.5.0-cdh5.3.6
h、spark-1.5.1-bin-hadoop2.4
電商使用者行為分析大資料平台相關系列1-環境介紹
電商使用者行為分析大資料平台相關系列2-hadoop環境搭建
電商使用者行為分析大資料平台相關系列3-hive安裝
電商使用者行為分析大資料平台相關系列4-zookeeper安裝
電商使用者行為分析大資料平台相關系列5-kafka安裝
電商使用者行為分析大資料平台相關系列6-flume安裝
電商使用者行為分析大資料平台相關系列7-spark安裝
電商使用者行為分析大資料平台相關系列8-資料分析流程
電商使用者行為分析大資料平台相關系列9-使用者訪問session的模組介紹
電商使用者行為分析大資料平台相關系列10-基礎資料結構分析
對電商平台使用者行為分析
將購買次數進行聚類 from sklearn.cluster import kmeans from sklearn import preprocessing import pandas as pd import numpy as np 輸入資料,userseparate.csv是上述查詢到的每個使用...
大資料場景 使用者行為日誌分析
使用者日誌 訪問的系統屬性 作業系統 瀏覽器型別 訪問資訊 session id,訪問ip 資料處理 有資料者有未來,有資料意味著每乙份使用者行為資料都是寶貴的資源。經過資料清洗,再用演算法提取分析,商業價值,商業決策 線上推廣 等等 當然一切建立在有大量使用者有流量的情況下的。資料處理流程 資料採...
Python 電商使用者購買系列相關性
背景 假設電商平台會員300萬,商品按照系列劃分有30個系列,本次分析的目的 分析使用者購買系列間的相關性。coding utf 8 created on mon may 13 13 40 14 2019 author liuxiaohuan import os import cx oracle i...