版本:
scala2.11.8
spark-1.6.2-bin-hadoop2.6
hadoop2.6
pom:
<?xml version="1.0" encoding="utf-8"?>
4.0.0
com.kejin
dataload
1.0-snapshot
org.apache.spark
spark-core_2.11
org.apache.spark
spark-sql_2.11
org.scala-lang
scala-library
org.mongodb
casbah-core_2.11
3.1.1
org.mongodb.spark
mongo-spark-connector_2.11
2.0.0
org.apache.spark
spark-core_2.11
2.1.1
org.apache.spark
spark-sql_2.11
2.1.1
org.apache.spark
spark-streaming_2.11
2.1.1
org.apache.spark
spark-mllib_2.11
2.1.1
org.apache.spark
spark-graphx_2.11
2.1.1
org.scala-lang
scala-library
2.11.8
org.scala-lang
scala-compiler
2.11.8
org.scala-lang
scala-reflect
2.11.8
dataloader.scala:
package com.kejin.recommender
import com.mongodb.casbah.commons.mongodbobject
import com.mongodb.casbah.
import org.apache.spark.sparkconf
import org.apache.spark.sql.
/** * product資料集
* 3982 商品id
* fuhlen 富勒 m8眩光舞者時尚節能 商品名稱
* 1057,439,736 商品分類id,不需要
* b009ejn4t2 亞馬遜id,不需要
* 商品的url
* 外設產品|滑鼠|電腦/辦公 商品分類
* 富勒|滑鼠|電子產品|好用|外觀漂亮 商品ugc標籤
*/case class product( productid: int, name: string, imageurl: string, categories: string, tags: string )
/** * rating資料集
* 4867 使用者id
* 457976 商品id
* 5.0 評分
* 1395676800 時間戳
*/case class rating( userid: int, productid: int, score: double, timestamp: int )
/** * mongodb連線配置
* @param uri mongodb的連線uri
* @param db 要操作的db
*/case class mongoconfig( uri: string, db: string )
object dataloader ).todf()
val ratingrdd = spark.sparkcontext.textfile(rating_data_path)
val ratingdf = ratingrdd.map( item => ).todf()
implicit val mongoconfig = mongoconfig( config("mongo.uri"), config("mongo.db") )
storedatainmongodb( productdf, ratingdf )
spark.stop()
} def storedatainmongodb( productdf: dataframe, ratingdf: dataframe )(implicit mongoconfig: mongoconfig): unit =
}
電商系統 好用的電商系統 電商管理系統
好用的電商管理系統 首先對於日漸擴大的電商行業來說,每日訂單資料統計 訂單產品的分類 老客戶的維護 店鋪每日的實際收入 庫存情況 採購物品的資訊跟蹤都是需要我們花時間去統計和關注的,所以電商管理最主要的作用應該體現在 1.商品管理 2.庫存管理 3.採購管理 4.訂單管理 5.配送結算 6.財務管理...
電商推薦系統專案工作總結
1 資料集中是否存在缺失值,處理缺失值。處理資料集中缺失值的策略大概分為刪除,補齊和忽略三類。組刪除 將含有缺失值的屬性特徵刪除 電商推薦中一般不採取此方法,具體看業務場景 忽略 補齊處理只是將未知值補以我們的主觀估計值,不一定完全符合客觀事實,在對不完備資訊進行補齊處理的同時,我們或多或少地改變了...
電商系統 電商ERP後台管理系統
在b2b電商 搭建完成之後最重要的就是對 進行運營,其中 後台管理系統是建立在b2b電商 上的一種工具,那麼我們應該怎麼對這種工具性的產品進行運營呢?一 規範b2b電子 產品的 定位標準 首先就是要規範b2b 的產品 定位,一般產品的 都是以產品的成本以及一些附加值,品牌價值等因素來體現的,b2b ...