電商推薦系統 資料載入

2021-10-18 15:37:32 字數 2454 閱讀 1552

版本:

scala2.11.8

spark-1.6.2-bin-hadoop2.6

hadoop2.6

pom:

<?xml version="1.0" encoding="utf-8"?>

4.0.0

com.kejin

dataload

1.0-snapshot

org.apache.spark

spark-core_2.11

org.apache.spark

spark-sql_2.11

org.scala-lang

scala-library

org.mongodb

casbah-core_2.11

3.1.1

org.mongodb.spark

mongo-spark-connector_2.11

2.0.0

org.apache.spark

spark-core_2.11

2.1.1

org.apache.spark

spark-sql_2.11

2.1.1

org.apache.spark

spark-streaming_2.11

2.1.1

org.apache.spark

spark-mllib_2.11

2.1.1

org.apache.spark

spark-graphx_2.11

2.1.1

org.scala-lang

scala-library

2.11.8

org.scala-lang

scala-compiler

2.11.8

org.scala-lang

scala-reflect

2.11.8

dataloader.scala:

package com.kejin.recommender

import com.mongodb.casbah.commons.mongodbobject

import com.mongodb.casbah.

import org.apache.spark.sparkconf

import org.apache.spark.sql.

/** * product資料集

* 3982 商品id

* fuhlen 富勒 m8眩光舞者時尚節能 商品名稱

* 1057,439,736 商品分類id,不需要

* b009ejn4t2 亞馬遜id,不需要

* 商品的url

* 外設產品|滑鼠|電腦/辦公 商品分類

* 富勒|滑鼠|電子產品|好用|外觀漂亮 商品ugc標籤

*/case class product( productid: int, name: string, imageurl: string, categories: string, tags: string )

/** * rating資料集

* 4867 使用者id

* 457976 商品id

* 5.0 評分

* 1395676800 時間戳

*/case class rating( userid: int, productid: int, score: double, timestamp: int )

/** * mongodb連線配置

* @param uri mongodb的連線uri

* @param db 要操作的db

*/case class mongoconfig( uri: string, db: string )

object dataloader ).todf()

val ratingrdd = spark.sparkcontext.textfile(rating_data_path)

val ratingdf = ratingrdd.map( item => ).todf()

implicit val mongoconfig = mongoconfig( config("mongo.uri"), config("mongo.db") )

storedatainmongodb( productdf, ratingdf )

spark.stop()

} def storedatainmongodb( productdf: dataframe, ratingdf: dataframe )(implicit mongoconfig: mongoconfig): unit =

}

電商系統 好用的電商系統 電商管理系統

好用的電商管理系統 首先對於日漸擴大的電商行業來說,每日訂單資料統計 訂單產品的分類 老客戶的維護 店鋪每日的實際收入 庫存情況 採購物品的資訊跟蹤都是需要我們花時間去統計和關注的,所以電商管理最主要的作用應該體現在 1.商品管理 2.庫存管理 3.採購管理 4.訂單管理 5.配送結算 6.財務管理...

電商推薦系統專案工作總結

1 資料集中是否存在缺失值,處理缺失值。處理資料集中缺失值的策略大概分為刪除,補齊和忽略三類。組刪除 將含有缺失值的屬性特徵刪除 電商推薦中一般不採取此方法,具體看業務場景 忽略 補齊處理只是將未知值補以我們的主觀估計值,不一定完全符合客觀事實,在對不完備資訊進行補齊處理的同時,我們或多或少地改變了...

電商系統 電商ERP後台管理系統

在b2b電商 搭建完成之後最重要的就是對 進行運營,其中 後台管理系統是建立在b2b電商 上的一種工具,那麼我們應該怎麼對這種工具性的產品進行運營呢?一 規範b2b電子 產品的 定位標準 首先就是要規範b2b 的產品 定位,一般產品的 都是以產品的成本以及一些附加值,品牌價值等因素來體現的,b2b ...