vectorindexer解決向量資料集中的類別特徵索引。它可以自動識別哪些特徵是類別型的,並且將原始值轉換為類別索引。它的處理流程如下:
1.獲得乙個向量型別的輸入以及maxcategories引數。
2.基於不同特徵值的數量來識別哪些特徵需要被類別化,其中最多maxcategories個特徵需要被類別化。
3.對於每乙個類別特徵計算0-based(從0開始)類別索引。
4.對類別特徵進行索引然後將原始特徵值轉換為索引。
索引後的類別特徵可以幫助決策樹等演算法恰當的處理類別型特徵,並得到較好結果。
在下面的例子中,我們讀入乙個資料集,然後使用vectorindexer來決定哪些特徵需要被作為類別特徵,將類別特徵轉換為他們的索引。
package org.apache.spark.examples.ml
import org.apache.spark.ml.feature.vectorindexer
import org.apache.spark.sql.sparksession
object vectorindexerexample " +
s"categorical features: $")
// create new column "indexed" with categorical values transformed to indices
val indexeddata = indexermodel.transform(data)
indexeddata.show()
spark.stop()
}}
變換 向量和矩陣
主要使用了 示例程式繪製了乙個在螢幕中間旋轉的線框花托。modelviewprojection.cpp opengl superbible demonstrates opengl the modelviewprojection matrix program by richard s.wright j...
點的變換和法向量的變換
在三維空間裡,點的變換是通過仿射變換的,所以使用齊次座標的變換矩陣來變換。不過,當乙個點作矩陣m變換時,這個點的法向量是否也可以使用矩陣m來變換呢?答案是不行,只是在特殊的情況是可以,比如沒有變形的變換。如果有變形的變換,就需要使用特殊矩陣 m矩陣的逆的轉置矩陣。之前看過一些文章,說道mesh頂點的...
向量 矩陣 變換的理解
1.3d繪圖的核心是向量運算 矩陣變換 三角函式 2.矩陣主要是用來描述兩個座標系的關係,通過定義一種運算來將乙個座標系中的向量轉換到另乙個座標系中 3.大多數3d圖形不是真正3d的,我們使用3d的概念和術語來描述物體,然後這些3d資料被 壓扁 在2d的計算機螢幕上。這種將3d資料壓扁成2d資料的處...