本markdown編輯器使用[stackedit][6]修改而來,用它寫部落格,將會帶來全新的體驗哦:
先參考 在本地把分詞程式跑起來。
本地分詞的目錄結構如下:
artifacts配置如下,記得勾選include in project build
modules 配置如下,所有的jar檔案都在hadoop的安裝包的share/hadoop/下面
-program arguments第一行就是剛才定義的jar包生成的位置第二行工程入口
/users/cinba/documents/idea/paodingfenci/out/artifacts/paodingfenci/paodingfenci.jar
org.znufe
.cnwc
.cnwordmain
input/
output/
jar包反編譯後的結構如下
這裡面沒有剛才工程下lib的jar包,也沒有modules中的任何類
這樣執行下面的指令就會成功執行啦
hadoop jar ./share/hadoop/mapreduce/paodingfenci.jar org.znufe
.cnwc
.cnwordmain input output
只是分詞出來的結果:
看起來也不是很有意義!需要做進一步處理。
歡迎使用CSDN markdow
本markdown編輯器使用stackedit修改而來,用它寫部落格,將會帶來全新的體驗哦 markdown 是一種輕量級標記語言,它允許人們使用易讀易寫的純文字格式編寫文件,然後轉換成格式豐富的html頁面。維基百科 使用簡單的符號標識不同的標題,將某些文字標記為粗體或者斜體,建立乙個鏈結等,詳細...
歡迎毛毛與妞妞使用CSDN markdown編輯器
建立乙個自定義列表 如何建立乙個註腳 注釋也是必不可少的 katex數學公式 新的甘特圖功能,豐富你的文章 uml 圖表 flowchart流程圖 匯出與匯入 你好!這是你第一次使用markdown編輯器所展示的歡迎頁。如果你想學習如何使用markdown編輯器,可以仔細閱讀這篇文章,了解一下mar...
歡迎使用CSDN markdow1n編輯器
本markdown編輯器使用stackedit修改而來,用它寫部落格,將會帶來全新的體驗哦 markdown 是一種輕量級標記語言,它允許人們使用易讀易寫的純文字格式編寫文件,然後轉換成格式豐富的html頁面。維基百科 使用簡單的符號標識不同的標題,將某些文字標記為粗體或者斜體,建立乙個鏈結等,詳細...