HBase表百萬資料插入

2021-09-06 17:44:20 字數 860 閱讀 1104

寫前日誌個人理解是一種安全回滾機制,若機器在執行操作過程中機器宕機需要回滾的話,需要讀取寫前編輯日誌進行資料回滾,防止資料的丟失,此處關閉的話為了提公升效率,看業務場景,不是很重要的話可以選擇關閉來提高插入效率。

put物件呼叫setwritetowal(false);

緩衝區入開啟,緩衝區存在資料,資料就會進行自動的提交,每次提交的資料量很小,互動頻繁也會影響插入效率,所以關閉緩衝區自動提交,手動進行提交也是一種優化手段,至於多久提交個人覺得需要看你機器記憶體效能來考慮。

htable物件呼叫setautoflush(false);

import org.apache.hadoop.conf.configuration;

import org.apache.hadoop.hbase.hbaseconfiguration;

import org.apache.hadoop.hbase.tablename;

import org.apache.hadoop.hbase.client.*;

import org.apache.hadoop.hbase.util.bytes;

/** * @author 王磊

* @date 2019/1/3

* @classname biginsert

* @description hbase百萬資料插入測試

**/public

class

biginsert

}// 提交剩餘資料【如最後若不滿1000次未提交的資料】

htb.

flushcommits()

;}}

HBase插入資料程式設計

0 概述 1 資料通過put物件進行傳送,每put一次傳送一次,傳送時以mutator形式,2 每次傳送都將物件封裝成linkedlist,再進行一次flush,即一次rpc通訊 1 每次put一條資料 public void putdata1 throws exception 關閉資源 table...

併發插入資料百萬條

1 新聞併發入庫資料 apioperation value 測試新增新聞動態 public void testcreate integer start,integer count 測試大批量新增新聞動態介面 param count param start void testto161 integer...

MYSQL 插入百萬測試資料

1.建表 drop table if exists test user create table test user id int auto increment,name varchar 50 gender tinyint,addr varchar 100 primary key id engine...