Inserir e recuperar dados no HBase: get (), put (), scan () Exemplos

Neste tutorial, você aprenderá:

Gravar dados na tabela HBase: Shell

O comando put é usado para armazenar dados em uma tabela

Syntax: put ,,,

Este comando é usado para as seguintes coisas

  • Ele colocará um 'valor' de célula em uma tabela, linha ou coluna definida ou especificada.
  • Ele irá, opcionalmente, coordenar o registro de data e hora.

Exemplo:

  • Aqui, colocamos valores na tabela 'on2vhf' na linha r1 e coluna c1
    hbase> put 'on2vhf', 'r1', 'c1', 'value', 10
  • Colocamos três valores, 10,15 e 30 na tabela 'on2vhf', conforme mostrado na imagem abaixo

  • Suponha que a tabela 'Guru99' tenha alguma referência de tabela como, digamos, g. Também podemos executar o comando na referência de tabela também como

    hbase> g.put 'on2vhf', 'r1', 'c1', 'value', 10
  • A saída será como mostrado na imagem acima após colocar os valores em 'on2vhf'.

Leia os dados da tabela HBase: Shell

Nesta seção, verificaremos o seguinte

  • Valores que são inseridos na tabela HBase 'on2vhf'
  • Nomes de colunas com valores presentes na Tabela HBase on2vhf

A partir da captura de tela acima, podemos inferir

  • Se executarmos o comando 'scan' no shell do HBase, ele exibirá os valores inseridos em 'on2vhf' como segue
  • No shell do HBase, ele exibirá valores inseridos por nosso código com nomes de coluna e linha
  • Aqui podemos ver que os nomes das colunas inseridas são 'educação' e 'projetos'
  • Os valores inseridos são 'BigData' e 'HBase Tutorials' nas colunas mencionadas

Você também pode usar o comando Get para ler dados de uma tabela

Syntax: get , , {}

Aqui incluem TIMERANGE, TIMESTAMP, VERSIONS e FILTERS.

Usando este comando, você obterá o conteúdo de uma linha ou célula presente na tabela. Além disso, você também pode adicionar parâmetros adicionais a ele, como TIMESTAMP, TIMERANGE, VERSIONS, FILTERS, etc. para obter uma linha ou conteúdo de célula específico.

Exemplos:-

hbase> get 'on2vhf', 'r1', {COLUMN => 'c1'}

Para a tabela 'on2vhf', os valores da linha r1 e da coluna c1 serão exibidos usando este comando, conforme mostrado na captura de tela acima

hbase> get 'on2vhf', 'r1'

Para a tabela 'on2vhf', os valores da linha r1 serão exibidos usando este comando

hbase> get 'on2vhf', 'r1', {TIMERANGE => [ts1, ts2]}

Para a tabela 'on2vhf', os valores da linha 1 no intervalo de tempo ts1 e ts2 serão exibidos usando este comando

hbase> get 'on2vhf', 'r1', {COLUMN => ['c1', 'c2', 'c3']}

Para a tabela 'on2vhf' linha r1 e famílias de coluna 'c1, c2, c3 os valores serão exibidos usando este comando

Gravar dados na tabela HBase: API JAVA

Nesta etapa, vamos gravar dados na tabela HBase 'on2vhf'

Primeiro, temos que escrever o código para inserir e recuperar valores do HBase usando Programa HBaseLoading.java.

Para criar e inserir valores em uma tabela no nível da coluna, você deve codificar como abaixo .

Da captura de tela acima

  1. Quando criamos a configuração do HBase, ela aponta para quaisquer configurações que definimos nos arquivos base-site.xml e hbase-default.xml durante as instalações do HBase
  2. Criação da tabela 'on2vhf' usando o método HTable
  3. Adicionando row1 à tabela 'on2vhf'
  4. Especificando os nomes das colunas 'educação' e 'projetos' e inserindo valores nos nomes das colunas na respectiva linha1. Os valores inseridos aqui são 'BigData' e 'HBaseTutorials'.

Ler dados da tabela HBase: API Java

Quaisquer que sejam os valores que colocamos nas tabelas do HBase na seção acima, aqui vamos buscar e exibir esses valores.

Para recuperar resultados armazenados em 'on2vhf'

A captura de tela acima mostra que os dados estão sendo lidos da tabela HBase 'on2vhf'

  1. Nisto, vamos buscar os valores que são armazenados em famílias de colunas, ou seja, 'educação' e 'projetos'
  2. Usando o comando 'get', vamos buscar os valores armazenados na tabela HBase
  3. Resultados da verificação usando o comando 'scan'. Os valores armazenados na linha 1 serão exibidos no console.

Depois de escrever o código, você deve executar o aplicativo java como este

  • Clique com o botão direito em HBaseLoading.java -> Correr como -> Aplicativo Java
  • Depois de executar 'HBaseLoading .java' os valores serão inseridos em 'on2vhf' em cada coluna no HBase e no mesmo programa ele também pode recuperar valores.

Aqui está o código completo

import java.io.IOException; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.client.Get; import org.apache.hadoop.hbase.client.HTable; import org.apache.hadoop.hbase.client.Put; import org.apache.hadoop.hbase.client.Result; import org.apache.hadoop.hbase.client.ResultScanner; import org.apache.hadoop.hbase.client.Scan; import org.apache.hadoop.hbase.util.Bytes; public class HBaseLoading { public static void main(String[] args) throws IOException { /* When you create a HBaseConfiguration, it reads in whatever you've set into your hbase-site.xml and in hbase-default.xml, as long as these can be found on the CLASSPATH*/ org.apache.hadoop.conf.Configuration config = HBaseConfiguration.create(); /*This instantiates an HTable object that connects you to the 'test' table*/ HTable table = new HTable(config, 'on2vhf'); /* To add to a row, use Put. A Put constructor takes the name of the row you want to insert into as a byte array.*/ Put p = new Put(Bytes.toBytes('row1')); /*To set the value you'd like to update in the row 'row1', specify the column family, column qualifier, and value of the table cell you'd like to update. The column family must already exist in your table schema. The qualifier can be anything.*/ p.add(Bytes.toBytes('education'), Bytes.toBytes('col1'),Bytes.toBytes('BigData')); p.add(Bytes.toBytes('projects'),Bytes.toBytes('col2'),Bytes.toBytes('HBaseTutorials')); // Once you've adorned your Put instance with all the updates you want to make, to commit it do the following table.put(p); // Now, to retrieve the data we just wrote. Get g = new Get(Bytes.toBytes('row1')); Result r = table.get(g); byte [] value = r.getValue(Bytes.toBytes('education'),Bytes.toBytes('col1')); byte [] value1 = r.getValue(Bytes.toBytes('projects'),Bytes.toBytes('col2')); String valueStr = Bytes.toString(value); String valueStr1 = Bytes.toString(value1); System.out.println('GET: ' +'education: '+ valueStr+'projects: '+valueStr1); Scan s = new Scan(); s.addColumn(Bytes.toBytes('education'), Bytes.toBytes('col1')); s.addColumn(Bytes.toBytes('projects'), Bytes.toBytes('col2')); ResultScanner scanner = table.getScanner(s); try { for (Result rr = scanner.next(); rr != null; rr = scanner.next()) { System.out.println('Found row : ' + rr); } } finally { // Make sure you close your scanners when you are done! scanner.close(); } } } 

Resumo:

Conforme discutimos neste tutorial, você pode usar o comando put para inserir dados em uma tabela. Você pode usar o comando scan, get para ler dados de uma tabela