Scanner avec filtre en utilisant HBase shell

Question

Scanner avec filtre en utilisant HBase shell

Demandé el 31 de Août, 2011: Quand la question a-t-elle été
26507 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Quelqu'un sait-il comment numériser des enregistrements en fonction d'un filtre de numérisation, par exemple :

column:something = "somevalue"

Quelque chose comme ce mais à partir du shell HBase ?

Demandé el 31 de Août, 2011 par Gandalf StormCrow

Answer 1

5 Réponses

Answer 2

50voto

havanki4j Points 908

Essayez ceci. C'est plutôt moche, mais ça marche pour moi.

import org.apache.hadoop.hbase.filter.CompareFilter
import org.apache.hadoop.hbase.filter.SingleColumnValueFilter
import org.apache.hadoop.hbase.filter.SubstringComparator
import org.apache.hadoop.hbase.util.Bytes
scan 't1', { COLUMNS => 'family:qualifier', FILTER =>
    SingleColumnValueFilter.new
        (Bytes.toBytes('family'),
         Bytes.toBytes('qualifier'),
         CompareFilter::CompareOp.valueOf('EQUAL'),
         SubstringComparator.new('somevalue'))
}

Le shell HBase inclura ce que vous avez dans ~/.irbrc, donc vous pouvez y mettre quelque chose comme ceci (je ne suis pas un expert en Ruby, les améliorations sont les bienvenues) :

# imports like above
def scan_substr(table,family,qualifier,substr,*cols)
    scan table, { COLUMNS => cols, FILTER =>
        SingleColumnValueFilter.new
            (Bytes.toBytes(family), Bytes.toBytes(qualifier),
             CompareFilter::CompareOp.valueOf('EQUAL'),
             SubstringComparator.new(substr)) }
end

et ensuite vous pouvez juste dire dans le shell :

scan_substr 't1', 'family', 'qualifier', 'somevalue', 'family:qualifier'

Répondu el 16 de Septembre, 2011 par havanki4j (908 Points )

0 votes

C'est en effet super moche. Merci cependant, je n'ai pas pu trouver d'exemples de cela dans le livre HBase docs/book/oreilly.

Commenté el 18 de Septembre, 2012 par mumrah

0 votes

Bonjour, j'ai vu que vous avez mentionné ruby et je n'avais aucune idée de ce qui se passait, puis j'ai cherché et j'ai trouvé que HBase accepte certains ruby scripts ? Est-ce le cas ?

Commenté el 26 de Août, 2021 par Matt

Answer 3

29voto

dape Points 327

scan 'test', {COLUMNS => ['F'],FILTER => \ 
"(SingleColumnValueFilter('F','u',=,'regexstring:http:.*pdf',true,true)) AND \
(SingleColumnValueFilter('F','s',=,'binary:2',true,true))"}

Vous trouverez de plus amples informations here . Notez que plusieurs exemples se trouvent dans le fichier joint Filter Language.docx fichier.

Répondu el 28 de Juin, 2012 par dape (327 Points )

0 votes

Je pense que ce langage de filtrage ne fonctionne que dans les dernières versions de Hbase - dans la version 0.90.6 (cdh 3u6), je n'ai pas réussi à faire fonctionner la moindre variation de ce langage.

Commenté el 8 de Août, 2013 par Mikeb

0 votes

Je pense qu'il est très utile de regarder la javadoc ; voici la javadoc de la 0.94 : hbase.apache.org/0.94/apidocs/org/apache/hadoop/hbase/filter/

Commenté el 10 de Janvier, 2015 par mooreds

Answer 4

8voto

Tony Points 702

Utilisez le paramètre FILTER de scan comme indiqué dans l'aide à l'utilisation :

hbase(main):002:0> scan

ERROR: wrong number of arguments (0 for 1)

Here is some help for this command:
Scan a table; pass table name and optionally a dictionary of scanner
specifications.  Scanner specifications may include one or more of:
TIMERANGE, FILTER, LIMIT, STARTROW, STOPROW, TIMESTAMP, MAXLENGTH,
or COLUMNS. If no columns are specified, all columns will be scanned.
To scan all members of a column family, leave the qualifier empty as in
'col_family:'.

Some examples:

  hbase> scan '.META.'
  hbase> scan '.META.', {COLUMNS => 'info:regioninfo'}
  hbase> scan 't1', {COLUMNS => ['c1', 'c2'], LIMIT => 10, STARTROW => 'xyz'}
  hbase> scan 't1', {FILTER => org.apache.hadoop.hbase.filter.ColumnPaginationFilter.new(1, 0)}
  hbase> scan 't1', {COLUMNS => 'c1', TIMERANGE => [1303668804, 1303668904]}

For experts, there is an additional option -- CACHE_BLOCKS -- which
switches block caching for the scanner on (true) or off (false).  By
default it is enabled.  Examples:

  hbase> scan 't1', {COLUMNS => ['c1', 'c2'], CACHE_BLOCKS => false}

Répondu el 31 de Août, 2011 par Tony (702 Points )

Answer 5

5voto

KannarKK Points 191

Scan scan = new Scan();
FilterList list = new FilterList(FilterList.Operator.MUST_PASS_ALL);

//in case you have multiple SingleColumnValueFilters, 
you would want the row to pass MUST_PASS_ALL conditions
or MUST_PASS_ONE condition.

SingleColumnValueFilter filter_by_name = new SingleColumnValueFilter( 
                   Bytes.toBytes("SOME COLUMN FAMILY" ),
                   Bytes.toBytes("SOME COLUMN NAME"),
                   CompareOp.EQUAL,
                   Bytes.toBytes("SOME VALUE"));

filter_by_name.setFilterIfMissing(true);  
//if you don't want the rows that have the column missing.
Remember that adding the column filter doesn't mean that the 
rows that don't have the column will not be put into the 
result set. They will be, if you don't include this statement. 

list.addFilter(filter_by_name);

scan.setFilter(list);

Répondu el 18 de Février, 2014 par KannarKK (191 Points )

2 votes

Ce code est en Java, la question porte sur le shell HBase.

Commenté el 8 de Avril, 2017 par Tony

Answer 6

5voto

Chetan Somani Points 76

L'un des filtres est Valuefilter qui peut être utilisé pour filtrer toutes les valeurs des colonnes.

hbase(main):067:0> scan 'dummytable', {FILTER => "ValueFilter(=,'binary:2016-01-26')"}

binaire est l'un des comparateurs utilisés dans le filtre. Vous pouvez utiliser différents comparateurs dans le filtre en fonction de ce que vous voulez faire.

Vous pouvez vous référer à l'url suivante : http:// www.hadooptpoint.com/filters-in-hbase-shell/. Il fournit de bons exemples sur la façon d'utiliser les différents filtres dans HBase Shell.

Répondu el 12 de Février, 2016 par Chetan Somani (76 Points )

0 votes

Les réponses qui ne sont que des liens ne sont pas de bonnes questions. Postez un code et expliquez-le pour aider.

Commenté el 12 de Février, 2016 par KittMedia

0 votes

Le lien ne fonctionne plus. Vous amène à un site de spam

Commenté el 14 de Octobre, 2019 par Oeyvind

Scanner avec filtre en utilisant HBase shell

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Scanner avec filtre en utilisant HBase shell

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: