J'ai suivi le guide de Tensorflow pour sauvegarder mes données de chaîne en utilisant :
def _create_string_feature(values):
return tf.train.Feature(bytes_list=tf.train.BytesList(value=[values.encode('utf-8')]))
J'ai aussi utilisé ["tf.string", "FixedLenFeature"]
comme type original de ma caractéristique, et "tf.string"
comme mon type de conversion de caractéristiques.
Cependant, lors de ma formation, lorsque j'exécute ma session et que je crée des itérateurs, ma caractéristique de chaîne pour une taille de lot de 2 (par exemple : ['food fruit', 'cupcake food' ]) serait comme ci-dessous. Le problème est que cette liste est de taille 1, et non 2 (batch_size=2), pourquoi les instances d'un même lot restent-elles ensemble au lieu d'être divisées ?
[b'food fruit' b'cupcake food']
Pour mes autres caractéristiques qui sont des int ou des float, ce sont des tableaux bosselés de forme (batch_size, feature_len) qui sont bien mais je ne sais pas pourquoi les caractéristiques de type string ne sont pas séparées dans un seul lot ?
Toute aide serait appréciée.