J'ai une image sur laquelle j'effectue une reconnaissance optique de caractères en utilisant l'API Google Vision. J'obtiens un résultat qui contient les sommets des polygones de chaque mot. Après avoir dessiné les polygones, l'image ressemble à ceci Je veux maintenant combiner les boîtes qui sont alignées horizontalement. Par exemple : (ARTICLES DE VENTE), (S000828749 Short MB 12.00),...,(Sous-total 146.00)
Les choses que j'ai essayées : J'ai fait une ligne à partir du point médian des bords verticaux et je l'ai prolongée jusqu'au bord de l'image et j'ai compté combien de polygones la ligne touche et j'ai codé le polygone avec la même couleur que la ligne. J'ai obtenu une image comme celle-ci
Je ne sais pas comment procéder pour obtenir les groupes sur une seule ligne