Comment analyser le fichier AndroidManifest.xml dans un paquet .apk ?

Ce fichier semble être dans un format XML binaire. Quel est ce format et comment peut-il être analysé par programme (par opposition à l'utilisation de l'outil aapt dump du SDK) ?

Ce format binaire n'est pas abordé dans la documentation. aquí .

Nota : Je veux accéder à ces informations depuis l'extérieur de l'environnement Android, de préférence depuis Java.

Quel est le cas d'utilisation spécifique que vous recherchez ? Une grande partie des informations du manifeste de votre propre application peut être interrogée à l'aide de la fonction android.content.pm.PackageManager.queryXX méthodes (docs : developer.Android.com/reference/Android/content/pm/ ).

Je ne suis pas dans un environnement Android. Je veux lire un fichier .apk, extraire le fichier AndroidManifest.xml et l'analyser au format XML.

J'ai développé un extracteur d'APK qui ne dépend pas d'AAPT. Il comprend un analyseur syntaxique qui peut analyser n'importe quel contenu XML binaire Android. code.google.com/p/apk-extractor


Macarse Points 36519

Utiliser Android-apktool

Il existe une application qui lit les fichiers apk et décode les XML en une forme presque originale.

Utilisation :

apktool d Gmail.apk && cat Gmail/AndroidManifest.xml

Consulte Android-apktool pour plus d'informations

Un extrait pour montrer ses prouesses pourrait être utile : apktool d Gmail.apk && cat Gmail/AndroidManifest.xml

minSdkVersion et d'autres paramètres de version peuvent également être trouvés dans Gmail/apktool.yml

Comment cela peut-il être utilisé dans une application Android exactement ? Peut-on l'utiliser pour obtenir des données de manifeste à partir d'InputStream (exemple : le fichier APK existe dans un fichier zip) ?


Ribo Points 1014

Cette méthode Java, qui s'exécute sur un Android, documente (ce que j'ai pu interpréter sur) le format binaire du fichier AndroidManifest.xml dans le paquet .apk. La deuxième boîte de code montre comment appeler decompressXML et comment charger le byte[] du fichier du paquetage .apk sur l'appareil. (Il y a des champs dont je ne comprends pas le but, si vous savez ce qu'ils signifient, dites-le moi, je mettrai à jour l'info).

// decompressXML -- Parse the 'compressed' binary form of Android XML docs 
// such as for AndroidManifest.xml in .apk files
public static int endDocTag = 0x00100101;
public static int startTag =  0x00100102;
public static int endTag =    0x00100103;
public void decompressXML(byte[] xml) {
// Compressed XML file/bytes starts with 24x bytes of data,
// 9 32 bit words in little endian order (LSB first):
//   0th word is 03 00 08 00
//   3rd word SEEMS TO BE:  Offset at then of StringTable
//   4th word is: Number of strings in string table
// WARNING: Sometime I indiscriminently display or refer to word in 
//   little endian storage format, or in integer format (ie MSB first).
int numbStrings = LEW(xml, 4*4);

// StringIndexTable starts at offset 24x, an array of 32 bit LE offsets
// of the length/string data in the StringTable.
int sitOff = 0x24;  // Offset of start of StringIndexTable

// StringTable, each string is represented with a 16 bit little endian 
// character count, followed by that number of 16 bit (LE) (Unicode) chars.
int stOff = sitOff + numbStrings*4;  // StringTable follows StrIndexTable

// XMLTags, The XML tag tree starts after some unknown content after the
// StringTable.  There is some unknown data after the StringTable, scan
// forward from this point to the flag for the start of an XML start tag.
int xmlTagOff = LEW(xml, 3*4);  // Start from the offset in the 3rd word.
// Scan forward until we find the bytes: 0x02011000(x00100102 in normal int)
for (int ii=xmlTagOff; ii<xml.length-4; ii+=4) {
  if (LEW(xml, ii) == startTag) { 
    xmlTagOff = ii;  break;
} // end of hack, scanning for start of first start tag

// XML tags and attributes:
// Every XML start and end tag consists of 6 32 bit words:
//   0th word: 02011000 for startTag and 03011000 for endTag 
//   1st word: a flag?, like 38000000
//   2nd word: Line of where this tag appeared in the original source file
//   3rd word: FFFFFFFF ??
//   4th word: StringIndex of NameSpace name, or FFFFFFFF for default NS
//   5th word: StringIndex of Element Name
//   (Note: 01011000 in 0th word means end of XML document, endDocTag)

// Start tags (not end tags) contain 3 more words:
//   6th word: 14001400 meaning?? 
//   7th word: Number of Attributes that follow this tag(follow word 8th)
//   8th word: 00000000 meaning??

// Attributes consist of 5 words: 
//   0th word: StringIndex of Attribute Name's Namespace, or FFFFFFFF
//   1st word: StringIndex of Attribute Name
//   2nd word: StringIndex of Attribute Value, or FFFFFFF if ResourceId used
//   3rd word: Flags?
//   4th word: str ind of attr value again, or ResourceId of value

// TMP, dump string table to tr for debugging
//tr.addSelect("strings", null);
//for (int ii=0; ii<numbStrings; ii++) {
//  // Length of string starts at StringTable plus offset in StrIndTable
//  String str = compXmlString(xml, sitOff, stOff, ii);
//  tr.add(String.valueOf(ii), str);

// Step through the XML tree element tags and attributes
int off = xmlTagOff;
int indent = 0;
int startTagLineNo = -2;
while (off < xml.length) {
  int tag0 = LEW(xml, off);
  //int tag1 = LEW(xml, off+1*4);
  int lineNo = LEW(xml, off+2*4);
  //int tag3 = LEW(xml, off+3*4);
  int nameNsSi = LEW(xml, off+4*4);
  int nameSi = LEW(xml, off+5*4);

  if (tag0 == startTag) { // XML START TAG
    int tag6 = LEW(xml, off+6*4);  // Expected to be 14001400
    int numbAttrs = LEW(xml, off+7*4);  // Number of Attributes to follow
    //int tag8 = LEW(xml, off+8*4);  // Expected to be 00000000
    off += 9*4;  // Skip over 6+3 words of startTag data
    String name = compXmlString(xml, sitOff, stOff, nameSi);
    //tr.addSelect(name, null);
    startTagLineNo = lineNo;

    // Look for the Attributes
    StringBuffer sb = new StringBuffer();
    for (int ii=0; ii<numbAttrs; ii++) {
      int attrNameNsSi = LEW(xml, off);  // AttrName Namespace Str Ind, or FFFFFFFF
      int attrNameSi = LEW(xml, off+1*4);  // AttrName String Index
      int attrValueSi = LEW(xml, off+2*4); // AttrValue Str Ind, or FFFFFFFF
      int attrFlags = LEW(xml, off+3*4);  
      int attrResId = LEW(xml, off+4*4);  // AttrValue ResourceId or dup AttrValue StrInd
      off += 5*4;  // Skip over the 5 words of an attribute

      String attrName = compXmlString(xml, sitOff, stOff, attrNameSi);
      String attrValue = attrValueSi!=-1
        ? compXmlString(xml, sitOff, stOff, attrValueSi)
        : "resourceID 0x"+Integer.toHexString(attrResId);
      sb.append(" "+attrName+"=\""+attrValue+"\"");
      //tr.add(attrName, attrValue);
    prtIndent(indent, "<"+name+sb+">");

  } else if (tag0 == endTag) { // XML END TAG
    off += 6*4;  // Skip over 6 words of endTag data
    String name = compXmlString(xml, sitOff, stOff, nameSi);
    prtIndent(indent, "</"+name+">  (line "+startTagLineNo+"-"+lineNo+")");
    //tr.parent();  // Step back up the NobTree

  } else if (tag0 == endDocTag) {  // END OF XML DOC TAG

  } else {
    prt("  Unrecognized tag code '"+Integer.toHexString(tag0)
      +"' at offset "+off);
} // end of while loop scanning tags and attributes of XML tree
prt("    end at offset "+off);
} // end of decompressXML

public String compXmlString(byte[] xml, int sitOff, int stOff, int strInd) {
  if (strInd < 0) return null;
  int strOff = stOff + LEW(xml, sitOff+strInd*4);
  return compXmlStringAt(xml, strOff);

public static String spaces = "                                             ";
public void prtIndent(int indent, String str) {
  prt(spaces.substring(0, Math.min(indent*2, spaces.length()))+str);

// compXmlStringAt -- Return the string stored in StringTable format at
// offset strOff.  This offset points to the 16 bit string length, which 
// is followed by that number of 16 bit (Unicode) chars.
public String compXmlStringAt(byte[] arr, int strOff) {
  int strLen = arr[strOff+1]<<8&0xff00 | arr[strOff]&0xff;
  byte[] chars = new byte[strLen];
  for (int ii=0; ii<strLen; ii++) {
    chars[ii] = arr[strOff+2+ii*2];
  return new String(chars);  // Hack, just use 8 byte chars
} // end of compXmlStringAt

// LEW -- Return value of a Little Endian 32 bit word from the byte array
//   at offset off.
public int LEW(byte[] arr, int off) {
  return arr[off+3]<<24&0xff000000 | arr[off+2]<<16&0xff0000
    | arr[off+1]<<8&0xff00 | arr[off]&0xFF;
} // end of LEW

Cette méthode lit l'AndroidManifest dans un byte[] pour le traitement :

public void getIntents(String path) {
  try {
    JarFile jf = new JarFile(path);
    InputStream is = jf.getInputStream(jf.getEntry("AndroidManifest.xml"));
    byte[] xml = new byte[is.available()];
    int br = is.read(xml);
    //Tree tr = TrunkFactory.newTree();
  } catch (Exception ex) {
    console.log("getIntents, ex: "+ex);  ex.printStackTrace();
} // end of getIntents

La plupart des applications sont stockées dans /system/app qui est lisible sans Root mon Evo, d'autres applications sont dans /data/app que j'ai eu besoin de Root pour voir. L'argument 'path' ci-dessus serait quelque chose comme : "/system/app/Weather.apk"

Quelques-unes des constantes de ressource d'attribut sont définies dans une énumération dans frameworks/base/tools/aapt/Command.cpp de la source Android. Cet enum semble croître entre les versions, donc une version plus récente contiendrait plus de définitions.

+1 pour un outil qui peut être utilisé en dehors d'Android. Je l'ai emballé comme un outil Java en ligne de commande ; voir pastebin.com/c53DuqMt .

Bonjour Ribo, J'utilise le code ci-dessus pour lire le fichier xml. Maintenant, ce que je souhaite faire, c'est que dans mon fichier xml, j'ai un nom d'attribut dont la valeur est spécifiée par "@string/abc" et je veux le coder en dur en une chaîne de caractères, c'est-à-dire supprimer la référence à la chaîne de caractères, mais le problème est que j'obtiens la valeur de attrValueSi comme -1. J'ajoute les clés dans une carte et j'ai l'entrée de la clé dans la carte, je veux mettre la valeur dans attrValueSi. Comment dois-je procéder ? Merci de m'aider.


Paolo Rovelli Points 892

Et si vous utilisiez le Outil de conditionnement des ressources Android (aapt), à partir du SDK Android, dans un script Python (ou autre) ?

Par le biais de l'aapt ( http://elinux.org/Android_aapt ), en effet, vous pouvez récupérer des informations sur les .apk et sur son AndroidManifest.xml fichier. En particulier, vous pouvez extraire les valeurs des éléments individuels d'un fichier .apk par l'intermédiaire du 'dump'. sous-commande. Par exemple, vous pouvez extraire le autorisations d'utilisation en el AndroidManifest.xml dans un fichier .apk de cette manière :

$ aapt dump permissions package.apk

package.apk est votre .apk paquet.

De plus, vous pouvez utiliser la commande Unix pipe pour effacer la sortie. Par exemple :

$ aapt dump permissions package.apk | sed 1d | awk '{ print $NF }'

Voici un script Python qui fait cela de manière programmatique :

import os
import subprocess

#Current directory and file name:
curpath = os.path.dirname( os.path.realpath(__file__) )
filepath = os.path.join(curpath, "package.apk")

#Extract the AndroidManifest.xml permissions:
command = "aapt dump permissions " + filepath + " | sed 1d | awk '{ print $NF }'"
process = subprocess.Popen(command, stdout=subprocess.PIPE, stderr=None, shell=True)
permissions = process.communicate()[0]

print permissions

De la même manière, vous pouvez extraire d'autres informations (par ex. paquet , nom de l'application , etc...) de la AndroidManifest.xml :

#Extract the APK package info:
shellcommand = "aapt dump badging " + filepath
process = subprocess.Popen(shellcommand, stdout=subprocess.PIPE, stderr=None, shell=True)
apkInfo = process.communicate()[0].splitlines()

for info in apkInfo:
    #Package info:
    if string.find(info, "package:", 0) != -1:
        print "App Package: " + findBetween(info, "name='", "'")
        print "App Version: " + findBetween(info, "versionName='", "'")

    #App name:
    if string.find(info, "application:", 0) != -1:
        print "App Name: " + findBetween(info, "label='", "'")

def findBetween(s, prefix, suffix):
        start = s.index(prefix) + len(prefix)
        end = s.index(suffix, start)
        return s[start:end]
    except ValueError:
        return ""

Si vous souhaitez plutôt analyser l'intégralité de l'arbre XML AndroidManifest, vous pouvez le faire de la même manière en utilisant la commande xmltree commandement :

aapt dump xmltree package.apk AndroidManifest.xml

Utilisation de Python comme avant :

#Extract the AndroidManifest XML tree:
shellcommand = "aapt dump xmltree " + filepath + " AndroidManifest.xml"
process = subprocess.Popen(shellcommand, stdout=subprocess.PIPE, stderr=None, shell=True)
xmlTree = process.communicate()[0]

print "Number of Activities: " + str(xmlTree.count("activity"))
print "Number of Services: " + str(xmlTree.count("service"))
print "Number of BroadcastReceivers: " + str(xmlTree.count("receiver"))

Cet outil existe-t-il toujours sur les Roms Android ? Est-ce que c'est quelque chose qui est toujours intégré ?

Bien mieux si vous voulez mon avis :) J'ai des problèmes avec apktool et AXMLPrinter2 : parfois ils lèvent des exceptions, etc. aapt fonctionne à chaque fois et est plus polyvalent. Sans compter que c'est le officiel outil.


Shonzilla Points 5277

Vous pouvez utiliser axml2xml.pl développé il y a quelque temps au sein de Android-random projet. Il générera le fichier manifeste textuel (AndroidManifest.xml) à partir du fichier binaire.

Je dis " textuel " et non " original "car comme beaucoup d'outils de rétro-ingénierie, celui-ci n'est pas parfait et le résultat ne sera pas être complet . Je suppose que soit il n'a jamais été complet, soit il n'est tout simplement pas compatible avec le futur (avec un nouveau schéma d'encodage binaire). Quelle qu'en soit la raison, axml2xml.pl ne sera pas en mesure d'extraire correctement toutes les valeurs des attributs. Ces attributs sont minSdkVersion, targetSdkVersion et essentiellement tous les attributs qui font référence aux ressources (comme les chaînes, les icônes, etc.), c'est-à-dire que seuls les noms de classe (des activités, des services, etc.) sont extraits correctement.

Cependant, vous pouvez toujours trouver ces informations manquantes en exécutant aapt sur le fichier original de l'application Android ( .apk ) :

aapt l -a <someapp.apk>

Merci @Shonzilla. J'ai besoin d'informations sur le nom du paquet et le code de version, l'aapt fait le travail. Comme je travaille avec LAMP, je lance la commande aapt en PHP et traite la sortie avec PHP.

Une solution Java/Kotlin qui pourrait fonctionner pour Android ?


Kerem Kusmezer Points 189

Vérifiez ce qui suit Projet WPF qui décode correctement les propriétés.

+1 pour cela, Merci ! !! Pour les développeurs C#, je recommande définitivement ceci. Il m'a fait gagner beaucoup de temps =) Il m'a retenu pendant un certain temps parce que je devais exécuter "aapt" pour récupérer le numéro de version et le nom du paquet (ce qui n'est pas possible étant donné que mon scénario est dans un environnement web et que l'utilisateur a besoin d'un retour après avoir récupéré le nom du paquet et le numéro de version).

Vous pouvez en fait facilement supprimer la dépendance PresentationCore, qui n'est utilisée que pour sa classe Color. Vous pouvez soit créer votre propre classe, soit utiliser System.Drawing.

Existe-t-il une solution similaire, mais qui fonctionne dans l'application Android ?


