docx -> markdown
En ce qui concerne spécifiquement la question ( docx --> markdown
), utilisez le Writeage pour Microsoft Word. Il fonctionne également dans l'autre sens markdown --> docx
.
Plus d'options
- Utilisez un outil de conversion pour la conversion de plusieurs fichiers.
- Utilisez un éditeur WYSIWYG pour les fichiers uniques et les polices supérieures.
Quels outils de conversion ?
J'ai testé ces trois-là : (1) Pandoc (2) Mammoth (3) w2m
Pandoc
C'est de loin l'outil le plus performant pour les conversions, avec la prise en charge d'une multitude de types de fichiers (voir le site de Pandoc). man page
pour les types de fichiers pris en charge) :
pandoc -f docx -t gfm somedoc.docx -o somedoc.md
NB
-
Pour obtenir pandoc
d'exporter tableaux de démarque ('pipe_tables' dans pandoc) use multimarkdown
o gfm
formats de sortie.
-
Si le formatage en PDF, pandoc
utilise LaTeX
pour cela, vous devrez peut-être installer les modèles de LaTeX
pour votre système d'exploitation si cette commande ne fonctionne pas. Instructions à Installation de LaTeX
Quels éditeurs WYSIWYG ?
Pour docx
utiliser Writeage .
Maintenir des polices de qualité supérieure
Si vous souhaitez préserver caractères unicodes , emojis et maintenir des polices de qualité supérieure, vous obtiendrez un certain rendement des éditeurs ci-dessous en utilisant copier-coller les opérations entre les formats de fichiers. Notez que ceux-ci ne lisent ou n'écrivent pas nativement dans les formats suivants docx
.
Équivalent programmatique
Pour un équivalent programmatique, vous pourriez obtenir certains résultats en appelant une autre version de pdf-engine et leurs options respectives, mais je ne l'ai pas testé. Le pandoc utilise par défaut 'pdflatex'.
pandoc --pdf-engine=
pandoc --pdf-engine-opt=STRING
Mise à jour : A4 vs US Letter
Pour l'extérieur des États-Unis, réglez le géométrie variable :
pandoc -s -V geometry:a4paper -o outfile.pdf infile.md
Note de bas de page
Il convient de mentionner ici que ce qui n'est pas évident lorsqu'on découvre le format Markdown est que MultiMarkdown est de loin le format markdown le plus riche en fonctionnalités.
MultiMarkdown prend en charge, entre autres, les métadonnées, les tables des matières, les notes de bas de page, les mathématiques, les tableaux et YAML.
Mais le format par défaut de Github utilise gfm
qui prend également en charge les tableaux. J'utilise gfm
pour Github/GitLab et MultiMarkdown
pour tout le reste.