93 votes

Comment convertir des fichiers doc/docx en markdown ou en texte structuré ?

Existe-t-il un programme ou un flux de travail pour convertir .doc o .docx vers Markdown ou un texte similaire ?

PS : Idéalement, j'apprécierais de pouvoir choisir une police spécifique (par exemple consolas ) dans le document MS Word sera rendu en format text-code: ```....``` .

4voto

Tobias Kienzler Points 3769

De Word à Markdown pourrait valoir la peine d'être tenté, ou la procédure décrite aquí en utilisant Calibre y Pandoc via HTMLZ, voici un bash script qu'ils utilisent :

#!/bin/bash
mkdir temp
cp $1 temp
cd temp
ebook-convert $1 output.htmlz
unzip output.htmlz
cd ..
pandoc -f html -t markdown -o output.md temp/index.html
rm -R temp

3voto

Federico Points 1145

En aquí :

unoconv -f html test.docx
pandoc -f html -t markdown -o test.md test.html

2voto

Dan Murphy Points 21

Vous pouvez convertir les documents Word de MS Word en format Markdown à l'aide de ce script en Visual Basic :

https://gist.github.com/hawkrives/2305254

Suivez les instructions de la rubrique "Pour utiliser le code" pour créer une nouvelle macro dans Word.

Remarque : cette opération convertit le document Word actuellement ouvert en format Markdown, ce qui supprime tous les éléments de formatage de Word (titres, listes, etc.). Enregistrez d'abord le document Word que vous prévoyez de convertir, puis enregistrez à nouveau le document en tant que nouveau document avant d'exécuter la macro. De cette façon, vous pourrez toujours revenir au document Word d'origine pour y apporter des modifications.

Vous trouverez d'autres exemples de scripts VB scripts de Word à markdown ici :

https://www.mediawiki.org/wiki/Microsoft_Word_Macros

1voto

Brigadeiro Points 670

Voici une application web open-source construite en Ruby pour faire exactement la même chose : https://word2md.com

0voto

Spotlight Points 1

Si vous utilisez Linux, essayez Pandoc (convertissez d'abord les fichiers .doc/.docx en html avec LibreOffice ou autre, puis exécutez-le).

Sous Windows (ou si Pandoc ne fonctionne pas), vous pouvez essayer ce site web (démo en ligne, vous pouvez le télécharger) : Markdownify

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X