Samstag, 7. November 2009

odt2txt

http://stosberg.net/odt2txt/

http://linux.die.net/man/1/odt2txt

https://launchpad.net/ubuntu/+source/odt2txt

Leider unterstützt das Programm keine Seitentrennungen und ist damit nicht
mehr als ein (besserer) Ersatz für ein Skript wie das Folgende:

#!/bin/bash
# Testskript zur Umwandlung von ODP nach TXT
# UNZIP der content.xml aus dem ODP
unzip -o ${1} content.xml
if test -f content.xml
then
echo "OK - Datei entpackt!"
else
echo "Datei content.xml nicht gefunden!"
echo "Ist das eine ODP?"
exit 1
fi
# Extraktion der Inhalte
# http://www.unixguide.net/unix/sedoneliner.shtml
#
http://www.linuxforums.org/forum/linux-programming-scripting/77174-grep-content-between-two-tags-2.html
sed -e :a -e 's/<[^>]*>//g;/</N;//ba' content.xml
echo
exit 0

Keine Kommentare:

Kommentar veröffentlichen

Hinweis: Nur ein Mitglied dieses Blogs kann Kommentare posten.