Supportnet / Forum / Textverarbeitung
Doc to Txt in UTF-8
Frage
Hallo,
in unserer Firma kriegen wir regelmäßig einige Word-Dokumente rein. Der dort enthaltene Text muss allerdings geparsed werden um es in eine Datenbank zu schreiben... Nunja jedenfalls haben wir bisher immer jedes einzelne Dokument geöffnet Copy&Paste und in ein neues TXT UTF-8 gepackt. Nun meine Frage: Gibt es kostenlose Programme die per Batchkonvertierung alle Word-Dokumente (.doc) in Plaintext (.txt) mit der Codierung UTF-8 konvertiert?
Wäre absolut super wenn ihr mir einige Links geben könntet oder auch bestimmte Suchbegriffe damit ich weiß wonach ich suchen muss. So standartsachen wie "doc2txt" oder ähnliches bringen nur teure Programme mit mehreren hundert $ zum Vorschein.
Ich hoffe ihr kennt da eine kostenlose Alternative.
MFG
Antwort 1 von handy
dort hat jemand ne vba-funktion zum konvertieren nach utf8 gepostet:
http://www.vbfrance.com/infomsg_ENCODAGE-FICHIER-TEXTE_311177.aspx
http://www.vbfrance.com/infomsg_ENCODAGE-FICHIER-TEXTE_311177.aspx

