Supportnet / Forum / Webseiten/HTML
Text in Unicode umwandeln? Welches Programm?
Frage
Hallo,
ich suche ein Programm, was ein vorhandenes Dokument automatisch in Unicode umwandeln kann.
Ich meine nicht nur die Sonderzeichen, sondern den kompletten Text (alle Zeichen).
Ich kenne nur Programme, welche das mit Sonderzeichen (ä, ß, é u.s.w.) machen können, aber nicht mit allen Zeichen.
Kennt da jemand ein Programm (am besten erstmal für Windows, sonst müsste ich wieder an 2 Rechnern gleichzeitig arbeiten ;-) ?
[i]<gruß thj>[/i]
Antwort 1 von Ralf-Dieter..
♫☺♫ klingeling ♫☺♫ klingeling ♫☺♫ klingeling ♫☺♫ klingeling...
So etwas ????
Gruß,Ralf
Supportnet Seti Team Daily Statistics
(mit)crunchen ??
So etwas ????
Gruß,Ralf
Supportnet Seti Team Daily Statistics
(mit)crunchen ??
Antwort 2 von TheHappyJoker
♫ = ♫
Sowas meine ich. Aber auch ganz normale Buchstaben/Zahlen möchte ich so unicodieren.
So soll z.B. a = a codiert werden.
Welches Programm wandelt mir einen ganzen Text in Unicode um?
<gruß thj>
Sowas meine ich. Aber auch ganz normale Buchstaben/Zahlen möchte ich so unicodieren.
So soll z.B. a = a codiert werden.
Welches Programm wandelt mir einen ganzen Text in Unicode um?
<gruß thj>
Antwort 3 von Ralf-Dieter..
http://www.textpad.com/
musste erst compi wechseln
;-))
das kann eigentlich alles.
Gruß,Ralf
musste erst compi wechseln
;-))
das kann eigentlich alles.
Gruß,Ralf
Antwort 4 von TheHappyJoker
Hallo
Danke, lade mir das Prog gerade 'runter :-)
<gruß thj>
Danke, lade mir das Prog gerade 'runter :-)
<gruß thj>
Antwort 5 von TheHappyJoker
Hm, das Programm kann leider nicht den Text in Unicode konvertieren (auch nicht beim Abspeichern)...
Noch ein Tipp?
<gruß thj>
Noch ein Tipp?
<gruß thj>
Antwort 6 von Ralf-Dieter..
In einen Text-Ordner kopieren....schliessen.
Warnmeldung kommt...unicod.wählen abspeichern.
Warnmeldung kommt...unicod.wählen abspeichern.
Antwort 7 von TheHappyJoker
Sorry, entweder ich mache etwas falsch, oder das Prog kann es wirklich nicht... :-(
Ich schreibe einen Text z.B. "Hallo"
Nun gehe ich auf "Speichern unter...". Bei Dateiformat steht "PC" und bei Zeichensatz "Unicode". Das ganze bestätige ich mit "Speichern".
Nun öffne ich die Datei mit den Notepad - in der Erwartung solche Zeichen wie bei Antwort 4 zu sehen (das ganze heißt nämlich "Hallo" in Unicode). Aber stattdessen steht da wörtlich drinnen:
ÿþH a l l o
Was soll das???
<gruß thj>
Ich schreibe einen Text z.B. "Hallo"
Nun gehe ich auf "Speichern unter...". Bei Dateiformat steht "PC" und bei Zeichensatz "Unicode". Das ganze bestätige ich mit "Speichern".
Nun öffne ich die Datei mit den Notepad - in der Erwartung solche Zeichen wie bei Antwort 4 zu sehen (das ganze heißt nämlich "Hallo" in Unicode). Aber stattdessen steht da wörtlich drinnen:
ÿþH a l l o
Was soll das???
<gruß thj>
Antwort 8 von semi
perl -p -i.bak -e "s/(.)/'&'.ord($1).';'/eg" *.txtAntwort 9 von Ralf-Dieter..
/http://www.unicode.org/
Mit dem Editor können Sie Dokumente in verschiedenen Formaten erstellen und öffnen: ANSI, Unicode, Big-Endian-Unicode und UTF-8. Mithilfe dieser Formate können Sie Dokumente bearbeiten, in denen verschiedene Zeichensätze verwendet werden.
Standardmäßig werden die Dokumente als Standard-ANSI-Text gespeichert.
Unicode ist eine Obermenge der wichtigsten Schriftzeichen, die weltweit verwendet werden. Diese Menge umfasst Zeichensätze für geschäftliche Zwecke und den Computerbereich. Beim Speichern eines Dokuments in Unicode können Sie den Textfluss und die Textrichtung anhand von Unicode-Steuerzeichen bestimmen (beispielsweise für Arabisch oder Hebräisch).
Bei einigen Schriftarten können nicht alle Unicode-Zeichen dargestellt werden. Wenn Zeichen in der Textdatei fehlen, verwenden Sie eine andere Schriftart, die das betreffende Zeichen einschließt. In der Regel sollten Sie Microsoft Sans Serif für Unicode-Zeichen verwenden.
Die Reihenfolge der Bytes (ein Byte ist eine Speichereinheit) für ein Wort in einem Unicode-Dokument, das mit einem Big-Endian-Prozessor erstellt wurde (beispielsweise einem Macintosh), ist genau umgekehrt zur Reihenfolge der Bytes in einem Dokument, das mit einem Intel-Prozessor erstellt wurde. Das wichtigste Byte belegt hierbei die kleinste Adresse, und das Wort wird beginnend mit dem Big Endian gespeichert. Um Benutzern dieser Computer den Zugriff auf Ihre Dokumente zu ermöglichen, speichern Sie die Editor-Datei im Format Big-Endian-Unicode.
UTF steht für "Universal Character Set Transformation Format". UTF-8 bezeichnet die 8-Bit-Version von Unicode. Wenn Sie ältere Übertragungsmedien verwenden, die lediglich 8 Bit an signifikanten Daten in einzelnen Bytes unterstützen, speichern Sie die Dokumente in UTF-8.
Weitere Informationen zu diesen Formaten erhalten Sie unter Unicode
Mit dem Editor können Sie Dokumente in verschiedenen Formaten erstellen und öffnen: ANSI, Unicode, Big-Endian-Unicode und UTF-8. Mithilfe dieser Formate können Sie Dokumente bearbeiten, in denen verschiedene Zeichensätze verwendet werden.
Standardmäßig werden die Dokumente als Standard-ANSI-Text gespeichert.
Unicode ist eine Obermenge der wichtigsten Schriftzeichen, die weltweit verwendet werden. Diese Menge umfasst Zeichensätze für geschäftliche Zwecke und den Computerbereich. Beim Speichern eines Dokuments in Unicode können Sie den Textfluss und die Textrichtung anhand von Unicode-Steuerzeichen bestimmen (beispielsweise für Arabisch oder Hebräisch).
Bei einigen Schriftarten können nicht alle Unicode-Zeichen dargestellt werden. Wenn Zeichen in der Textdatei fehlen, verwenden Sie eine andere Schriftart, die das betreffende Zeichen einschließt. In der Regel sollten Sie Microsoft Sans Serif für Unicode-Zeichen verwenden.
Die Reihenfolge der Bytes (ein Byte ist eine Speichereinheit) für ein Wort in einem Unicode-Dokument, das mit einem Big-Endian-Prozessor erstellt wurde (beispielsweise einem Macintosh), ist genau umgekehrt zur Reihenfolge der Bytes in einem Dokument, das mit einem Intel-Prozessor erstellt wurde. Das wichtigste Byte belegt hierbei die kleinste Adresse, und das Wort wird beginnend mit dem Big Endian gespeichert. Um Benutzern dieser Computer den Zugriff auf Ihre Dokumente zu ermöglichen, speichern Sie die Editor-Datei im Format Big-Endian-Unicode.
UTF steht für "Universal Character Set Transformation Format". UTF-8 bezeichnet die 8-Bit-Version von Unicode. Wenn Sie ältere Übertragungsmedien verwenden, die lediglich 8 Bit an signifikanten Daten in einzelnen Bytes unterstützen, speichern Sie die Dokumente in UTF-8.
Weitere Informationen zu diesen Formaten erhalten Sie unter Unicode
Antwort 10 von _gau_
Ich glaube, da geht etwas durcheinander ;-)
Eine Datei im Unicode-Format abspeichern kann sogar der Notepad-Editor von Win2000/XP. Damit ist das interne Dateiformat gemeint (z.B. jeweils 2 Byte pro Zeichen, kann man sich mit einem HEX-Editor gut anschauen) und nicht die Zeichen, die du im Editor siehst.
TheHappyJoker will aber die eigentlichen Textzeichen, hmm, sagen wir mal, "in ihre numerische Unicode-Notation überführen".
Sorry, kenne aber auch kein Prog, das dies für einen gesamten Text leistet. Aber dafür hat ja semi einen netten Vorschlag mit Perl und der Ord-Funktion.
c
[gau]
Eine Datei im Unicode-Format abspeichern kann sogar der Notepad-Editor von Win2000/XP. Damit ist das interne Dateiformat gemeint (z.B. jeweils 2 Byte pro Zeichen, kann man sich mit einem HEX-Editor gut anschauen) und nicht die Zeichen, die du im Editor siehst.
TheHappyJoker will aber die eigentlichen Textzeichen, hmm, sagen wir mal, "in ihre numerische Unicode-Notation überführen".
Sorry, kenne aber auch kein Prog, das dies für einen gesamten Text leistet. Aber dafür hat ja semi einen netten Vorschlag mit Perl und der Ord-Funktion.
c
[gau]
Antwort 11 von _gau_
@Ralf-Dieter..
Was soll uns dein langer Text nur sagen? *grübel*
Was soll uns dein langer Text nur sagen? *grübel*
Antwort 12 von Ralf-Dieter..
Das steht im Hilftext dazu.
Für meinen Bedarf,hat immer der Editor ausgereicht :-))
Ralf
Für meinen Bedarf,hat immer der Editor ausgereicht :-))
Ralf
Antwort 13 von TheHappyJoker
Wow, danke semi!!! Es funktioniert! :-)
Antwort 14 von _gau_
Hi thj,
ich hatte ein wenig Zeit und Langeweile und deshalb gibt es jetzt neben dem Tip von semi auch ein kleines Windows-Prog zum Umwandeln:
UniConv für Win
Kannst du ja auch mal ausprobieren.
[gau]
ich hatte ein wenig Zeit und Langeweile und deshalb gibt es jetzt neben dem Tip von semi auch ein kleines Windows-Prog zum Umwandeln:
UniConv für Win
Kannst du ja auch mal ausprobieren.
[gau]
Antwort 15 von TheHappyJoker
Das Prog ist echt klasse! Wäre auch 'ne Überlegeung wert es bei unicode.org mal zu melden, damit die einen Link setzen - sowas fehlt da nämlich (die vielen Erklärungen da helfen letztendlich auch nicht viel praktisch weiter)!
Meinen Respekt! :)
Aber sag' mal: Hattest Du schon eine Codetabelle, oder wie hast Du das so schnell gelöst (sind ja immerhin 65536 Zeichen)?
<gruß thj>
Meinen Respekt! :)
Aber sag' mal: Hattest Du schon eine Codetabelle, oder wie hast Du das so schnell gelöst (sind ja immerhin 65536 Zeichen)?
<gruß thj>
Antwort 16 von _gau_
Im Kern genauso wie bei der Perl-Zeile von semi: Einfach mit der Ord()-Funktion. Die gibt's eigentlich in jeder Programmiersprache (hier Delphi) und gibt zu jedem Zeichen den zugehörigen Zahlencode zurück ;-)
Die eigentliche Arbeit ist dann der ganze Schmus drumherum...
[gau]
Die eigentliche Arbeit ist dann der ganze Schmus drumherum...
[gau]
Antwort 17 von semi
@gau
Habe gesehen, dass Du upx einsetzts. Gibt es damit keine Probleme unter Windows XP?
(XP hab' ich nicht, daher die Frage)
Habe gesehen, dass Du upx einsetzts. Gibt es damit keine Probleme unter Windows XP?
(XP hab' ich nicht, daher die Frage)
Antwort 18 von _gau_
@semi
Privat nutze ich auch noch Win2000. Aber auf Arbeit teste ich die Programme auch unter NT und XP Pro und habe bisher noch keine Probleme mit UPX bemerkt.
(Das Packen ist so 'ne "Angewohnheit" von mir, weil ich oftmals auf Arbeit eigene Tools übers Netzwerk einsetze. Und je kleiner das Programm, desto schneller wirds übers Netz geladen)
Übrigens hab ich das Programm nochmal ein wenig überarbeitet (eher nur "kosmetische" Änderungen ;-)
[gau]
Privat nutze ich auch noch Win2000. Aber auf Arbeit teste ich die Programme auch unter NT und XP Pro und habe bisher noch keine Probleme mit UPX bemerkt.
(Das Packen ist so 'ne "Angewohnheit" von mir, weil ich oftmals auf Arbeit eigene Tools übers Netzwerk einsetze. Und je kleiner das Programm, desto schneller wirds übers Netz geladen)
Übrigens hab ich das Programm nochmal ein wenig überarbeitet (eher nur "kosmetische" Änderungen ;-)
[gau]

