unicode
段落書式でフォント SimSun で指定してもMS明朝になってしまう問題その1(Adobe Structured FrameMaker8)
FrameMaker8 日本語インタフェースを使用(構造化FrameMaker)して 中国語(簡体字)のDTPを行っている。 ところが、中国語が文字化けしてしまう不具合が発生、その調査顛末。
丸付きのプラス記号、マイナス記号を入力したい・・・ユニコードで
丸の中に+(プラス)記号の文字が u+2295 で、-(マイナス)記号の文字は、u+2296 だということは
ネットで調べてわかったのだが、それをウインドウズ上で入力する方法がわからない。
しばらく検索していたが、わからなかったので、Javaで生成することにした。
Cygwinでnkfを導入、テキストファイルの文字コードをUTF-8に変換するコマンド toutf8 の作成(cygwin,nkf)
JIS,SJIS,EUC,UTF-8等任意日本語文字コードのテキストファイルをUTF-8に変換するときに 使用するスクリプト。
InDesign(CS3) + XMLで多言語展開マニュアルを作成する場合などに便利なツール(XML整形とu2029の変換)
InDesignには標準でXMLがサポートされていて上手に活用すれば便利なのですが、 いろいろと不便なことも多いです。 今回、InDesign+XMLを使った多言語マニュアルの制作を行うことになったのですが、 その際に、多言語展開を行うベースとなるマニュアルデータを作成する際に使ったツールを 紹介します。
(このエントリーは書きかけです。)
InDesign(CS3)でXML書き出ししたときの改行(u2029 = PARAGRAPH SEPARATOR)の取り扱い方法
InDesignでXML書き出しするときに、改行情報はどうなるのか?の調査。
Javaで文字コードを調べる... 全角スペース(ideographics space)を半角スペースに置き換える方法
テキストデータ中に含まれる全角スペースを半角スペースに置き換えるプログラム(java)を書くことになった。
ちなみに、全角スペースという用語は日本だけしか通用しないらしい。 ユニコード(unicode)的世界では、ideographics space と呼ばれているらしい。
XonWindows3付属のemacsでUTF-8を扱えるようにする(未解決)
Mule-UCSというパッケージがあり、これを使えば、emacsでUTF-8を 使えるようになる。
現在文字コードはすべてUTF-8に統一しているので、 XonWindows3のemacsでもUTF-8を扱えるようにしたい。
XonWindows3には、標準でMule-UCS 0.85のバージョンが収録されているのだが、 .emacs.el に以下の行を追加して、UTF-8を使おうとするとemacs起動時にエラーに なって使えない。
(require 'un-define)
(require 'jisx0213)
そこで、ネットで検索して、Mule-UCS 0.84のバージョンのソースを入手して、 インストールしてみたが、読み込みこそうまくいったのだが、 結局保存時に、以下のようなエラーが出てうまくいかなかった。
These default coding systems were tried:
utf-8-unix
However, none of them safely encodes the target text.
Select one of the following safe coding systems:
raw-text emacs-mule no-conversion