Index (October 2008)
大規模ウェブサイトで有効期限のあるページを楽に管理する方法...python と BeautifulSoupを利用
某ホテルのウェブサイトを管理しているウェブマスターから
- キャンペーンページなどで有効期限の過ぎたページを少ない手間で管理するにはどうしたらいいか?
という相談を受けました。
それはまめにエクセル等に記録して管理すればいい話ではないか? とも思いましたが、 管理するページ数が多いと手間暇がかかるので、 スクリプトで一括チェックする方法を提案しました。 今回はそのアイデアとコードの覚え書きです。
TubroLinuxClient2008 をインストール→Windowsとのマルチブート
TurbolinuxClient2008をインストールしてみた。
決め手は、オフィシャルにemobileのサポートがあったこと。
その他、「低消費電力技術を強化(サスペンド強化)と説明されている」ことや
後から(TurboLinuxClient2008が気に入った場合に)ATOKや商用フォントを簡単に導入
できることなどから淡い期待をしている。
以前、TurboLinux 10 時代には、サスペンド対応していることを期待して、
購入したが、結局裏切られた苦い思いでがあるため、過剰な期待は禁物だが。
重複行を削除するjythonコード uniq.py
Linuxには、uniq というコマンドがあり、これは重複した行を削除します。
$ cat sample.txt | sort | uniq
のように使うことで、 テキストファイル中の重複のある行を削除することができます。
しかし、わたしが使っているLinux(Vine)では、どうも uniq がユニコードに 対応していないようで、UTF-8 の文字コードのファイルを uniq を 使って処理しても、うまく重複した行を削除してくれません。
そこで、今回 jython で取り急ぎ uniq コマンドの代わりになる uniq.py というコードを作成しましたので、メモしておきます。 (ただし、これは UTF-8 だけに対応しています。)
InDesign(CS3) + XMLで多言語展開マニュアルを作成する場合などに便利なツール(XML整形とu2029の変換)
InDesignには標準でXMLがサポートされていて上手に活用すれば便利なのですが、 いろいろと不便なことも多いです。 今回、InDesign+XMLを使った多言語マニュアルの制作を行うことになったのですが、 その際に、多言語展開を行うベースとなるマニュアルデータを作成する際に使ったツールを 紹介します。
(このエントリーは書きかけです。)
該当する文字コードがファイルのどの行に含まれているかを調べるコード(Java)
XMLを使って、FrameMakerとかInDesignで作業していると、文字コード関係の問題にぶちあたります。 文字コードに問題があって、コード番号がエラーメッセージとして提示されても、 普通にエディタ上で眺めていても問題がどの文字で起きているかわかりません。
たぶん、文字コードが即座に表示できるテキストエディタが世の中にはあると思うのですが、 とりあえず、Javaで指定のコードが出現する行を調べるコードを書きました。