Index > underconst

underconst

Wed, December 31, 2008

ネット上でメモをとるウェブアプリ 'memotoru' を Google Code Project Hosting にて公開(Google App Engine用アプリ)(gae,google,markdown)

ネット上でメモをとるツール memotoru を公開しました。

※このエントリは書きかけです。

続きを読む

Sun, December 7, 2008

'持ち運べるウィキペディア'のためのツール wpindex.jar

これは、wpdb で作成したデータベースをもとに、検索用インデックスを作成するプログラムです。

使い方は '持ち運べるウィキペディア'をつくる のエントリーをご覧ください。

※このエントリーは書きかけです。

続きを読む

Sun, December 7, 2008

'持ち運べるウィキペディア'のためのツール wpsearch.jar

これは、 wpindexwpui のライブラリです。

Luceneを使ってwikipediaコンテンツの検索インデックスの作成と 検索機能を提供します。

※このエントリーは書きかけです。

続きを読む

Wed, December 3, 2008

wiki2html ...ウィキペディア(Wikipedia)のデータ(wikitext)をHTMLに変換するツール

WikipediaのXMLファイル (http://download.wikimedia.org/) から抽出したテキストをHTMLに変換するツール。

※このエントリーは書きかけです。

続きを読む

Wed, December 3, 2008

データベース(RDBMS)をもっと簡単に使うためのライブラリ jgadfly(SQLiteJDBC版)

SQLIteJDB というデータベースを含んだJDBCドライバがあったので、これを機会に、 jgadfly を手直しました。

特徴

制約

※このエントリは書きかけです。

ツールだけダウンロードする場合はこちら

続きを読む

Fri, June 15, 2007

ウィキペディアコンテンツの活用 XML形式のWikipediaデータからJavaを使って記事だけを取り出す方法

Wikipediaのコンテンツを活用して自前のアプリケーションを書くために、 今回Javaで処理する方法を調べました。

まず下準備として、 以下のWikimediaのダウンロードページからコンテンツを 入手します。

XML,SQL,StaticHTMLの形式が選択できますが、今回は、XMLデータをダウンロードして それを活用することにします。

StaticHTMLは便利そうですが、データが古いのと、 HTML中にこちらが意図しない情報も含まれていると取り除くのが面倒です。 XMLであれば、直接wiki textで書かれたコンテンツデータを入手できるので、 このwiki textをこちらの都合のよいように変換して使うことができます。

続きを読む

 Twitter
follow me on Twitter
 Categories
 Archives