Index: [Article Count Order] [Thread]

Date:  Fri, 14 Feb 2003 11:52:11 +0900
From:  Takayuki Matsuki <tmatsukijp@ybb.ne.jp>
Subject:  [analog-jp:01457] Re: 検索単語について
Sender:  tmatsukijp@ybb.ne.jp
To:  analog-jp@jp.analog.cx
Message-Id:  <mid-1457-analog-jp@jp.analog.cx>
In-Reply-To:  <mid-1456-analog-jp@jp.analog.cx>
References:  <mid-1456-analog-jp@jp.analog.cx>
X-Mail-Count: 01457

松木です。

> K2と申します。
> analog-5.31 を使っています。
> 
> 1.検索単語では例えば、"apache", "Apache", "APACHE" 等大文字
> 小文字の区別をして集計されていますが、これを区別せずに集計する
> 機能はありますか?

CASE INSENSITIVE

とすれば英文大小文字の区別はしなくなります。

> 2.現在は analogurldecode.pl を使用して検索単語等の日本語文字
> を変換していますが、これだけだと EUC-JP, Shift-JIS 等文字コード
> が違うが実際の文字列は同じものが別単語として集計されますよね?
> (つまり、例えば「インストール」が検索単語に2度現れる)
> これを同単語として集計するにはどのようにすればよいでしょうか?
> logkf も使用してみたのですが、うまく変換できずに異常ログ行数が
> 大量に出てしまいます。。。

これは、橘さんにもう一度頑張ってもらうしかないか、
Analog5.01までバージョンを落とせば完全日本語化されたAnalog
がユーザ会のホームページからダウンロードできます。

あるいはどなたかボランティアで日本語化に取り組まれる方が
出て下されば一番良いのですが。