Index: [Article Count Order] [Thread]

Date:  Thu, 11 Oct 2001 17:08:37 +0900
From:  "Satoshi Matsumura" <matsumura-s@digicom.dnp.co.jp>
Subject:  [analog-jp:00771] Re: 検索語の漢字コードについて
To:  <analog-jp@jp.analog.cx>
Message-Id:  <mid-771-analog-jp@jp.analog.cx>
In-Reply-To:  <mid-758-analog-jp@jp.analog.cx>
X-Mail-Count: 00771

初めまして。松村と申します。
本MLの有益な情報を活用させていただいてます。

> 現在analog50w32jpをWindows2000環境で使用させていただいて
> おりますが、検索語レポートの項目が一部文字化けを起こします。
私も経験しています。
レポートはEUCで書き出しています。
その際、検索語が一部文字化けを起こしています。
ただ、ブラウザの文字コードをS_JISにすると文字化けを起した
検索語のほとんどが、ほぼ正常に見れます。
ただし、S_JISで書かれた検索語のすべてが文字化けしているわけ
ではないと思います。
※100%正しいコード判別はむずかしいと思っていますが....。
※Windows版とSorais版の違いでも化ける文字が若干異なるようです。
 (Windows版が5.01でSorais版が4.12を利用している関係もある
 かもしれませんが)

あと同じような要望になるかもしれませんが、
Internal Search Query Report
Internal Search Word Report
において同じ検索語なのに集計してみると別な検索語として扱われます。
文字コードが違うために別の検索語として識別しているのでしょうか?

具体的な例としては、

リクエスト数: 検索単語
------------: --------
          17: Japan
          14: エジプト
          13: エジプト
          13: ドイツ
          13: ドイツ
          12: フランス
          12: イギリス
          10: イギリス

みたいになります。

正しく集計できれば順位も変わり

リクエスト数: 検索単語
------------: --------
          17: Japan
          27: エジプト
          26: ドイツ
          22: イギリス
          12: フランス

となり、イギリスがフランスよりも上位になるはずです。

Configでは
INTSEARCHENGINE /test/search.cgi  state
みたいに指定しているだけです。

個人的には役に立つレポートなので、検索語レポート同様、
解決できれば大変うれしいのですが.....。

ご検討いただけると助かります。
よろしくお願い致します。