Apollo Manroku

2010年以前に書いた記事の過去ログ

スパム・ブログに負けた 2008年2月15日

Filed under: Internet — アポロ @ 23:57

このスペースに設置していたブログ検索を利用したフィードのモジュールを取り外すことにしました。

グーグルヤフーなどのブログ検索は投稿されたばかりの最新の記事を検索することができてとても便利なのですが、日に日にその検索精度が落ちてきています。

検索される記事が減っているというわけではなく、逆に増えています。問題なのは、スパム・ブログの増加です。

スパム・ブログというのは、迷惑メールのブログ版で、ロボットなどによって自動的に書かれたブログの記事です。ロボットが収集したキーワードなどやフレーズなどを適当に組み合わせて記事を作成して投稿したもので、内容はまったく意味不明なのですが、その意味不明の記事でもブログ検索の検索対象となるので、検索結果の中にランダムに紛れ込むことになります。おかげで、ブログ検索で検索してもスパム・ブログばかりで、人間の書いたまともな記事を見つけるのが難しくなってきました。スパム・ブログが10件に1件まぎれこんでいる程度ならまだましですが、ひどいときには10件中9件くらいはスパム・ブログで、まともな記事は1割程度しかないというような場合もあります。

アポロ漫録ではフィードのモジュールを使って、グーグル・ブログ検索の検索結果を表示しているのですが、例えば「タロット」をキーワードにして検索した結果はほとんどがスパム・ブログで、もはや情報として何の役にも立たなくなってしまいました。独自にフィルターを作ってスパム・ブログを排除した結果を検索しようと思っても、ほとんど不可能な状況にまでなってきてしまいました。

中には公序良俗に反するキーワードも含まれていたりするので、それを目にした人には不愉快な思いをさせてしまうと思います。もうこれ以上、ブログ検索を利用したフィードのモジュールを設置しておくわけにはいかないでしょう。

非常に残念ですが、ブログ検索でスパム・ブログが排除され、ある程度検索の精度が上がってくるまでは、これらのモジュールは取り外しておくことにしました。

はたして、このようなスパム・ブログは排除することはできるのでしょうか?

 

© 2008 アポロのタロット占い

 

広告
 

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中