リファラチェック導入

しばらく封印といっておきながら意外に早かったな。
しかし、こうでもしないと新手spamTBに対抗できないんだよなぁ。

ちょうどTBPingDSBLのバグを修正したあたりから、vi○graだのca○inoだのといった海外からのspamが大量に来るようになってしまった。
それについてはバッドワードやバッドURL、文字数制限、概要とタイトルの一致などの条件で大半を蹴ることができるようになって来ていたのだが、今度は日本語で、しかも一見するとspamでなさそうなものが少しずつ来るようになった。

だが、リンク先を見てみると広告だったり全く関連がなかったりして、あまり来てほしくないタイプのTBである。
いくら閑古鳥が鳴くblogで、TB大歓迎とはいえ、そういうTBまでほしいというわけではない。

だが、リファラチェック(正確には言及リンクチェック、TB元のページにTB先エントリへのリンクが含まれているか調べるものだが、私の導入したのは少し制限がゆるく、AタグリンクではないプレーンテキストのURL記述でも問題ないようにしてある)を導入するということは、仮に関連性があってもTB先のURLを含んでいないようなものは蹴られてしまうということでもある。
実際、チェックのあるblog(アキバblogなど)に何度かTBをしたことがあったが、関連のある内容の記事は書けても、どこにどのように言及リンクを含めるかといった文章の体裁に悩んだ。
言及リンクチェックをすることは、確実にTBの門戸を狭めていることになっていると思うのである。

ただ、その問題点は私も承知の上なので、全く対策をしてないわけではない。
上記にも書いてあるように、私の導入したチェックはAタグかどうかはチェックしておらず、ソース内にURL文字列があるかどうか調べているだけである。
つまり、TB先エントリのURL(TB先URLではない)がhttp://sephiebrain.jp/blog/diary/archives/2112/09/999999.htmlだったとすると、
<a href="http://sephiebrain.jp/blog/diary/archives/2112/09/999999.html">言及リンク</a>→もちろんOK
<p>http://sephiebrain.jp/blog/diary/archives/2112/09/999999.html</p>→これもOK
<div style="display: none">http://sephiebrain.jp/blog/diary/archives/2112/09/999999.html</div>→見えてないけどOK
<!-- http://sephiebrain.jp/blog/diary/archives/2112/09/999999.html -->→なんとコメントでもOK
というふうに、かなり自由度があるため、見た目を損なうことなくチェックをパスすることが可能となっている。
これはspammerにも有利になりそうに思えるが、spammerの場合は体裁なんて関係ないから機械的にAタグリンクを含めることを平気でやると思われるのであまり関係なさそうである。

ところで、エントリの日付がおかしいが、この記事がトップに来るように、しばらく(1~2年ぐらい?)日付を100年進めておく(ぉ)。
→1年も経ってないが、やっぱりうっとうしいので戻した。