99c986c3
名無しさん
2010-09-04 02:02
返信
[^abc]でaとbとcを含まない、になるけど、
やりたいのはkeywordを含まない、なので、
(?!keyword)になるようですよ。
詳しくは↓を見てください。
図解でみる正規表現入門 part11 - いろいろな繰り返し (6)
http://funcchan.blog16.fc2.com/blog-entry-19.html
図解でみる正規表現入門 part29 - 先読み 否定 (?! )
http://funcchan.blog16.fc2.com/blog-entry-37.html
((?!<>suffix.+).) は ((?!<>suffix).)
((?!<>pubkey.+).) は ((?!<>pubkey).) かな?
27d22d80
名無しさん
2010-09-04 02:13
返信
<>mail:[\w\-.@\s]+<>name:[\w\-.@\s]+
だけでいいような気がしてきたよ?
36635b3a
名無しさん
2010-09-04 08:48
返信
((?!(あ|い|う|え|お|か|き|く|け|こ|さ|し|す|せ|そ|た|ち|つ|て|と|な|に|ぬ|ね|の|は|ひ|ふ|へ|ほ|ま|み|む|め|も|や|ゆ|よ|ら|り|る|れ|ろ|わ|を|ん)).)
をどうにか短く出来ないだろうか?
ひらがなを含まない書き込みを規制したい。
35b8077b
名無しさん
2010-09-04 09:43
返信
>>36635b3a
?!の使い方が違うのだけはわかるけど。
たぶん[^]こっちだと思う。
ひらがなの範囲については↓とか
Pythonの正規表現モジュールにおける日本語の扱いについて - 試験運用中なLinux備忘録
http://d.hatena.ne.jp/kakurasan/20090424/p1
8c5f58fb
名無しさん
2010-09-04 10:14
返信
utf-8なら
\xe3(\x81[\x82-\xff])|\x82[\x00-\x93]
で濁点のあるもの、半濁点のあるもの含めすべてのひらがなにマッチする
46f271ae
名無しさん
2010-09-04 12:28
返信
>>0e9b047a
ベイズ統計フィルタだと重さや精度が問題になるしな。
f346e081
名無しさん
2010-09-04 16:45
返信
>>99c986c3
有難う御座います。
早速導入させてもらいます。
>>27d22d80
私もそう思いますww
[[みいもう]]スレを見てしまったので、スパムでないあの書き込みをちゃんと表示させつつ、スパムを排除したい欲望に駆られましてwww
fcfa94d4
名無しさん
2010-09-04 17:00
返信
応用編ver.3.3
^((?!<>suffix).)*<>mail:[\w\-.@\s]+((?!<>pubkey).)*<>name:[\w\-.@\s]+$
このスパムが完璧に機能したら涙が出るかもw
そういえば、名前欄とメール欄に何も書いてなかったスパムを見つけたwww
9bfcb418
名無しさん
2010-09-04 17:53
返信
>>fcfa94d4
添付ファイルがなく、
メール欄に記入があり、
書名がなく、
名前に記入があるもの
がスパム扱いですよね?
使わせていただきます。
6247e24c
名無しさん
2010-09-04 18:42
返信
>>9bfcb418
ありがとござます。
[0]トップ | [2]ページの先頭 | [6]古>> | 保管庫
(新月の開発/384/0.2MB)
Powered by shinGETsu.