新月の開発

99c986c3 名無しさん 2010-09-04 02:02 返信
[^abc]でaとbとcを含まない、になるけど、
やりたいのはkeywordを含まない、なので、
(?!keyword)になるようですよ。
詳しくは↓を見てください。

図解でみる正規表現入門  part11 - いろいろな繰り返し (6)
http://funcchan.blog16.fc2.com/blog-entry-19.html
図解でみる正規表現入門  part29 - 先読み 否定 (?! )
http://funcchan.blog16.fc2.com/blog-entry-37.html

((?!<>suffix.+).) は ((?!<>suffix).)
((?!<>pubkey.+).) は ((?!<>pubkey).) かな?

27d22d80 名無しさん 2010-09-04 02:13 返信
<>mail:[\w\-.@\s]+<>name:[\w\-.@\s]+
だけでいいような気がしてきたよ?

36635b3a 名無しさん 2010-09-04 08:48 返信
((?!(あ|い|う|え|お|か|き|く|け|こ|さ|し|す|せ|そ|た|ち|つ|て|と|な|に|ぬ|ね|の|は|ひ|ふ|へ|ほ|ま|み|む|め|も|や|ゆ|よ|ら|り|る|れ|ろ|わ|を|ん)).)
をどうにか短く出来ないだろうか?

ひらがなを含まない書き込みを規制したい。

35b8077b 名無しさん 2010-09-04 09:43 返信
>>36635b3a
?!の使い方が違うのだけはわかるけど。
たぶん[^]こっちだと思う。
ひらがなの範囲については↓とか

Pythonの正規表現モジュールにおける日本語の扱いについて - 試験運用中なLinux備忘録
http://d.hatena.ne.jp/kakurasan/20090424/p1

8c5f58fb 名無しさん 2010-09-04 10:14 返信
utf-8なら
\xe3(\x81[\x82-\xff])|\x82[\x00-\x93]
で濁点のあるもの、半濁点のあるもの含めすべてのひらがなにマッチする

46f271ae 名無しさん 2010-09-04 12:28 返信
>>0e9b047a
ベイズ統計フィルタだと重さや精度が問題になるしな。

f346e081 名無しさん 2010-09-04 16:45 返信
>>99c986c3
有難う御座います。
早速導入させてもらいます。

>>27d22d80
私もそう思いますww
[[みいもう]]スレを見てしまったので、スパムでないあの書き込みをちゃんと表示させつつ、スパムを排除したい欲望に駆られましてwww

fcfa94d4 名無しさん 2010-09-04 17:00 返信
応用編ver.3.3
^((?!<>suffix).)*<>mail:[\w\-.@\s]+((?!<>pubkey).)*<>name:[\w\-.@\s]+$

このスパムが完璧に機能したら涙が出るかもw
そういえば、名前欄とメール欄に何も書いてなかったスパムを見つけたwww

9bfcb418 名無しさん 2010-09-04 17:53 返信
>>fcfa94d4
添付ファイルがなく、
メール欄に記入があり、
書名がなく、
名前に記入があるもの

がスパム扱いですよね?
使わせていただきます。

6247e24c 名無しさん 2010-09-04 18:42 返信
>>9bfcb418
ありがとござます。

[0]トップ | [2]ページの先頭 | [6]古>> | 保管庫

ポストガール〈4〉 狂乱家族日記 六さつめ

ネットワーク利用規約
メールで投稿(添付OK)
(最大: 1536KB)
名前:
E-mail:

(新月の開発/384/0.2MB)

Powered by shinGETsu.