正则表达式求助

贴上一个搜索和黑名单正则表达式:
纯数字名称 ^\d{1,99}$
求一个不包含汉字的正则表达式,有别的实用正则表达式也可以分享在这里。

^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$

测试好像不对哦

^表示字符串开始,方括号表示字符集,[A-Za-z0-9]匹配字符串的一个字符,+号表示重复1到多次,$表示字符串结束,匹配由多个数字大小字母组成的字符串,没毛病。

我说的是不包含汉字的,指的是排除汉字外所有的字符都算,不光是英文和数字 :grinning:

K1203.zip
这个文件都过不去


  1. A-Za-z0-9 ↩︎

[^\u4e00-\u9fa5]+


  1. A-Za-z0-9 ↩︎

这个我之前查到过,别的地方试着可以,到bitcomet不正常,不知道为啥


按我的想法,狂飙这种是不应该能被搜索到的

应该是和bitcomet搜索机制有关系,需要这个语句对文件名全部匹配才行,这个文件名有一部分汉字,一部分别的,所以还是能搜索到,而我想要只要有汉字,就不能搜索到

SQL直接正则也不行,不知道是不是Sqlite字段类型的原因。

不包含中文不是这样就行了嘛
^((?![\u4e00-\u9fa5]).)*$

wiki上面有例子:使用正则表达式搜索 [BitComet]

整体效果不错


麻烦你给看看这个

[3Diddly] Hannah’s Corruption Chapter 4 汉娜的堕落 第四章 [Chinese].zip

unicode的中文编码表 从一开始 “4e00” 到 “9fa0” 总共有20901个汉字,你搜索的这个库的编码是unicode吗?我想应该是这个原因引起的。

SELECT * FROM PeerShares WHERE title REGEXP ‘[2]+$’ 验证结果正常


  1. A-Za-z0-9 ↩︎

  2. ^\u4E00-\u9FFF ↩︎

[2]+$
直接下载一个库吧 时空门 种子市场 (2023.01.20) - 比特彗星(BitComet) - 彗星論壇 (cometbbs.com)


  1. ^\u4E00-\u9FFF ↩︎

  2. ^\u4E00-\u9FFF ↩︎

同一个种子市场trackr种子,一共900个,[1]+$ 能搜到710个结果,^((?![\u4e00-\u9fa5]).)*$ 能搜索到838个结果,最大的区别应该是磁力链部分[2]+$搜索不到,别的结果是一样的,也有可能种子数量不足,更多的数量等我种子多了可以再试试


  1. ^\u4E00-\u9FFF ↩︎

  2. ^\u4E00-\u9FFF ↩︎