Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

英文敏感词的问题 #2

Open
Mr-jing opened this issue Apr 8, 2015 · 3 comments
Open

英文敏感词的问题 #2

Mr-jing opened this issue Apr 8, 2015 · 3 comments

Comments

@Mr-jing
Copy link

Mr-jing commented Apr 8, 2015

比如,有个敏感词为sm,正常的单词small,那么其中的sm会被认为是脏词。

我尝试把敏感词改为sm(空格)(空格)sm(空格)sm(空格)也还是不行。

@bytehello
Copy link

哪怕是 “操作” or “操场”这样的,“操”也会被当作脏词

@Mr-jing
Copy link
Author

Mr-jing commented Aug 30, 2016

@gechanghang 嗯,确实。我后面是对库返回的结果做了校验,英文的处理了一下。如果返回脏词是英文字母,我会在原句中检查该词前后是不是字母,如果是字母,就当为单词的一部分,不作为脏词了。
一年多了,感慨一下时间过得真快啊

@GabyCheng
Copy link

@gechanghang 嗯,确实。我后面是对库返回的结果做了校验,英文的处理了一下。如果返回脏词是英文字母,我会在原句中检查该词前后是不是字母,如果是字母,就当为单词的一部分,不作为脏词了。
一年多了,感慨一下时间过得真快啊

检查该词前后是不是字母会不会不好,我找不到别人是怎么处理的,我看到有人去调词库,判断它是否是一个单词

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants