Swear Replacement 2220 слов для фильтра

Сообщения
41
Реакции
46
Исходный язык
English, Russian.
2220 слов ненормативной лексики на английском и русском для плагина "swear replacement", файл класть в папку cstrike/addons/amxmodx/configs, сам плагин качать отдельно.
Переводы
Для жителей стран СНГ.
English by Google.
Russian by Google.
 

Вложения

Сообщения
13
Реакции
-6
интересно с каких пор слово "gays" у нас стало ненормативной лексикой, но да ладно. Словарь можно сильно оптимизировать: большинство забугорных ругательств основаны от f*ck sh1t и так далее, так что можно проверять на наличие слов содержащие соотв части. А вот для "косоязычия" свой словарь делать придётся.
 
Сообщения
225
Реакции
90
Помог
1 раз(а)
Glaster, если база применяется для замены подстроки, то тогда следует её делать наиболее подробной. А вообще с аниматами этими вашими всегда была беда, что цензурили слова которые содержат матерные подстроки, но матом не являются: "невпихуемое", "оскорблять" и прочие. Для того чтобы фиксить эту проблему словарик требуется больший (или дополнительный).
 
Сообщения
133
Реакции
154
irrumabo_me_nomen, А если сделать в таком случае дополнительный "whitelist" ? При этом брать не все словоформы, а только корни и основы слов. Например для слова "оскорбление", корень "оскорбл", тут у нас "отлетают" сразу все формы существительного + глаголы. Или делать дополнительную проверку на количество букв перед "матерной частью"
 

d3m37r4

111111
Сообщения
1,428
Реакции
1,169
Помог
10 раз(а)
Что мешает писать транслитом и обходить ваши антиматы?)
 
Сообщения
133
Реакции
154
d3m37r4, тут на ум приходит перевод всех символов в один регистр. Делаем все букавы маленькими и транслит уже не поможет
 
Сообщения
133
Реакции
154
Islingiton_G, а при чем транслит и регистр?
упс, мой косяк, неправильно интерпретировал (перепутал с регистром). Хотя даже так: можно перегонять с латиницы на кириллицу, перегонять цифры в буквы (например 0 становится о) и уже с этим работать. Хотя при этом придётся генерировать несколько кучу вариантов: например, слово Hax001 : для букв H, x, цифры 1 и двойного о придётся генерировать следующие варианты: Наксоои, Хаксоои и так далее, пока либо не будут перебраны все возможные комбинации либо мы не найдём "матерное совпадение".
 
Последнее редактирование:

d3m37r4

111111
Сообщения
1,428
Реакции
1,169
Помог
10 раз(а)
Куча лишних операций непонятно зачем. Лучше уж к какому-нибудь сервису обращаться. В любом случае, толку от блока оскорблений 0, можно извращаться как угодно.
 
Сообщения
225
Реакции
90
Помог
1 раз(а)
Islingiton_G, ну типа. У меня в другом немного плунгиксе идёт проверка не является ли подстрока частью другой строки.
d3m37r4, если очень захотеть можно в космос полететь, и перекодировать текст в фонетический, но тут уж проще нейроавоську запилить, чем такую вундервафлю продумывать. А вообще подобный алгоритм можно применять не только в антиматах.
 

Пользователи, просматривающие эту тему

Сейчас на форуме нет ни одного пользователя.
Сверху Снизу