Добавление тега "Баян".
В общем - есть такая идея. Чтоб на реакторе была хэшированная база изображений. Суть следующая.
Слоупок, добавляющий пост с изображением, которое уже светилось ранее на реакторе, автоматом к посту получает тег "баян".
Реализация весьма банальна и вроде не сильно ресурсо-емкая.
Каждое новое изображение, обрабатывается функцией хэширования (md5, sha1, sha256, sha512 или другими не ресурсоемкими операциями) и отправляется в NoSQL хранилище с ключом этого хэша.
Если хэша в БД нету, то изображение НЕ получает тег "боян", иначе получает. Так можно будет частично освободить ленту, от баянов.
Крупная проблема:
1) баянистое изображение должно быть идентичным, тому что ранее размещалось. Т.е. 100% совпадение.
Думаю с такой фичей можно будет отрезать 15-20% баянов.
2) Существующая база изображений может обрабатываться либо ночью, либо просто забить на старые изображения и вылавливать только новые баяны.
Идея оставляю на рассуждение администрации и общества.
при добавлении новой фотки надо проверку делать...
NoSQL БД быстрые и даже среди 10.000.000 записей, поиск 32-64-256 символьного хэша будет очень быстрый. Счет будет идти на 0,01 секунды. Так что проверка не страшна в плане производительности.
И еще фишка в том, что основной сайт не будет страдать, т.к. основная БД (MySQL, PostgreeSQL или другие SQL) не затронуты.
По этому проверка не является затруднительной.
И еще фишка в том, что основной сайт не будет страдать, т.к. основная БД (MySQL, PostgreeSQL или другие SQL) не затронуты.
По этому проверка не является затруднительной.
Отличная идея. Поддерживаю
faq в тэги
Причем тут FAQ?
Учитывая что FAQ расшифровывается как - Frequently Asked Question
Учитывая что FAQ расшифровывается как - Frequently Asked Question
Бывает, что приходится переделывать свой собственный пост, что-то подправить, что-то изменить. И когда постишь собственный материал (слегка видоизменённый), срабатывает анти-баян. Такое бывает не часто, но всё же бывает. И тег баян будет явно не к месту. Сможете обойти этот нюанс - ради б-га, делайте. Нет - нахуй!
по хэшу глупо проверять, достаточно размер изменить или вырезать один пиксель и тэг "баян" не будет добавлен.
тогда уж надо прикручивать метод поиска похожих изображений (как у Гугла например и не только). тогда при добавлении картинки она будет пропускаться через этот алгоритм и сравнивать новую картинку с уже имеющимися на сайте.
или можно просто научить всех ньюфагов как в гугле искать картинки не во всем инете а только на этом сайте.
тогда уж надо прикручивать метод поиска похожих изображений (как у Гугла например и не только). тогда при добавлении картинки она будет пропускаться через этот алгоритм и сравнивать новую картинку с уже имеющимися на сайте.
или можно просто научить всех ньюфагов как в гугле искать картинки не во всем инете а только на этом сайте.
слоупок. попробуй запостить картинку с реактора на реактор. 100% дубли отсекает сразу
Спасибо админу, что обозвал слоупоком, но при чем тут постинг с "реактора" на "реактор".
За все время, выскочила эта фича - аж один раз. Хотя постил баяны пару раз.
За все время, выскочила эта фича - аж один раз. Хотя постил баяны пару раз.
Или вы уже реализовали подобный алгоритм отсечения старых записей?
наш антибаян срабатывает на точные совпадения. если хоть 1 пиксель не тот, уже не срабатывает.
сделать антибаян получше можно, но сложно.
сделать антибаян получше можно, но сложно.
Согласен, т.к. сами по себе, операции с изображениями закрыты.
А что на счет тега "баян"?
Имеет место быть?
А что на счет тега "баян"?
Имеет место быть?
Такс, тема закрыта, по причине реализованности.
Единая просьба к Re-l, все ж таки добавлять тег "баян" к таким дублям.
Единая просьба к Re-l, все ж таки добавлять тег "баян" к таким дублям.
новые псты просто не постятся, ежели это баян. а если на главной вспылвает баян, мы его убираем с помощью админского тега "повтор"
Чтобы написать коммент, необходимо залогиниться