как посмотреть html страницы
»политика экономика бизнес Россия http //www.svoboda.org/content/article/27419006.html
бизнесмен Дмитрий Потапенко размазал по стенке всё путинское послание
http://www.potapenko.ru/biografi.html
reactor-crw парсер
reactor-crw v0.1.0
Добрейший вечерочек. Новая версия reactor-crw и в ней уже используется graphql API реактора. Тот самый, на который, с недавних пор, переехала мобильная версия сайта. Ссылка на API.
Выглядит это следующим образом:
- ./reactor-crw html -p "http://joyreactor.cc/tag/Photo+art" -HTML версия
- ./reactor-crw api -t "Photo Art" - API версия
Ограничения
Внимательный читатель заметил, что этап получения ссылок происходит дольше самого скачивания файлов. Хотя по идее мы ничего не парсим а сразу получаем нужный результат. Так происходит потому что у реактора довольно жесткие лимиты по запросам на API. Собственно, у меня получилось заблочить себя даже в плейграунде.
Таким образом, каждый новый запрос на API происходит с таймаутом в 2 секунды.
Что позволяет API парсер
На данный момент, только пакетное выкачивание тегов. По умолчания API отдает абсолютно все, что связано с тегом, поэтому, была добавлена поддержка заблокированных тегов и подписок пользователя.
./reactor-crw api -t "Photo Art" -с "строка с куками"
Это уберет из результата все что у вас заблокировано. Но так же отфильтрует контент, на который нужно явно подписаться, что бы видеть. Куки нужно брать мобильной версии сайта.
Список всех флагов и их описание на странице github.
Изменения в версии 0.0.2
- Была добавлена поддержка socks5 и прокси (работает для HTML и API). Пример:
./reactor-crw api -t "tag name" --socks5 "socks5://127.0.0.1:9050"
- Значительно повысилась скорость обработки файлов. Теги, которые качались по 10-12 минут, сейчас тащатся за 2-3.
Скачать последнюю версию здесь. Если обнаружили ошибку или есть идея для нового функционала - создайте issue.
p.s. да, мы все знаем про Kelly.
политика Вторжение в Украину 2022 можем повторить песочница политоты
В Харькове началась идентификация погибших российских военных.
Никакую фотографию не напоминает?
(смотреть через ВПН)
YouTube импортозамещение политота Россия
Вчера такой думаю, дайка гляну ради интереса, что от VK видео и Rutube воротят свои носы контентмейреры.
VK видео, чтобы создать канал нужен номер мобильного телефона. Т.е если есть страница VK, то нельзя создать канал с каким-то псевдонимом и нужно завести вторую симку, создать страницу на VK с нужным псевдонимом и после этого будет канал.
По крайней мере я не нашел нигде в их интерфейсе такой возможности.
На Youtube к одной почте можно привязать до 5 каналов, которые зовут по-разному.
С Rutube я вообще выпал, там чтобы получить статус контент мейкера, нужно скачать и заполнить PDF-файл и отправить им это заявлением.
Даже не нашел возможности сделать короткую ссылку с именем канала.
Блин, Rutube появился ~ тогда, когда появился YouTube, но до ума его не довели.
safari iOS css
iOS CSS of death
На github опубликован код, приводящий к force restart iOS (11/12 GM) устройств при посещении html-страницы. Также приводит к зависанию Mac OS High Sierra/Mojave при использовании Safari.
Код, приводящий к force restart представляет из себя html-код с большим количеством вложенных div'ов и "сумашедшей" функцией размытия заднего план
Есть предположение, что баг закрался на уровне ниже, нежели webkit и может привести к более серьезным последствиям. Также, использование данного бага может быть применимо в социотехнических компаниях и дурацких розыгрышах, так что советую крайне подозрительно относится ко всем ссылкам, тем более что на iOS все браузеры, по сути, это надстройка над Сафари.
парсер сделал сам песочница reactor-crw
Воспользовавшись избытком свободного времени и неисправимой привычкой лепить велосипеды, решил реализовать удобный, хотя бы для себя, способ выкачивания годноты с реактора. Плюс иметь возможность спасти то, что возможно уже завтра будет потерто копирастами или другими "обеспокоенными".
Я видел несколько схожих решений и они либо не уже поддерживаются, либо являются подключаемыми библиотеками. Какие-то generic решения я не искал (см. пункт про велосипеды).
Что это?
Это CLI crawler, для выкачивания изображений (включая фул), gif, mp4, webm из страницы, которую вы укажите и сохранит все куда скажете. Если crawler найдет на странице пагинацию, то он попытается выкачать каждую страницу. Хотя вы можете указать так не делать.
Ссылка на проект на github.
Как начать?
Скачайте билд и запустите его из командной строки (для windows тоже). Windows может ругаться потому как это хрен пойми чей билд. Мак может ругаться потому что не может проверить поставщика. Линуксу насрать. Выполните .\reactor-crw_0.0.1_Windows_64bit.exe --help (либо ознакомьтесь с доступными флагами на странице github).
Пример запуска на windows:
Краткий FAQ
О:Если качаете NSFW, то не забудьте указать флагом свои куки (посмотреть куки можно в браузере).
О: Насколько шустро все отработает. Укажите слишком большое значение и реактор вас накажет. Для тега в ~4500 изображений я ставил 3.
О:Текущая версия далека от идеала. Если поделитесь деталями ошибки - буду весьма признателен.
О:Можно. Если кто-то умеет в UI, то я только за.
dev реактор предложения joyreactor песочница
Линк на оригинальный пик в "зароскомнадозернных" постах
А может где-то внутри поста в забаненном от роскомнадзора теге оставлять линк на оригинальное изображение? В html-комменте или hidden поле, например (ну и в base64, конечно). Они и не заметят, а написать небольшой юзерскрипт всяко проще чем постоянно включать zenmate и прочую проксю, чтобы посмотреть ватников и нарисованный китайский прон.Да | |
|
86 (46.2%) |
Нет | |
|
10 (5.4%) |
За тобой уже выехали | |
|
90 (48.4%) |
Отличный комментарий!