Скачивалка картинок с плашками / Joyloader :: реактор скачать :: парсер :: joyreactor

joyreactor реактор скачать парсер Joyloader 

Скачивалка картинок с плашками

Короче захотелось мне в связи со всеми этими последними событиями, и тем к чему они могут привести, коечего качнуть с реактора. Чтобы было, на всякий пожарный. Задал вопрос тут http://joyreactor.cc/post/5114496#comment25031878 и получил ответы. Смог воспользоваться одним из них и таки накачал чего хотел. Но пока разбирался с этим делом немного поматерился неудобности обоих способов, и параллельно процессу поковырялся над своим вариантом "на коленках". И вот теперь думаю, что он тоже имеет право на жизнь. Плюсы: удобность и простота. Минусы: плашки на картинках и ненастраевоемость.

В общем вот, представляю вам Joyloader

Скачать: https://disk.yandex.ru/d/uoQRruzTDnPUVA

joyloader.exe - скомпилированный програмусик

joyloader.py - исходный кодик, если вам стремно запускать чужие экзешники (что оправдано), то вот компилируйте сами и пользуйтесь, заодно решается проблема с настраиваемостью, настраивайте.

Кто-то скажет, блин там писят строчек кода, нафик ты это принес? А я отвечу - а вот.

Для примера скрин с рабочей прогой.

I
A Не за1Щ|П1|П|1п *■ anime.reactor.cc/tag/Anime+Cosplay
Главная > фэндомы > Anime > Anime Cosplay
Anime Cosplay
+ подписаться
По щисчиков: 955 Сообщений: 13072 Рейтинг постов: 92,305.6
Косплей (яп. =1
Основными прсфтипами i| детально воссоз "Макияжа и дииилни
Q заблокировать
*

Пишите замечания, благодарности, ругательства.

п.с Качает не только посты по тегам, но и просто фендомы, и даже комментарии пользователя, в общем походу все, где есть картинки и постраничность.


Подробнее
I A Не за1Щ|П1|П|1п *■ anime.reactor.cc/tag/Anime+Cosplay Главная > фэндомы > Anime > Anime Cosplay Anime Cosplay + подписаться По щисчиков: 955 Сообщений: 13072 Рейтинг постов: 92,305.6 Косплей (яп. =1 Основными прсфтипами i| детально воссоз "Макияжа и дииилни Q заблокировать * E:\Joyloader\joyloader.exe 7° U косу демонстрируется с максим Это парсер сайта joyreactor.cc - Собирает картинки, качает их в папку, перелистывает по страницам, пока те не кс - Плашка с логотипом реактора у картинок не удаляется - В файл log.txt записываются адреса сканов на случай ошибки Папка: Anime Cosplay Ссылка: http://anime.reactor.cc/tag/Anime+Cosplay anime.reactor.cc - PARSE URL: http://anime.reactor.cc/tag/Anime+Cosplay mokoiscat-Anime-Art-artist-Fujiwara-no-Mokou-7232411.jpeg mokoiscat-Anime-Art-artist-Fujiwara-no-Mokou-7232412.jpeg mokoiscat-Anime-Art-artist-Fujiwara-no-Mokou-7232413.jpeg mokoiscat-Anime-Art-artist-Fujiwara-no-Mokou-7232414.jpeg mokoiscat-Anime-Art-artist-Fujiwara-no-Mokou-7232415.jpeg mokoiscat-Anime-Art-artist-Fujiwara-no-Mokou-7232416.jpeg mokoiscat-Anime-Art-artist-Fujiwara-no-Mokou-7232417.jpeg Annie-Leonhardt-Shingeki-no-Kyojin-Anime-фэндомы-7227604.jpeg
joyreactor,реактор скачать,парсер,Joyloader
Развернуть
Если вдруг на реакторе что-то взорвется или кусок отскочит с этой штучкой можно стать фендомным мессией, Клио-с-реактора или архивариусом с политикой унижения. ...Так, просто мысли о будущем.
это нужно чтобы разом скачать весь тег? или че? просто... как бэ
Пиши — — 5r.CC/p¡CS Anime Cosplay + подписаться Подписчиков: 955 Сообщений: 13072 Рейтинг постов: 92,305.6 О заблокировать Косплей (яп. □ Л У Открыть в новой вкладке Открыть в новом окне Открыть в приватном окне Копировать адрес ссылки Сохранить ссылку как... Добавить ссылку в закладки
а. все. увидел. ебать.
пишет, что не хватает api-ms-win-core-path-l1-1-0.dll
Это хз. У меня работает. Обычная винда десятка, без каких-то изощрений.
надо видимо для вин7 какой-то пакет разработчика питона ставить?
Погодь. Меня тут в вируснутости обвинили. Пока отбой. Я решу эту проблему сначал, отпишусь. Пока архив с диска удалю.
касперский говорит все чисто
Что-то я не очень понял. Своим почистил. Сначала что-то нашло. Перекомпилировал, проверяю и все чисто. Ладно, обновил и открыл файл обратно, пусть будет.

По твоей проблеме попробовал глянуть на мой компилятор, может там можно версию винды выбрать или что-то такое, но ничего не увидел (хотя не особо и шарю).
Для Win7 надо компилировать на Win7. А если будешь на Win10 использовать, то на Win10. Не эксперт, но я только такое решение в интернетах нашёл.
Достаточно выбрать нужный профиль (пакет библиотек) для компиляции под нужную версию винды. На 10-ке точно можно собрать работающую сборку для 7-ки.
groser groser 02.03.202217:25 ответить ссылка 0.0
Я компилю на auto-py-to-exe. Погуглил, народ жалуется что не получается сделать универсальный экзешник.
iNji iNji 02.03.202217:32 ответить ссылка 0.0
скачал длл, теперь выдает такое и через секунду закрывается
V Г-Г
уже есть
Может да, надо питона обновить
Под семёрку последний питон - 3.8.
И для нормального отображения юникода советую вместо семёрошной консоли юзать https://conemu.github.io
п.п.с log.txt имеется в виду, что если оборвется, то знать на какой ссылке это произошло. Может инет отвалился или что-то такое, что можно исправить и запустить скачивание дальше. Вот можно взять последнюю ссылку из файла и продолжить.
А отвалиться может легко. Так как особо не тестено. Что-то получилось предусмотреть, но наверняка еще есть варианты оборвать скачивание.
Внес небольшие правки, чтобы плашка реактора отрезалась, если есть желание можешь перезалить.
Вот так я впервые и прикоснулся к питону.

https://pastebin.com/i4qGpcdy
P.S. FLCL coding squad лол
Юзаем питон на коленке
iNji iNji 01.03.202222:57 ответить ссылка 0.0
А теперь руки помой)

Спасибо, оригинальное решение)) 14 пикселей для человека, гигантский скачок для человечества!
Обновил архив.

Давно тебя видно не было =-=
Ну решение - не решение, да и на гифки не работает, а всяко людям потом руками не обрезать)

Таки да, давненько, много чего в жизни произошло, и только начал нормально голову лечить да жизнь в порядок приводить, как вдруг ХЕРАК
Зачем обрезать, если можно отправлять нужные заголовки для авторизации и качать без плашки. Заодно станут доступными картинки из разделов только для зарегистрированных.
А если серьезно если время будет и iNji раньше не запилит, то сделаю, просто это уже не две строчки кода
Так по идее одна строчка, там же вроде только рефер нужен. То есть
img_data = requests.get(img.attr("src"), headers={"referer": "http:\\joyreactor.cc"}).content
Там ниже с плашками вроде разобрались. Обновил еще.
Автору спасибо!
gifs = d(".image span a.video_gif_source")
for gif in gifs.items():
nm = unquote(gif.attr("href").split("/")[-1])
for c in md: nm = nm.replace(c, "")
print(nm)
gif_data = requests.get(gif.attr("href")).content
with open(loadDir +'/'+ nm, 'wb') as handler: handler.write(gif_data)

А вот этот кусок должен гифки грузить?
krasukov krasukov 02.03.202206:32 ответить ссылка 0.0
Да. Разве что до него код который jpg png грузит, грузит и предпросмотр гифки, и по идее стоит смотреть, что если есть с таким именем, то оставлять только гифку.
Хех. Я не так давно скрипт писал, чтобы избранное выкачать. Твой не смотрел, но думаю, что он менее говнокод чем мой.

Вот сам скрипт: https://pastebin.com/sBdxUiFN
не скачивает с тегом секретные разделы, как быть? о.о
Видимо не качает то что не видно без регистрации.
Ждать когда twilightsparkle что-то более понтовое выкатит.
Я питон не знаю, но попробовал погуглить на скорую руку.

Ты пробовал заменить
img_data = requests.get(img.attr("src")).content
на
img_data = requests.get(img.attr("src"), headers={"Referer": img.attr("src")}).content
чтобы картинки грузились без вотермарки?
Я даже не знал как это загуглить)
Спасибо, помогло, с этим способом все, и картинки и гифки грузятся без плашек.
Перезалил архив на диск.
Вечером еще пост сделаю с этими обновлениями. Может еще сделаю фильтр по рейтингу для скачивания. Пока в пост добавил еще тег Joyloader, чтобы было в куче.
Я знал про необходимость заголовка, а нагуглить, как в питоне добавлять заголовки в запрос, оказалось минутным делом.

Referer - это HTTP-заголовок, в котором клиент (браузер или твоя прога) рассказывает серверу (сайту), откуда он перешел на данный ресурс (картинку, страницу).

Реактор и ряд других сайтов форсят вотермарки в случае хотлинка (когда картинка на целевом сайте вставляется напрямую с сайта-источника), чтобы если уж целевой сайт экономит ресурсы по хранению изображений, пользуясь хранилищем другого сайта, то хотя бы его посетители будут видеть первоисточник. Побочный эффект: программы скачивания, которые не знают про Referer, тоже получают изображение с вотермаркой.

Добавление заголовка Referer заставляет реактор думать, что ты перешел на картинку, просматривая реактор, вотермарка не добавляется.

P.S. Даже элегантнее сделать {"Referer": url} вместо {"Referer": img.attr("src")}. Последний вариант хорош только для случаев, когда тебе заранее неизвестен контекст - страница, на которой размещено изображение.
чивойта?
Из избранного качает?
Да
Позабавила строка 67 в коде - "time.sleep(5) # не меняй, ато палучиш пожопе"
Её можно изменить, если добавить в коде Multiprocessing и приобрести несколько прокси, что конечно же никто делать не будет.
Хотя я именно так джой-статистику собираю.
Prestan Prestan 02.03.202212:39 ответить ссылка 1.3
Кто покажет мне, где именно я рукожопый пидр?
- Плашка с логотипом реактора у гифок не удаляется - В файл log.txt записываются адреса сканов на случай ошибки Папка: Elena Koshka Ссылка: http://joyreactor.cc/tag/Elena+Koshka joyreactor.cc http://joyreactor.cc/tag/Elena+Koshka --- PARSE URL \ем --- PARSE URL \ем --- PARSE URL \ем ---
Всё, разобрался, это из-за того, что из-за того, что гифки на страницах.
Чёрт, капец как удобно, я раньше часами картинки скачивал. iNji - моё к тебе уважение!
Картинки отлично скачивает, но если натыкается на гифку, стопориться и зацикливается(
Там обнови архив. Уже есть вариант без плашек.
iNji iNji 02.03.202213:54 ответить ссылка 0.0
Зачем? Есть же KellyC Image Downloader
http://joyreactor.cc/post/4650258
Ты пост читал? Или сразу пишешь?
У меня проще.
Он неплох когда надо со страницы все скачать. Но по страничкам ходить и выкачивать все по тегу он не умеет. Эта приложуха проще и по страничкам ходит.
Да не, там тоже работает. Я себе 3гб бельишка накачал. Но пока разобрался как именно это сделать, немного устал.
Ну я так и не разобрался( так что жду когда этот скрипт начнет гифки и секретки качать)
Ну мой гифки качает.
А секретки это в плане еротику? Еротику качает вроде.
iNji iNji 02.03.202220:40 ответить ссылка 0.0
Да вот что-то нет. Запускаю скрипт по тегам из секретных разделов, а он только "технический пост" качает картинку и дальше никак.
я обычно на JS 20-40 строк пишу - подгружаю странички, выковыриваю url картинок и формирую новый body, напичканый только картинками, удаляя стили, скрипты. когда картинки загрузятся - просто сохраняю страницу. так без плашек получается, ну и не больше нескольких тысяч картинок за раз, ибо RAM может не хватить.

на некоторых сайтах не очень работает (pixiv, например): при сохранении браузер начинает повторно запрашивать у ресурса картинки, при этом невозможно управлять паузами между скачиванием, ресурс после 20-50 картинки немножко банит IP скачивающего, в итоге только часть картинок сохраняется.
выход - после получения каждой картинки переводить её в base64 и прописывать в src, тогда html-файл получится весом в сотни мегабайт, но картинки лишь раз запрашиваются у сервера, потом из html их можно питончиком в несколько строчек выпарсить.
если кто-то в курсе как сказать браузеру (любому, кроме IE) чтобы он картинки брал из своего кеша, а не снова загружал при сохранении страницы - буду очень благодарен.
Приблизительно такой вот скрипт на скорою руку для консоли:

https://pastebin.com/rS77bHy0

Выкачивает и с секреток, без плашек. Чтобы из комментариев ещё сохранять - это нужно каждый пост отдельно грузить. Может, API есть, помнится - что-то такое было, тогда можно не грузить кучу ненужного html.

Можно сделать юзерскрипт, с кнопкой, получением URL автоматически и т.п.
11-я винда.

Запускаю прогу, прописываю папку, ссылку. Жму Enter.

Создаётся папка, файл с логом. Но скрипт не срабатывает и просто закрывается. Что не так?
Джой перешел на https и скрипт поломался.
Починил, вроде снова работает, обновил архив на диске v1.4
Так. Скрипт работает, но из секретных разделов не качает, только обычный арт.

Пытаюсь запарсить тег D-rex, видно по скачиваемым артам.
Да, то что в инкогнито не открывается, не качает вроде.
А ещё скрипт закольцован. По кругу пробегает все страницы.

Блин, а ведь парсер-то ради секретных разделов и нужен был :)
Он закольцован до тех пор, пока находит ссылку со следующей страницей. Как только не находит, то прекращает сканирование и выходит.

Сорян за секретные разделы :( . Попробуй другие варианты по тегу "парсер".
Не знаю, у меня он 39 страниц кругов на 10 пробежал, я специально проверил.

Да я уж нашёл те, о которых тут речь и шла в общем-то. Тебе спасибо, что починил свой, комиксы так и эдак буду им качать.

Успехов!
Только зарегистрированные и активированные пользователи могут добавлять комментарии.
Похожие темы

Похожие посты
У JoySaveO.33 Главная Настройки Debug Помощь Файл API □ X Старт Стоп № -1 - - Начало 6500 * Конец 7003 * Сейчас 0 - - No Адрес Начало Конец Папка Искл. теги 00 https://joyreactor.cc/tag/rn<|>Kn 6500 7003 gif 01 котэ/best 1 0 котики/best 02 https://joyreactor.cc/tag/geek 1 50 geek
подробнее»

joyreactor парсер реактор скачать JoySave

У JoySaveO.33 Главная Настройки Debug Помощь Файл API □ X Старт Стоп № -1 - - Начало 6500 * Конец 7003 * Сейчас 0 - - No Адрес Начало Конец Папка Искл. теги 00 https://joyreactor.cc/tag/rn<|>Kn 6500 7003 gif 01 котэ/best 1 0 котики/best 02 https://joyreactor.cc/tag/geek 1 50 geek
• • • Ф JoySave 0.32 Главная Настройки Помощь Старт Стоп Файл № -1 Начало 1255 |§ Конец 1256 ___£ Сейчас О No Адрес Начало Конец Папка Искл. теги 00 https://joyreactor.cc/tag/rn<t>KH 7003 gif 01 https://joyreactor.ee/tag/KOT3/best 100 cat/котики/вып 02 https://joyreactor.cc/tag/geek 50 geek
подробнее»

joyreactor парсер реактор скачать JoySave

• • • Ф JoySave 0.32 Главная Настройки Помощь Старт Стоп Файл № -1 Начало 1255 |§ Конец 1256 ___£ Сейчас О No Адрес Начало Конец Папка Искл. теги 00 https://joyreactor.cc/tag/rn<t>KH 7003 gif 01 https://joyreactor.ee/tag/KOT3/best 100 cat/котики/вып 02 https://joyreactor.cc/tag/geek 50 geek
JoySave 0.31 л _ □ X Главная Настройки Помощь Старт Стоп Файл Ж 1 ’W Начало Ж 1 ’W Конец 100 ’W Сейчас Ж 6 ’W No Адрес Начало Конец Папка Искл. теги 00 https://blizzard.reactor.ccAag/Starcraft 1 150 star_craft 1 01 котэ/best 1 100 cat/best манул 02 https://joyreactor.ccAag/geek 50 geek
подробнее»

joyreactor парсер реактор скачать JoySave

JoySave 0.31 л _ □ X Главная Настройки Помощь Старт Стоп Файл Ж 1 ’W Начало Ж 1 ’W Конец 100 ’W Сейчас Ж 6 ’W No Адрес Начало Конец Папка Искл. теги 00 https://blizzard.reactor.ccAag/Starcraft 1 150 star_craft 1 01 котэ/best 1 100 cat/best манул 02 https://joyreactor.ccAag/geek 50 geek