Массовая печать web-страниц

Милованов Ю.С
На сайте с 24.01.2008
Offline
196
861

Хелло, Камрады.

Не знал в какой раздел написать и решил, что написать лучше в свой родной;)

Задача следующая:

Есть список урлов(как правило не более 100). Каждый УРЛ это 1 страница А4 и не более!

Нужно их сунуть в какой-нить софт и нажать кнопку печать.

В итоге с принтера должно вылезти кол-во листов равное кол-ву УРЛов.

Гуглояндексы не помогли;(

Надеюсь на Вас;)

Подпись))
Оптимизайка
На сайте с 11.03.2012
Offline
396
#1

cat, xargs, wkhtmltopdf, pdfunite, ..., profit!

⭐ BotGuard (https://botguard.net) ⭐ — защита вашего сайта от вредоносных ботов, воровства контента, клонирования, спама и хакерских атак!
SeVlad
На сайте с 03.11.2008
Offline
1609
#2
Милованов Ю.С:
Надеюсь на Вас

Хм.. такого не встречал, но на вскидку - по идее можно в том же ворде макросами обойтись.

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
Милованов Ю.С
На сайте с 24.01.2008
Offline
196
#3
Оптимизайка:
cat, xargs, wkhtmltopdf, pdfunite, ..., profit!

А че нить для мастДайщиков есть в асортименте?;)

TF-Studio
На сайте с 17.08.2010
Offline
334
#4

попробовать на селениум/фантоме? вероятно есть.

сначала вызвать, потом сделать скрин и картинки уже печатать

$link = $driver->get($url);
$pics = $driver->takeScreenshot('12.png');

я так делал, работает.

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).
[Удален]
#5

Да, надо написать скрипт, который будет кушать список урлов, генерить для него сценарий для selenium, откуда взять картинки и этот список картинок распечатать. Оптимальный вариант мне кажется, по крайней мере отображение будет предсказуемым, если же юзать html2pdf и т.п. утилиты то на современных сайтах, получится что-то страшненькое.

S1
На сайте с 03.09.2015
Offline
2
#6

Я пользуюсь макросами в ворде. Но с веб-страницами система сильно тормозит.

[Удален]
#7

В общем да, впаре с селениумом можно сделать, написал на python скрипт, на выходе имеем вот такой pdf: https://yadi.sk/i/eDHjC_dcjtiym. Пока делал подумал, что таким образом можно делать мониторинг сайтов конкурентов да и своих после deploy особенно если исползуется куча шаблонов и все промониторить мышкой слишком рутинно.

Сам код:


# -*- coding:utf-8 -*-

from selenium import webdriver
driver = webdriver.Firefox()

from fpdf import FPDF
pdf = FPDF('L','mm','A4')

def main():
outpics = []
for i, url in enumerate(open( 'urls.txt' ).readlines()):
try:
url = url.strip()
driver.get( url )
filename = str(i) + ".png"
driver.save_screenshot(filename)
outpics.append( filename )
except:
print ( u'passed: ' + url )

for image in outpics:
pdf.add_page()
pdf.image(image,0, 0, 270)

pdf.output("result.pdf", "F")


if __name__ == "__main__":
main()

чтобы работало должен стоять python, python-selenium, fpdf ( через pip ), рядом должен лежать файл urls.txt со списком урлов:


http://yandex.ru
http://avito.ru
http://loopy.ru
http://ozon.ru
http://twitter.com

после отработки рядом будут лежать result.pdf и png с именами 1, 2, ... номер его url в файле.

ДП
На сайте с 23.11.2009
Offline
203
#8

Так wkhtmltopdf есть под винду, зачем селениум тогда нужен?

http://wkhtmltopdf.org/downloads.html

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий