Допустим, вы хотите почитать на досуге, скажем, в метро, комикс The Order of the Stick. Для этого нужно выкачать его целиком. Что вы предпочтёте — короткий скрипт на любимом языке или wget -r -A=gif
?
Я выбрал скрипт на питоне, вышло 30 строчек.
from urllib import urlopen, urlretrieve from os.path import exists from os import rename import re
urlt = "http://www.giantitp.com/comics/oots%04d.html" regexp = r'<IMG src=\"(\/comics\/images\/\w+.gif)"'
for i in range(1, 740): print "%4d =>" % i, outf = "%04d.gif" % i if exists(outf): print "already downloaded" continue pageurl = urlt % i h = urlopen(pageurl) data = h.read() mo = re.search(regexp, data) if not mo: print "can't find gif in page" continue imgurl = "http://www.giantitp.com" + mo.group(1) print imgurl, urlretrieve(imgurl, "temp.file") rename("temp.file", outf) print "- saved to", outf
Тэги: python
Комментариев нет
← | Впечатления от перехода с Windows Mobile на Android | Прогулка по Измайловскому парку | → |