分享

欢迎您访问本站首页笑话数码汽车珠宝手机购车首饰美妆装修厨房科普编程导购空间导购百科知道词典繁体王朝搜索

当前位置: 王朝网络 >> 王朝知道 >> 电脑/网络 >> 程序设计 >> 其他编程语言 >> 按楼号保存图片！用python怎么实现？

按楼号保存图片！用python怎么实现？

王朝知道·作者佚名 2009-08-01

宽屏版字体: 小|中|大|超大

分类: 电脑/网络 >> 程序设计 >> 其他编程语言

问题描述:

按楼号保存图片！用python怎么实现？

我要把k68上2128号任务所有的作品全部保存到硬盘上

比如三楼的作品是jpg就命名为3.jpg(如果是gif格式存为3.gif)

四楼的作品存为4.jpg

如果同一楼有多个作品，比如39楼，第一个作品就命名为39-1.jpg

第二个就是39-2.jpg

以此类推。。。。

k68 2128号任务连接：http://www.k68.cn/PostViewMission.asp?dMode=0&PostPage=1&BoardID=1001&imageID=34314&page=1&imageNum=1&SearchWords=&sstype=1&rmd=19260

参考答案:

这种情况用正则表达式最恰当。

注意：程序运行完毕后，note.txt 将记载所有程序找不到图片链接的楼号及相关的页面链接，

你必须自己鉴定那些楼里是否真的没有图片。估计有少于十层其实是有图片的(链接太不规律所致): 你自己储存好了。

# -*- coding: utf-8 -*-

import urllib, re, time

URLTemplate = '' + \

'&BoardID=1001&imageID=34314&page=1&imageNum=1&SearchWords=&sstype=1&rmd=19260'

pageURLs = [ URLTemplate % pageNum for pageNum in range( 1, 155 ) ]

startTime = time.time( )

noteFile = open( 'note.txt', 'w' )

savedFileCount = 0

print '\nInitializing... (will complete shortly)',

for pageURL in pageURLs :

pageSource = urllib.urlopen( pageURL ).read( )

splitted = re.split( '<b>(\d+)楼', pageSource )[ 1 : ]

for i in range( len( splitted ) ): # for each floor

if not i % 2: # floor numbers in even posistions, floor source in odd positions

floorNumber = splitted[ i ]

pictureURLPattern = r'(?<=href=")[^? ]+?\.\w{3}(?="\s*target)'

pictureURLs = re.findall( pictureURLPattern, splitted[ i + 1 ] )

if not pictureURLs:

note = 'no picture URL found at floor #%s on this page:\n%s\n' % ( floorNumber, pageURL )

print >> noteFile, note

else:

if len( pictureURLs ) == 1:

fileName = floorNumber + pictureURLs[ 0 ][ -4 : ]

urllib.urlretrieve( pictureURLs[ 0 ], fileName )

else:

for pictureNumber, pictureURL in enumerate( pictureURLs ):

fileName = '%s-%d%s' % ( floorNumber, pictureNumber + 1, pictureURL[ -4 : ] )

urllib.urlretrieve( pictureURL, fileName )

savedFileCount += len( pictureURLs )

print '\rSo far, %d files saved, floor # %s reached.\t\t\t\t' % ( savedFileCount, floorNumber ),

print '\n\nAll done! Saved %d files, took %.1f minutes.' % ( savedFileCount, ( time.time( ) - startTime ) / 60 )

点击展开全文

小贴士：① 若网友所发内容与教科书相悖，请以教科书为准；② 若网友所发内容与科学常识、官方权威机构相悖，请以后者为准；③ 若网友所发内容不正确或者违背公序良俗，右下举报/纠错。

免责声明：本文为网络用户发布，其观点仅代表作者个人观点，与本站无关，本站仅提供信息存储服务。文中陈述内容未经本站证实，其真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

没有找到您想要的？点此查看更多相关文章
相关文章▶

如何用java替换看不见的字符比如零宽空格十六进制U+200B
干货 2023-09-10

网页字号不能单数吗，网页字体大小为什么一般都是偶数
干货 2023-09-06

java.lang.ArrayIndexOutOfBoundsException: 4096
干货 2023-09-06

Noto Sans CJK SC字体下载地址
干货 2023-08-30

window.navigator和navigator的区别是什么？
干货 2023-08-23

js获取referer、useragent、浏览器语言
干货 2023-08-23

oscache遇到404时会不会缓存？
干货 2023-08-23

linux下用rm -rf *删除大量文件太慢怎么解决？
干货 2023-08-08

刀郎新歌破世界纪录！
娱乐 2023-08-01

js实现放大缩小页面
干货 2023-07-31

生成式人工智能服务管理暂行办法
百态 2023-07-31

英语学习：过去完成时The Past Perfect Tense举例说明
干货 2023-07-31

Mysql常用sql命令语句整理
干货 2023-07-30

科学家复活了46000年前的虫子
探索 2023-07-29

英语学习：过去进行时The Past Continuous Tense举例说明
干货 2023-07-28

meta name="applicable-device"告知页面适合哪种终端设备：PC端、移动端还是自适应
干货 2023-07-28

只用css如何实现打字机特效？
百态 2023-07-15

css怎么实现上下滚动
干货 2023-06-28

canvas怎么画一个三角形？
干货 2023-06-28

canvas怎么画一个椭圆形？
干货 2023-06-28

canvas怎么画一个圆形？
干货 2023-06-28

canvas怎么画一个正方形？
干货 2023-06-28

中国河南省郑州市金水区蜘蛛爬虫ip大全
干货 2023-06-22

javascript简易动态时间代码
干货 2023-06-20

感谢员工的付出和激励的话怎么说？
干货 2023-06-18

>>返回首页<<

关注内容

静静地坐在废墟上，四周的荒凉一望无际，忽然觉得，凄凉也很美

© 2005- 王朝网络版权所有