[星期五, 一月 09, 2009
|
View Comments
]
上图是通过下面搜索页面的源代码用来进行post操作
data = urllib.urlencode([('srchmem',username)])
req = urllib2.Request(url)
fd = urllib2.urlopen(req,data)
主要是为了获取post相对应的用户名的变量值
最终获取的HTML页面运行效果如下,图有些小,点击可看大图
源码是根据书籍《Python Network programming 》源代码改写而成,因为刚刚接触现在只做到了输入用户名然后取得相应的HTML文件,而对于HTMLParser还不是很了解,感觉起来是不是所有的tag解析都需要重写函数呢,而如果我要获取积分值,在HTML中有很多表格元素,如何做到精准解析还待考虑。还有对于cookies操作以及如何进行编码设定,让网页内容显示为gb2312而非utf-8呢?
还有很多东东要学习啊!
请依照版权声明(Copyright ©)中所述分享本站资源,给我留言
用BloggerAds 和 Shareapic 替自已加薪
-------------------------------------------------------
查看邮件也能赚钱
blog comments powered by Disqus