| View Comments ]


上图是通过下面搜索页面的源代码用来进行post操作


data = urllib.urlencode([('srchmem',username)])
req = urllib2.Request(url)
fd = urllib2.urlopen(req,data)

主要是为了获取post相对应的用户名的变量值


最终获取的HTML页面运行效果如下,图有些小,点击可看大图

源码是根据书籍《Python Network programming 》源代码改写而成,因为刚刚接触现在只做到了输入用户名然后取得相应的HTML文件,而对于HTMLParser还不是很了解,感觉起来是不是所有的tag解析都需要重写函数呢,而如果我要获取积分值,在HTML中有很多表格元素,如何做到精准解析还待考虑。还有对于cookies操作以及如何进行编码设定,让网页内容显示为gb2312而非utf-8呢?

还有很多东东要学习啊!


请依照版权声明(Copyright ©)中所述分享本站资源,给我留言


BloggerAdsShareapic 替自已加薪

-------------------------------------------------------
View my FriendFeed


查看邮件也能赚钱 Iphone3G B 005 468x60


blog comments powered by Disqus