博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
预习任务:python 网络爬虫
阅读量:4926 次
发布时间:2019-06-11

本文共 353 字,大约阅读时间需要 1 分钟。

网络爬虫 web scraping :)

还得复习一下面向对象开发。python的。

视频地址:youtube的

还有有用的资料

貌似需要了解的东西有

urllib, urllib2, urlparse, BeautifulSoup, mechanize, cookielib 等等啦 这些库的掌握并不难,网络爬虫难的是你要自己设计压力控制算法,还有你的解析算法,还有图的遍历算法等。

还有一些比较有意思的东西:

Downloading Oil Prices from the Web in Python

 

还有这个

ParsingAndWritingTheSoup

 

 

转载于:https://www.cnblogs.com/spaceship9/archive/2013/03/28/2985859.html

你可能感兴趣的文章
MySQL常用函数
查看>>
[转帖]日本制裁韩国 全球闪存、内存芯片或许要重新涨价了
查看>>
关于SQL2005EXPRESS默认远程无法连接的解决
查看>>
React 16.x 新特性思维导图
查看>>
windows下开多个CMD窗口多个进程输出
查看>>
Ajax实现联想(建议)功能
查看>>
编译cef 2526
查看>>
JavaSE 学习笔记之Object对象(八)
查看>>
两天没有好好休息的感觉
查看>>
CSS H5布局
查看>>
iis7.5+win2008 出现 HTTP Error 503. The service is unavailable.
查看>>
python7
查看>>
python的and和or优先级
查看>>
if 调用common里的函数
查看>>
使用spring.net+nibernate时如何用aspnet_regiis加密数据库连接字符串
查看>>
UNION
查看>>
九.配置SMB共享(Samba共享)
查看>>
正则表达式
查看>>
Oracle RMAN Recover中使用BBED 跳过缺失的归档 继续 Recover 的测试
查看>>
定期备份脚本
查看>>