Python网络爬虫
一般性附注:高等职业教育“互联网+”新形态教材·人工智能技术应用专业 新目录新专标 工作手册式教材
读者对象:本书适用于应用型本科、高职高专院校大数据技术、人工智能技术应用专业学生
本书围绕Python网络爬虫技术及相关框架,以学习情境方式介绍了基于静态网页的爬虫技术及相关框架,如Requests、BeautifulSoup4、XPath、CSV和PyMySQL;基于动态网页的爬虫技术及框架,如Scrapy、Selenium、JSON、PhantomJS和Pillow;基于App应用的爬虫技术与应用软件,如Fiddler;反爬虫策略,如用Headers模拟浏览器,用Cookies记录身份信息;通过结合Scrapy和Redis提高网络爬虫的效率、安全性及数据一致性。