Journal | [J] 计算机系统网络和电信 Volume 1, Issue 3. 2019.
浅析网络爬虫的关键技术
作者 : 毛 红霞
摘要 / Abstract
大数据已经渗透到当今每一个行业和业务职能领域
,
成为重要的生产因素
在海量数据中高效率
准确地获取有效数据
,
越来越得到关注
运用网络爬虫技术能够快速
高效地获取大量数据
本文介绍了
基于
Python
的网络爬虫所涉及到的关键技术
:
爬虫架构
爬取策略
、Python
中实现
HTTP
请求
、Python 中实现网页解析
、Python
爬虫框架
并针对网站的常用的反爬策略制定了相应的应对措施
关键词 / Keywords
Python;网络爬虫;爬取策略
《中国学术期刊(光盘版)》电子杂志社有限公司 KDN平台基础技术由KBASE 11.0提供