教程集 www.jiaochengji.com
教程集 >  Python编程  >  python爬虫进阶  >  正文 Python3爬虫利器:Scrapyrt的安装(Scrapy分布式)

Python3爬虫利器:Scrapyrt的安装(Scrapy分布式)

发布时间:2020-12-02   编辑:jiaochengji.com
教程集为您提供Python3爬虫利器:Scrapyrt的安装(Scrapy分布式)等资源,欢迎您收藏本站,我们将为您提供最新的Python3爬虫利器:Scrapyrt的安装(Scrapy分布式)资源

Scrapyrt为Scrapy提供了一个调度的HTTP接口,有了它,我们就不需要再执行Scrapy命令而是通过请求一个HTTP接口来调度Scrapy任务了。Scrapyrt比Scrapyd更轻量,如果不需要分布式多任务的话,可以简单使用Scrapyrt实现远程Scrapy任务的调度。

1. 相关链接

GitHub:https://github.com/scrapinghub/scrapyrt

官方文档:http://scrapyrt.readthedocs.io

2. pip安装

这里推荐使用pip安装,命令如下:

pip3 install scrapyrt

接下来,在任意一个Scrapy项目中运行如下命令来启动HTTP服务:

scrapyrt

运行之后,会默认在9080端口上启动服务,类似的输出结果如下:

scrapyrt
2017-07-12 22:31:03 0800 [-] Log opened.
2017-07-12 22:31:03 0800 [-] Site starting on 9080
2017-07-12 22:31:03 0800 [-] Starting factory <twisted.web.server.Site object at 0x10294b160>

如果想更换运行端口,可以使用-p参数,如:

scrapyrt -p 9081

这样就会在9081端口上运行了。

3. Docker安装

另外,Scrapyrt也支持Docker。比如,要想在9080端口上运行,且本地Scrapy项目的路径为/home/quotesbot,可以使用如下命令运行:

docker run -p 9080:9080 -tid -v /home/user/quotesbot:/scrapyrt/project scrapinghub/scrapyrt

这样同样可以在9080端口上监听指定的Scrapy项目。

python学习网,免费的在线学习python平台,欢迎关注!

本文转自:https://cuiqingcai.com/5456.html

您可能感兴趣的文章:
Python3爬虫利器:Scrapyrt的安装(Scrapy分布式)
Python3爬虫利器:Scrapy-Redis的安装
Python3爬虫利器:Gerapy模块的安装(Scrapy分布式)
Python 爬虫学习系列教程
Python3爬虫利器:Scrapyd API的安装(Scrapy分布式)
Python3爬虫利器:Scrapy-Splash的安装
Python3爬虫利器:Scrapy的安装
python中的scrapy框架是什么?为什么要学?
python爬虫中选scrapy框架的优势有哪些?
Python3爬虫入门:Scrapy 框架

[关闭]
~ ~