当前位置: 首页 > news >正文

怎么弄数据库备份做网站seo公司上海

怎么弄数据库备份做网站,seo公司上海,网站怎么被收录,有没有做网站的多少钱scrapyd是一款可以用来管理scrapy爬虫的工具。它通过发送http请求来管理爬虫,控制爬虫项目的启停。 scrapyd在github上的地址为:https://github.com/scrapy/scrapyd 安装scrapyd pip install scrapyd 在shell或cmd中输入scrapyd,然后就可…

scrapyd是一款可以用来管理scrapy爬虫的工具。它通过发送http请求来管理爬虫,控制爬虫项目的启停。
scrapyd在github上的地址为:https://github.com/scrapy/scrapyd

安装scrapyd

pip install scrapyd

在shell或cmd中输入scrapyd,然后就可以在网页上通过127.0.0.1:6800查看你的爬虫项目了。页面如下:
scrapyd页面

要想将爬虫项目打包部署到scrapyd中,我们还需要安装scrapyd-client

pip install scrapyd-client

部署scrapyd

windows用户若要部署scrapyd,还需新建一个scrapyd-deploy.bat文件。该文件在相应python环境中下的python.exe同级目录中。
新建该文件的原因是windows环境中无法直接执行scrapyd-deploy(scrapyd-deploy是安装scrapyd时会安装到相应的python环境中)
scrapyd-deploy.bat内容为:

@echo off"E:\somehow\python\virtualenv\py3scrapy\Scripts\python.exe" "E:\somehow\python\virtualenv\py3scrapy\Scripts\scrapyd-deploy" %1 %2 %3 %4 %5 %6 %7 %8 %9

配置好之后,就能和linux用户一样使用scrapyd-deploy了。

  • 可以在命令行输入
scrapyd-deploy l

查看已经启动的scrapyd服务

  • 可以跳转到项目目录下,输入
scrapyd-deploy list

查看项目列表

接下来就是部署的一般步骤

  1. 修改scrapy.cfg文件,如要部署的project为DoubanSpider,命名为somehow,可以配置如下
[deploy:somehow]
url = http://localhost:6800/
project =DoubanSpider
  1. 将项目打包到scrapyd中,使用命令
scrapyd-deploy somehow -p DoubanSpider

如果打包结果类似

Packing version 1525356467
Deploying to project "DoubanSpider" in http://localhost:6800/addversion.json
Server response (200):
{"node_name": "somehow", "status": "ok", "project": "DoubanSpider", "version": "1525356467", "spiders": 5}

说明你的爬虫项目就部署好了。

通过http请求控制爬虫项目

可以通过在shell中发送http请求来控制爬虫项目的运行(非常可惜,一般情况下,windows不支持发送curl指令,可以尝试下载使用cmder来运行)。
scrapyd相关的api文档也很健全:http://scrapyd.readthedocs.io/en/stable/api.html。
这里简要列举出几个常用请求

启动project(同时设置下载延时)

curl http://localhost:6800/schedule.json -d project=DoubanSpider -d spider=douban -d setting=DOWNLOAD_DELAY=20

查看project状态

curl http://localhost:6800/daemonstatus.json

删除project

curl http://localhost:6800/delproject.json -d project=DoubanSpider

取消任务(job id为启动时返回的id)

curl http://localhost:6800/cancel.json -d project=DoubanSpider -d job=9218dc3648f611e8b7ec00163e0cf49e                  1

查看所有project

curl http://localhost:6800/listprojects.json

查看特定project具体的spider

curl http://localhost:6800/listspiders.json?project=DoubanSpider

查看job

curl http://localhost:6800/listjobs.json?project=DoubanSpider | python -m json.tool

查看所有上传到scrapy服务器上的project

curl http://localhost:6800/listprojects.json
http://www.wooajung.com/news/35105.html

相关文章:

  • 企业网站建设 价格青岛seo霸屏
  • 网站建设地带精准营销及推广
  • wordpress页面修改插件湖南seo服务
  • 华为云网站建设怎么设置选择项情感链接
  • 专业网站开发友情链接怎么弄
  • 私募网站建设网站seo视频
  • 亚马逊产品备案网站建设要求新闻稿代写
  • 怎样在谷歌上建设网站网站关键词怎么快速上排名
  • wordpress适合建什么网站开网站需要投资多少钱
  • 会员管理系统软件排名百度优化seo
  • 网站建设 任务网站怎么宣传
  • 土木工程毕设代做网站国外免费建站网站
  • 阿里云备案网站 网站名称怎么写快手seo
  • 荔湾做网站公分发平台
  • 贵州省城乡和住房建设厅网站seo是指什么岗位
  • 手机网站怎么改成电脑版关键词数据分析
  • 在线做动漫图的网站网络营销属于哪个专业
  • 阿里备案成功后怎么做网站官网设计公司
  • 智慧团建网站网址放心网站推广优化咨询
  • 网站有哪些费用多少武汉久都seo
  • 网站建设系统网站自助建站系统铜川网络推广
  • 网站建设付款方式百度智能云建站
  • 章丘网站建设如何搭建自己的网站
  • 中国互联网协会官方网站磁力下载
  • 高端奶茶加盟网站建设新手做外贸怎么入门
  • 学网站建设怎么样seo技术平台
  • 做网站是要云空间吗windows优化大师有用吗
  • 网站建设影音先锋网址词语搜索排行
  • 介绍政府网站的布局怎么seo网站关键词优化
  • 中国品牌设计50强seo网站推广