ctrl+shift+p filters: :st2 :st3 :win :osx :linux
浏览

Scrapy

marco-lavagnino 所有

Sublime Text的Scrapy插件

详细信息

  • 0.1.0
  • github.com
  • github.com
  • 8年前
  • 2小时前
  • 8年前

安装量

  • 总计 2K
  • Win 1K
  • Mac 391
  • Linux 311
2023年8月6日 2023年8月5日 2023年8月4日 2023年8月3日 2023年8月2日 2023年8月1日 2023年7月31日 2023年7月30日 2023年7月29日 2023年7月28日 2023年7月27日 2023年7月26日 2023年7月25日 2023年7月24日 2023年7月23日 2023年7月22日 2023年7月21日 2023年7月20日 2023年7月19日 2023年7月18日 2023年7月17日 2023年7月16日 2023年7月15日 2023年7月14日 2023年7月13日 2023年7月12日 2023年7月11日 2023年7月10日 2023年7月9日 2023年7月8日 2023年7月7日 2023年7月6日 2023年7月5日 2023年7月4日 2023年7月3日 2023年7月2日 2023年7月1日 2023年6月30日 2023年6月29日 2023年6月28日 2023年6月27日 2023年6月26日 2023年6月25日 2023年6月24日 2023年6月23日
Windows 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
Mac 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Linux 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Readme

源代码
raw.githubusercontent.com

Scrapy的Sublime Text代码片段

此软件包提供方便的代码片段,用于与scrapy(用于制作网络爬虫的Python工具)一起工作。它还提供了一系列用于解析来自Postman的请求参数的命令。

安装

将此软件包克隆到您的 Packages/ 目录中。尚未支持包管理工具 :)

代码片段

代码片段假设您的爬虫具有一个 BASE_URL 属性。这防止了代码重复,并使得代码在网站更改基础URL时易于移植。

提供了最常见请求的代码片段:- 获取(Get):用于发送带有URL请求参数的请求,例如 mysite.com?parameter=value - POST:用于 X-www-Form-Urlencoded 请求 - JSON:用于 application/json 内容类型的POST请求 - 一个 'redirect' 方法,用于在没有参数的情况下发送GET请求。 - 一个 'last' 方法,在浏览器中打开接收到的响应并启动ipdb外壳,用于调试响应或与xpath进行交互。 - 一个ASP参数提取器,用于轻松地从响应中获取 __VIEWSTATE__VIEWSTATEGENERATOR__EVENTVALIDATION

命令

从Postman格式化

如果您正在使用Postman检查您对网站的请求,您可以在 'bulk-edit' 模式下复制粘贴参数,然后粘贴到您的爬虫中。然后,选择您刚才粘贴的所有行,并从命令调色板中执行 Scrapy: Format from Postman。参数将被格式化为Python字典的键和值。

实例项

在您的爬虫中复制一个项目类定义。然后,选择类定义的所有行,并执行 Scrapy: Yield Item。定义将被格式化为一个 yield ClassInstance() 语句。