1
0
Fork 0
mirror of https://github.com/tldr-pages/tldr.git synced 2025-04-23 06:02:08 +02:00
tldr/pages.zh/common/scrapy.md
Leo d3652e046f
scrapy: add Chinese translation (#13243)
Co-authored-by: Jack Lin <blueskyson1401@gmail.com>
2024-07-10 19:29:18 +02:00

737 B

scrapy

Web 爬取框架。 更多信息:https://scrapy.org.

  • 创建一个项目:

scrapy startproject {{项目名}}

  • 创建一个爬虫(在项目目录下):

scrapy genspider {{爬虫名}} {{站点域名}}

  • 编辑爬虫(在项目目录下):

scrapy edit {{爬虫名}}

  • 运行爬虫(在项目目录下):

scrapy crawl {{爬虫名}}

  • 抓取一个网页并将它的网页源码打印至标准输出:

scrapy fetch {{url}}

  • 使用默认浏览器打开给定的 URL 来确认是否符合期望(为确保准确会禁用 JavaScript):

scrapy view {{url}}

  • 通过给定的 URL 打开交互窗口,除此之外还支持 UNIX 风格的本地文件路径:

scrapy shell {{url}}