Scrapy教程

Scrapy 定义项目

说明

项目是用于收集从网站上抓取的数据的容器。您必须通过定义您的项目来启动您的爬虫。要定义项目,请编辑目录 first_scrapy(自定义目录)下的 items.py 文件。 items.py 如下所示-
import scrapy  
class First_scrapyItem(scrapy.Item): 
   # define the fields for your item here like: 
      # name = scrapy.Field()
MyItem 类继承自 Item,其中包含许多 Scrapy 已经为我们构建的预定义对象。例如,如果您想从站点中提取名称、URL 和描述,您需要为这三个属性中的每一个定义字段。
因此,让我们添加我们想要收集的项目-
from scrapy.item import Item, Field  
class First_scrapyItem(scrapy.Item): 
   name = scrapy.Field() 
   url = scrapy.Field() 
   desc = scrapy.Field() 
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4