# 数据刮板

使用时 Crawling API 您将获得完整的页面 HTML,但如果您想取回已抓取的内容,则可以使用我们现有的任何可用抓取工具。对于不可用的抓取工具,您必须取回完整的 HTML 并自行抓取内容。

我们提供的抓取工具可让您直接从网站提取数据,而无需在使用我们的 Crawling API.

刮板是可选的,如果您使用没有任何刮板的 API,您总是可以取回页面的完整 HTML。

开始, 从侧边栏中选择一个刮刀 提取数据。 请 联系支持 如果您有问题或需要帮助。

# Amazon

要使用亚马逊刮板,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 获取任何亚马逊产品的价格、标题、可用性、描述、图像、评论和报价列表以及更多信息。

  • 从亚马逊获取结构化的 SERP 和格式化的畅销书搜索结果。

# 亚马逊产品详情

通用亚马逊产品页面详细信息的刮刀

API使用:

&scraper=amazon-product-details

示例输入 url(确保 url 已编码):

https://www.amazon.com/Apple-iPhone-Silicone-Case-MagSafe/dp/B0CHX2XFLN

输出示例:

# 亚马逊蛇

亚马逊搜索结果页面的刮刀,返回产品数组

API使用:

&scraper=amazon-serp

示例输入 url(确保 url 已编码):

https://www.amazon.com/s?k=games

输出示例:

# 亚马逊报价列表

通用亚马逊商品列表页面详细信息的刮板。

API使用:

&scraper=amazon-offer-listing

示例输入 url(确保 url 已编码):

https://www.amazon.com/gp/offer-listing/B07S5QWM6L

输出示例:

# 亚马逊产品评论

通用亚马逊产品评论页面详细信息的刮板。

API使用:

&scraper=amazon-product-reviews

示例输入 url(确保 url 已编码):

https://www.amazon.com/hz/reviews-render/ajax/medley-filtered-reviews/get/ref=cm_cr_dp_d_fltrs_srt?scope=reviewsAjax0&asin=B08PN7R2MZ&pageNumber=10

输出示例:

# 亚马逊畅销书

Scraper for Amazon Best Sellers 结果页面,返回产品数组。

API使用:

&scraper=amazon-best-sellers

示例输入 url(确保 url 已编码):

https://www.amazon.com/Best-Sellers-Electronics/zgbs/electronics

输出示例:

# 亚马逊新品发布

亚马逊新品发布页面的抓取工具,返回产品数组。

API使用:

&scraper=amazon-new-releases

示例输入 url(确保 url 已编码):

https://www.amazon.com/new-releases/handmade

输出示例:

# Google

要使用 Google 抓取工具,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 从 Google 获取结构化搜索结果,包括主要部分(广告、相关搜索结果、人们也问、零食包)。

# 谷歌-serp

用于 Google 搜索结果页面的 Scraper,返回结果数组

API使用:

&scraper=google-serp

示例输入 url(确保 url 已编码):

https://www.google.com/search?q=samsung+shops

输出示例:

# Facebook

Tips:

以下 Facebook 抓取工具可能更适合您的 JavaScript (JS) 令牌。 如果您的 TCP 令牌收到空响应,请改用 JS 令牌。

要使用 Facebook 抓取工具,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 从 Facebook 群组页面提取公共群组名称、描述、图像、提要及其相应评论以及其他详细信息。

  • 获取结构化和格式化的 Facebook 页面详细信息。

  • 提取个人资料名称、个人资料和封面图片、工作和教育、朋友数和其他名称相似的个人资料。

# 脸书组

通用 Facebook 群组页面详细信息的抓取工具

API使用:

&scraper=facebook-group

示例输入 url(确保 url 已编码):

https://www.facebook.com/groups/198722650913932

输出示例:

# 脸书页面

通用 Facebook 页面详细信息的抓取工具

API使用:

&scraper=facebook-page

示例输入 url(确保 url 已编码):

https://www.facebook.com/Amazon/

输出示例:

# Facebook个人资料

通用 Facebook 个人资料的刮刀

API使用:

&scraper=facebook-profile

示例输入 url(确保 url 已编码):

https://www.facebook.com/zuck

输出示例:

# Facebook 标签

Facebook 主题标签抓取工具

API使用:

&scraper=facebook-hashtag

示例输入 url(确保 url 已编码):

https://www.facebook.com/hashtag/robots

输出示例:

# facebook 事件

Facebook 事件抓取工具

API使用:

&scraper=facebook-event

示例输入 url(确保 url 已编码):

https://www.facebook.com/events/1543404119289643

输出示例:

# Instagram

Tips:

以下 Instagram 抓取工具可能更适合您的 JavaScript (JS) 令牌。 如果您的 TCP 令牌收到空响应,请改用 JS 令牌。

要使用 Instagram 抓取工具,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 从 Instagram 帖子中获取帖子和个人资料详细信息,包括媒体、主题标签、标题、位置及其相应回复。

  • 从主题标签页面中提取帖子详细信息。

# Instagram 帖子

通用 Instagram 帖子详细信息的刮刀

API使用:

&scraper=instagram-post

示例输入 url(确保 url 已编码):

https://www.instagram.com/p/B5LQhLiFFCX

输出示例:

# Instagram 个人资料

通用 Instagram 个人资料详细信息的刮刀

API使用:

&scraper=instagram-profile

示例输入 url(确保 url 已编码):

https://www.instagram.com/apple/

输出示例:

# Instagram标签

请注意:

这款 instagram-hashtag 由于 Instagram 的变更,抓取工具目前无法使用。我们正在努力修复,但目前尚无预计到达时间。

通用 Instagram 标签页面的抓取工具

API使用:

&scraper=instagram-hashtag

示例输入 url(确保 url 已编码):

https://www.instagram.com/explore/tags/love/

输出示例:

# instagram-reels-音频

通过特定的音频 URL 抓取 Instagram Reels 数据

API使用:

&scraper=instagram-reels-audio

示例输入 url(确保 url 已编码):

https://www.instagram.com/reels/audio/430642407673774

输出示例:

# LinkedIn

要使用 LinkedIn 抓取工具,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 从 LinkedIn 中提取个人资料经验、教育、活动、出版物、志愿服务和所有其他个人资料部分。

  • 从 LinkedIn 获取公司描述、员工的主要详细信息、位置和更多详细信息。

# linkedin资料

通用 LinkedIn 个人资料详细信息的刮刀

API使用:

&scraper=linkedin-profile

示例输入 url(确保 url 已编码):

https://www.linkedin.com/in/kaitlyn-owen

输出示例:

# 领英公司

通用 LinkedIn 公司详细信息的刮刀

API使用:

&scraper=linkedin-company

示例输入 url(确保 url 已编码):

https://www.linkedin.com/company/amazon

输出示例:

# 链接提要

用于通用 LinkedIn feed 的抓取工具,可将 feed 转换为 JSON 数据,从而实现高效分析和数据驱动决策。

API使用:

&scraper=linkedin-feed

示例输入 url(确保 url 已编码):

https://www.linkedin.com/feed/update/urn:li:activity:7022155503770251267

输出示例:

# Quora的

要使用 Quora 刮板,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 从 Quora 获取格式化的问题搜索结果。

  • 从 Quora 中提取问题详细信息,包括广告、wiki、标签、答案和相关问题。

# Quora 搜索引擎

请注意:

这款 quora-serp 由于 Quora 的变更,抓取工具目前不可用。我们正在努力修复,但目前尚无预计到达时间。

Tips:

要使用此抓取工具检索其他数据,请附加参数 &css_click_selector=.q-text.qu-cursor--pointer。 这将确保您最大限度地提取数据。

Quora 搜索结果页面的 Scraper,返回一系列问题

API使用:

&scraper=quora-serp

示例输入 url(确保 url 已编码):

https://www.quora.com/search?q=websitevoice

输出示例:

# 法定人数问题

通用 Quora 问题详细信息以及所有答案的抓取工具

API使用:

&scraper=quora-question

示例输入 url(确保 url 已编码):

https://www.quora.com/Which-is-the-best-tool-for-scraping-customer-reviews

输出示例:

# Airbnb的

要使用 Airbnb 抓取工具,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 从 Airbnb 获取格式化的搜索结果。

  • 获取包含头衔、位置、住宿、便利设施、评级成本等的 Airbnb 住户名单

# Airbnb-serp

Airbnb 搜索结果页面的爬虫,返回居民数组

API使用:

&scraper=airbnb-serp

示例输入 url(确保 url 已编码):

https://www.airbnb.com/s/Beirut/homes

输出示例:

# 易趣

要使用 Ebay 刮板,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 获取任何 Ebay 产品的价格、标题、可用性、描述、图像、运输摘要和更多信息。

  • 从 Ebay 获取结构化的 SERP。

# 易趣-serp

Ebay 搜索结果页面的 Scraper,返回产品数组

API使用:

&scraper=ebay-serp

示例输入 url(确保 url 已编码):

https://www.ebay.com/sch/i.html?_nkw=iphone+x

输出示例:

# 易趣产品

Scraper for Ebay 产品页面详细信息

API使用:

&scraper=ebay-product

示例输入 url(确保 url 已编码):

https://www.ebay.com/itm/156078647276

输出示例:

# 全球速卖通

Tips:

以下 AliExpress 抓取工具可能更适合您的 JavaScript (JS) 令牌。 如果您的 TCP 令牌收到空响应,请改用 JS 令牌。

要使用速卖通刮板,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 获取任何速卖通产品的价格、标题、可用性、描述、图像、评论、运输摘要和许多其他详细信息。

  • 从速卖通获取结构化 SERP。

# 速卖通产品

速卖通产品页面详细信息的刮刀

API使用:

&scraper=aliexpress-product

示例输入 url(确保 url 已编码):

https://www.aliexpress.com/item/4000275547643.html

输出示例:

# 速卖通-serp

速卖通搜索结果页面的爬虫,返回产品数组

API使用:

&scraper=aliexpress-serp

示例输入 url(确保 url 已编码):

https://www.aliexpress.com/wholesale?SearchText=water+bottle

输出示例:

#

要使用 Bing 刮板,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 从 Bing 获取结构化搜索结果,包括视频链接和相关搜索结果链接。

# 搜索引擎优化

Scraper for Bing 搜索结果页面,返回结果数组

API使用:

&scraper=bing-serp

示例输入 url(确保 url 已编码):

https://www.bing.com/search?q=samsung+shops

输出示例:

# 不动产侦察兵24

要使用 Immobilienscout24 刮刀,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 从 Immobilienscout24 获取结构化属性详细信息。

# immobilienscout24-属性

immobilienscout24 属性页详细信息的刮板。

API使用:

&scraper=immobilienscout24-property

示例输入 url(确保 url 已编码):

https://www.immobilienscout24.de/expose/144832356

输出示例:

# 沃尔玛

要使用沃尔玛抓取工具,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 获取任何沃尔玛产品的价格、标题、描述、图片、评论和评级以及更多信息。

  • 从沃尔玛搜索结果页面获取格式化的搜索结果。

  • 从沃尔玛类别页面获取格式化数据。

# 沃尔玛-serp

沃尔玛搜索结果页面的抓取工具。

API使用:

&scraper=walmart-serp

示例输入 url(确保 url 已编码):

https://www.walmart.com/search?q=samsung+galaxy

输出示例:

# 沃尔玛产品详细信息

沃尔玛产品页面详细信息抓取工具

API使用:

&scraper=walmart-product-details

示��输入 url(确保 url 已编码):

https://www.walmart.com/ip/Meta-Quest-3-512GB-Breakthrough-Mixed-Reality-Powerful-Performance-Asgard-s-Wrath-2/3551794083

输出示例:

# 沃尔玛分类

沃尔玛类别页面的抓取工具。

API使用:

&scraper=walmart-category

示例输入 url(确保 url 已编码):

https://www.walmart.com/browse/home/dorm-decor/4044_1225301_1225229_7471338

输出示例:

# 百思买

要使用 BestBuy 抓取工具,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 从 BestBuy 搜索结果页面获取格式化的搜索结果。

  • 获取任何百思买 (BestBuy) 产品的价格、标题、描述、图片、评论、评级以及更多信息。

# bestbuy-serp

BestBuy 搜索结果页面的抓取工具。

API使用:

&scraper=bestbuy-serp

示例输入 url(确保 url 已编码):

https://www.bestbuy.com/site/searchpage.jsp?st=gaming+chair

输出示例:

# bestbuy 产品详情

抓取 BestBuy 产品页面详细信息

API使用:

&scraper=bestbuy-product-details

示例输入 url(确保 url 已编码):

https://www.bestbuy.com/site/meta-quest-3-512gb-the-most-powerful-quest-ultimate-mixed-reality-experiences-get-batman-arkham-shadow-white/6596938.p

输出示例:

# G2

要使用 G2 刮刀,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 获取任何 G2 产品的名称、描述、评级、图像、评论和视频评论以及更多信息。

# g2-产品评论

G2 产品评论页面的抓取工具。

API使用:

&scraper=g2-product-reviews

示例输入 url(确保 url 已编码):

https://www.g2.com/products/zoom/reviews

输出示例:

# Eventbrite

要使用 Eventbrite 抓取工具,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 提取事件列表或详细事件信息,包括事件标题、图像、价格、折扣、描述、日期/时间、组织者、时段等。

# eventbrite-活动列表

Eventbrite 搜索事件结果的抓取工具。

API使用:

&scraper=eventbrite-events-list

示例输入 url(确保 url 已编码):

https://www.eventbrite.com/d/ny--new-york/ai/

输出示例:

# eventbrite-活动详情

Eventbrite 活动详情页面的抓取工具。

API使用:

&scraper=eventbrite-event-details

示例输入 url(确保 url 已编码):

https://www.eventbrite.com/e/marketing-essentials-1-day-training-in-new-york-city-ny-tickets-814175078577

输出示例:

# 通用

要使用通用刮板,请使用 API 像你经常和添加 &scraper= 参数以获取以 JSON 格式解析的 HTML。

  • 从任何网站页面通用提取链接、图像、电子邮件和其他内容。

# 通用提取器

用于从任何网站页面提取内容的通用刮板。

API使用:

&scraper=generic-extractor

示例输入 url(确保 url 已编码):

https://stackoverflow.com/

输出示例:

# 电子邮件提取器

一个通用的电子邮件抓取工具,用于从任何网站页面提取电子邮件。

API使用:

&scraper=email-extractor

示例输入 url(确保 url 已编码):

https://letsencrypt.org/contact/

输出示例: