# Réponse
Lorsque vous faites une demande à Crawlbase tu recevras une réponse.
Cette réponse sera un objet JSON ou le code html de la page selon l'option que vous avez sélectionnée avec le le format paramètre (la valeur par défaut est html).
# HTML Response
Si vous avez sélectionné le format de réponse HTML (qui est la valeur par défaut), vous recevrez le format HTML de la page comme réponse.
Pour paramètres de réponse sera ajouté aux en-têtes de réponse.
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=html'
Response:
Headers:
url: https://github.com/crawlbase?tab=repositories
original_status: 200
pc_status: 200
'X-Domain-Complexity': standard
Body:
<!doctype html><html class="a-no-js" data-19ax5a9jf="dingo"><!-- sp:feature:head-start -->
<head><script>var aPageStart = (new Date()).getTime();</script><meta charset="utf-8">
... (all the html of the page)
# JSON Response
Si vous avez sélectionné le format de réponse JSON, vous recevrez un objet JSON que vous pourrez analyser.
Cet objet contient toutes les informations dont vous avez besoin. Lire paramètres de réponse pour toutes les informations.
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=json'
Response:
{
"original_status": "200",
"pc_status": 200,
"url": "https://github.com/crawlbase?tab=repositories",
"domain_complexity": "standard",
"body": "\u003C!doctype html\u003E\u003Chtml class=\"a-no-js\" data-19ax5a9jf\n... (all the html of the page)"
}
# Headers
Comme vous l'avez vu dans les exemples ci-dessus, la réponse, json ou html renverra paramètres pour json, ou en-têtes pour html, ce qui vous permettra de savoir ce qui s'est passé avec la demande.
# URL
L'URL d'origine qui a été envoyée dans la requête ou l'URL de la redirection qui Crawlbase ont suivi.
# original_status
La réponse d'état que nous (Crawlbase) recevoir lors de l'exploration de l'URL envoyée dans la requête.
Il peut s'agir de n'importe quel code d'état http valide.
Gardez à l'esprit que Crawlbase ne facture que les demandes qui sont de original_status
succès (200, 201, 204), redirection permanente (301), redirection temporaire (302) si la redirection suivante a renvoyé du contenu, non trouvé (410, 404). Et quand pc_status
est 200. Tout autre original_status
les codes reçus ne seront pas facturés.
# pc_status
Pour Crawlbase (pc) Le code d'état peut être n'importe quel code d'état et c'est le code qui finit par être valide.
Par exemple, un site Web peut renvoyer original_status
200 avec un captcha, dans ce cas, pc_status
aura 503 ans.
Tout code qui n'est pas standard comme 601, 999, etc. est utilisé par l'équipe d'ingénierie en interne et exposé uniquement pour vous aider à déboguer les problèmes lorsque vous contactez le support.
Notez que que les demandes faites à Crawlbase qui finit par avoir un échec pc_status
le code (donc différent de 200) ne sera pas facturé.
# X-Domain-Complexity
Le niveau de complexité indique la difficulté d'explorer ou de scraper un domaine donné, et reflète également les besoins en ressources et les prix associés :
standard
– Domaines faciles à explorer ou à scraper, avec des mesures de protection minimales. Ces domaines sont généralement proposés aux tarifs les plus bas.moderate
– Domaines dotés d'une protection anti-bot modérée nécessitant une gestion spécialisée. Ces domaines ont généralement un niveau de tarification intermédiaire et leur traitement est plus gourmand en ressources.complex
– Domaines dotés de systèmes de protection avancés, difficiles à explorer ou à extraire. Ils nécessitent des techniques avancées et des ressources spécialisées, ce qui se reflète dans le niveau de tarification le plus élevé.
Comprendre le niveau de complexité des différents domaines vous permet d'estimer les coûts potentiels et les aspects techniques de vos tâches d'exploration. Pour obtenir des informations tarifaires spécifiques en fonction du niveau de complexité des domaines, veuillez consulter votre abonnement ou contacter notre équipe commerciale via le Contact.
# body
Ce paramètre n'est disponible qu'en json le format, en html format
sera le corps de la réponse elle-même.
Le contenu de la page qui Crawlbase trouvé à la suite de l'exploration par proxy de l'URL envoyée dans la requête.