# Antwort
Wenn Sie eine Anfrage an Crawlbase stellen, erhalten Sie eine Antwort.
Diese Antwort ist ein JSON-Objekt oder der HTML-Code der Seite, abhängig von der Option, die Sie mit dem [Format]/de/crawling-api/parameters/#format) Parameter (Standard ist html).
# HTML-Antwort
Wenn Sie das HTML-Antwortformat ausgewählt haben (was die Standardeinstellung ist), erhalten Sie das HTML der Seite als Antwort.
Die Antwortparameter wird den Antwortheadern hinzugefügt.
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=html'
Response:
Headers:
url: https://github.com/crawlbase?tab=repositories
original_status: 200
pc_status: 200
Body:
<!doctype html><html class="a-no-js" data-19ax5a9jf="dingo"><!-- sp:feature:head-start -->
<head><script>var aPageStart = (new Date()).getTime();</script><meta charset="utf-8">
... (all the html of the page)
# JSON-Antwort
Wenn Sie das JSON-Antwortformat ausgewählt haben, erhalten Sie ein JSON-Objekt, das Sie analysieren können.
Dieses Objekt enthält alle Informationen, die Sie benötigen. Lesen Sie Antwortparameter für alle Informationen.
GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=json'
Response:
{
"original_status": "200",
"pc_status": 200,
"url": "https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories",
"body": "\u003C!doctype html\u003E\u003Chtml class=\"a-no-js\" data-19ax5a9jf\n... (all the html of the page)"
}
# Headers
Wie Sie in den obigen Beispielen gesehen haben, wird die Antwort, JSON oder HTML zurückgegeben Parameter für JSON, oder auch Header für HTML, damit Sie erfahren, was mit der Anfrage passiert ist.
# URL
Die ursprüngliche URL, die in der Anfrage gesendet wurde, oder die URL der Weiterleitung, der Crawlbase gefolgt ist.
# ursprünglicher_status
Die Statusantwort, die wir (Crawlbase) beim Crawlen der in der Anfrage gesendeten URL erhalten.
Es kann jeder gültige HTTP-Statuscode sein.
Bitte beachten Sie, dass Crawlbase nur Anfragen berechnet, die von original_status
Erfolg (200, 201, 204), permanente Weiterleitung (301), temporäre Weiterleitung (302), wenn die folgende Weiterleitung Inhalt zurückgegeben hat, nicht gefunden (410, 404). Und wenn pc_status
ist 200. Alle anderen original_status
Für die erhaltenen Codes fallen keine Gebühren an.
# pc_status
Der Crawlbase (PC)-Statuscode kann ein beliebiger Statuscode sein und es ist der Code, der letztendlich gültig ist.
Beispielsweise könnte eine Website original_status
200 mit einem Captcha, in diesem Fall, pc_status
wird 503 sein.
Jeder Code, der nicht dem Standard entspricht, wie etwa 601, 999 usw., wird intern vom Engineering-Team verwendet und nur angezeigt, um Ihnen bei der Fehlerbehebung zu helfen, wenn Sie sich an den Support wenden.
Bitte beachten Sie dass Anfragen an Crawlbase, die erfolglos bleiben, pc_status
Code (also anders als 200) wird nicht berechnet.
# Körper
Dieser Parameter ist nur in JSON verfügbar [Format]/de/crawling-api/parameters/#format), in html format
wird der Hauptteil der Antwort selbst sein.
Der Inhalt der Seite, die Crawlbase als Ergebnis des Proxy-Crawlings der in der Anfrage gesendeten URL gefunden hat.