# Masse
Die /bulk
Der Endpunkt ermöglicht es Clients, Daten in großen Mengen mithilfe einer Liste von Anforderungs-IDs (RIDs) abzurufen. Dieser Vorgang unterstützt den effizienten Datenabruf für große Datensätze und bietet eine Option zum automatischen Löschen der abgerufenen Elemente aus dem Speicher nach dem Abruf.
# Parameter
Senden Sie ein JSON-Objekt mit den folgenden Eigenschaften:
rids
(erforderlich): Ein Array von RIDs für die Daten, die Sie abrufen möchten.auto_delete
(optional): Ein boolescher Parameter, der, wenn er auftrue
, löscht die abgerufenen Elemente automatisch aus dem Speicher, nachdem sie abgerufen wurden. Der Standardwert istfalse
, d. h., Elemente werden nicht gelöscht, sofern dies nicht ausdrücklich angefordert wird.
# PREISANFRAGE (Request)
So rufen Sie Daten für drei RIDs ab und löschen sie automatisch:
curl -X POST 'https://api.crawlbase.com/storage/bulk?token=_USER_TOKEN_' \
-H 'Content-Type: application/json' \
-d '{ "rids": ["RID1","RID2","RID3"], "auto_delete": true }'
# Antwort
Die Antwort ist ein JSON-Array von Objekten, von denen jedes die Daten für eine RID darstellt. Beachten Sie, dass die body
Das Feld ist base64-codiert und gzip-komprimiert. Sie müssen es base64-decodieren und dann gzip-dekomprimieren, um den Originalinhalt abzurufen.
[
{
"stored_at": "2021-03-01T14:22:58+02:00",
"original_status": 200,
"pc_status": 200,
"rid": "RID1",
"url": "URL1",
"body": "BODY1"
},
{
"stored_at": "2021-03-01T14:30:51+02:00",
"original_status": 200,
"pc_status": 200,
"rid": "RID2",
"url": "URL2",
"body": "BODY2"
}
]
# Notizen
Für eine effiziente Nutzung der /bulk
API, beachten Sie bitte Folgendes:
Die maximale Anzahl an RIDs, die pro Anfrage verarbeitet werden können, beträgt 100. Wenn mehr als 100 RIDs gesendet werden, werden nur die ersten 100 verarbeitet.
Die
auto_delete
ist besonders nützlich, um die Speichereffizienz aufrechtzuerhalten und den Datenlebenszyklus zu verwalten, ohne dass separate Löschanforderungen erforderlich sind. Verwenden Sie diese Funktion umsichtig, um unbeabsichtigten Datenverlust zu vermeiden.