# насыпной

Команда /bulk Конечная точка позволяет клиентам извлекать данные оптом, используя список идентификаторов запросов (RID). Эта операция поддерживает эффективное извлечение данных для больших наборов данных и предоставляет возможность автоматически удалять извлеченные элементы из хранилища после извлечения.

# параметры

Отправьте объект JSON со следующими свойствами:

  • rids (обязательно): Массив RID для данных, которые вы хотите получить.

  • auto_delete (необязательно): Логический параметр, который, если установлен, true, автоматически удалит извлеченные элементы из хранилища после их извлечения. Значение по умолчанию: false, то есть элементы не будут удалены, если на то не было прямого запроса.

# Запрос

Чтобы извлечь и автоматически удалить данные для трех RID:

curl -X POST 'https://api.crawlbase.com/storage/bulk?token=_USER_TOKEN_' \
-H 'Content-Type: application/json' \
-d '{ "rids": ["RID1","RID2","RID3"], "auto_delete": true }'

# Режимы секции мощности

Ответ представляет собой массив объектов JSON, каждый из которых представляет данные для одного RID. Обратите внимание, что body Поле закодировано в base64 и сжато gzip. Вам нужно будет раскодировать base64, а затем распаковать gzip, чтобы получить исходное содержимое.

[
  {
    "stored_at": "2021-03-01T14:22:58+02:00",
    "original_status": 200,
    "pc_status": 200,
    "rid": "RID1",
    "url": "URL1",
    "body": "BODY1"
  },
  {
    "stored_at": "2021-03-01T14:30:51+02:00",
    "original_status": 200,
    "pc_status": 200,
    "rid": "RID2",
    "url": "URL2",
    "body": "BODY2"
  }
]

# Заметки

Для эффективного использования /bulk API, обратите внимание на следующее:

  • Максимальное количество RID, которые могут быть обработаны за один запрос, составляет 100. Если отправлено более 100 RID, будут обработаны только первые 100.

  • Команда auto_delete Эта функция особенно полезна для поддержания эффективности хранения и управления жизненным циклом данных без необходимости отдельных запросов на удаление. Используйте эту функцию разумно, чтобы избежать непреднамеренной потери данных.