# API de robot d'exploration

Pour surveiller les statistiques du robot, gérer les tâches, purger un robot via l'API, mettre en pause/reprendre un robot, veuillez suivre les instructions ci-dessous :

Remarque : Pour les robots d'exploration JS, remplacez le jeton TCP par le jeton JS dans tous les appels d'API.

# API de statistiques

Obtenez un résumé de vos robots d'exploration, y compris la concurrence, l'état de la file d'attente et l'historique des explorations (répartition des réussites et des échecs) :

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/stats'

Filtrer l'historique par plage de dates :

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/stats?history_from=yyyy-mm-dd&history_to=yyyy-mm-dd'

# API de purge

Pour purger un robot spécifique, effectuez cette requête POST avec le nom et le jeton du robot (JS/TCP) :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/purge'

Remarque : Cela supprimera immédiatement toutes les pages du robot.

# Supprimer l'API de travail

Pour supprimer une tâche d'un robot, envoyez cette requête POST avec le RID de la requête, le nom du robot et le jeton (JS/TCP) :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/delete_job?rid=RID'

# API de recherche d'emploi

Pour rechercher une requête par RID dans la file d'attente de votre robot, utilisez la requête GET suivante (JS/TCP) :

curl 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/find_by_rid/RID'

Réponses

  • Si EN FILE D'ATTENTE :
{
  "status": "QUEUED",
  "request_info": {
    "rid": "YOUR_RID",
    "url": "YOUR_URL",
    "retry": 3,
    "created_at": 1600494969.189415
  }
}
  • Si NON_MIS_EN_QUEUE : Si la demande est déjà explorée ou n'est pas dans la file d'attente.
{
  "status": "NOT_QUEUED",
  "request_info": {
    "rid": "YOUR_RID"
  }
}

# Suspendre l'API

Pour mettre en pause un robot d'exploration, utilisez cette requête POST avec le nom et le jeton du robot d'exploration (JS/TCP) :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/pause'

# API de réactivation

Pour réactiver un robot d'exploration, effectuez cette requête POST avec le nom et le jeton du robot d'exploration (JS/TCP) :

curl -X POST 'https://api.crawlbase.com/crawler/_USER_TOKEN_/YourCrawlerName/unpause'