Scraping BODACC vers Google Sheets
À propos de cette vidéo
Automatisation de la collecte de données BODACC
Cette vidéo présente une application dédiée à la collecte automatisée des annonces de redressements judiciaires publiées sur le Bulletin Officiel des Annonces Civiles et Commerciales (BODACC). L'outil est conçu pour extraire des informations clés et les exporter directement vers une feuille Google Sheets.
Filtrage précis des annonces
L'application offre des filtres détaillés pour cibler les données pertinentes. L'utilisateur peut spécifier la période de recherche (ici, 7 jours), la taille de l'effectif (par exemple, 20 à 49 employés), le code NAF (activités économiques comme transport, bâtiment) et le type de société (toutes).
Processus d'extraction et journalisation
Une fois les filtres définis, l'utilisateur lance le scraping. La section "Logs d'exécution" affiche le déroulement en temps réel du processus, incluant le nombre d'entreprises identifiées, les détails de chaque annonce (numéro SIREN, nom de l'entreprise, etc.), et les pauses dues aux limites de requêtes (rate-limit).
Exportation et visualisation des données
Les données collectées sont ensuite organisées et exportées automatiquement dans une feuille de calcul Google Sheets. Cette feuille structurée contient des colonnes comme le nom de la société, le numéro SIREN, la date de publication, le type de procédure, le code NAF, l'effectif, la forme juridique, la ville et le code postal, permettant une analyse facile et une gestion efficace des informations.
Tags
- Scraping de données
- BODACC
- Redressements judiciaires
- Google Sheets
- Automatisation
- API INSEE