Guide Semalt sur l'extension de grattoir pour Chrome

Pour que toute entreprise puisse survivre et finalement croître, il est nécessaire de garder une longueur d'avance sur ses concurrents et divers risques. Prendre des décisions basées sur des données analytiques est un moyen sûr d'oublier ces problèmes. Ces données peuvent être acquises grâce à la mise au rebut des données. C'est là qu'intervient l'extension de grattoir facile pour Chrome: elle facilitera non seulement le processus de collecte de données, mais permettra également de gratter en déplacement sans configurations compliquées.

Comment utiliser le grattoir

    1. La première chose que vous devez faire est d'installer l'extension, alors rendez-vous sur la boutique en ligne de Chrome, recherchez «scraper» et cliquez sur ajouter à Chrome.

    2. Accédez au site Web dont vous souhaitez extraire les données , marquez l'entrée qui vous intéresse en la mettant en surbrillance. Faites un clic droit dessus et sélectionnez "gratter similaire" dans le menu qui apparaît.

    3. Cela ouvrira une fenêtre de console de raclage distincte. Ici, vous verrez une liste des données grattées .

    4. Pour enregistrer le contenu, cliquez sur "enregistrer dans Google docs", cela exportera automatiquement les données vers une feuille de calcul Google.

Grattage prolongé

Dans le cas où vous envisagez de supprimer plus de données, vous pouvez utiliser l'approche avancée. Notez qu'il sera beaucoup plus facile de travailler avec l'outil si vous avez une certaine connaissance du HTML. Supposons que vous vouliez extraire des données d'une source qui possède une archive basée sur des données de séries chronologiques. Dans ce cas, si vous essayez la méthode décrite ci-dessus, vous obtiendrez les données tronquées.

Pour résoudre ce problème, vous pouvez utiliser un langage de requête HTML et XML appelé XPath. Qu'est ce que ça fait? XPath reconnaît les données concernant les différents éléments contenus dans chaque sélection. Voici un guide sur la façon de procéder:

1. Accédez à la console Scraper, en haut à gauche, vous remarquerez un bouton "XPath", cliquez dessus et procédez au montage de la table initiale.

2. Vous devez écrire le XPath pour le bon élément. Le XPath actuel qui inclut toutes les informations sera affiché dans un format comme celui-ci "// div [3] / div [3] / div [2] / div". Les éléments <div> seront reconnus dans le document HTML par l'ordinateur.

3. Pour séparer les données reconnues, vous devez utiliser les colonnes Scraper. Pour ce faire, vous devez rechercher les différents types d'informations dont vous disposez. Selon les données que vous grattez, vous pouvez avoir des titres. Ces titres sont présents à côté de chaque ensemble de données. Ils sont accompagnés d'une balise, dans ce cas, une balise <b>.

4. À l'aide de l'élément inspect, recherchez et ajoutez la balise <b> à votre XPath. Vous pouvez maintenant étiqueter cette première colonne comme "colonne de titre" car elle listera les titres. Continuez à créer des XPath différents pour chaque colonne dont vous avez besoin.

5. Cliquez sur le scrap et l'extension récupérera automatiquement les données et les organisera dans les différentes colonnes que vous avez définies.