5 Schritte zum Scraping mehrerer Bilder mit Python

hanna Fischer - Oct 17 -

- Dev Community

Schritt 1: Installieren Sie die erforderlichen Python-Bibliotheken

pip install beautifulsoup4
pip install requests
pip install pillow # For saving images

Schritt 2: Stellen Sie eine GET-Anfrage an die URL der Website

import requests
url = "..."
response = requests.get(url)

Schritt 3: Parsen des HTML mit Beautiful Soup

from bs4 import BeautifulSoup
soup = BeautifulSoup(response.text, "html.parser")

Schritt 4: Alle Tags auf der Seite finden

images = soup.find_all("img")

Schritt 5: Durchlaufen Sie jeden Tag und extrahieren Sie die Bild-URL aus dem 'src'-Attribut

for image in images:
img_url = image['src']

Vorteile:

Volle Kontrolle und Anpassungsmöglichkeiten
Flexibilität bei der Anpassung des Skripts für verschiedene Websites

Nachteile:

Erfordert Programmierkenntnisse in Python
Weniger benutzerfreundlich als ein visuelles Tool

Für Benutzer ohne Programmierkenntnisse ist Octoparse ein visueller Web Scraper, der verwendet werden kann, um mehrere Bilder von Websites mit einem einfachen Drag-and-Drop-Prozess zu scrapen.

Octoparse bietet über 100 benutzerfreundliche Vorlagen, um Daten zu extrahieren. Über 30.000 Nutzer verwenden die Vorlagen.