5 Schritte zum Scraping mehrerer Bilder mit Python

hanna Fischer - Oct 17 - - Dev Community

Schritt 1: Installieren Sie die erforderlichen Python-Bibliotheken

pip install beautifulsoup4
pip install requests
pip install pillow # For saving images

Schritt 2: Stellen Sie eine GET-Anfrage an die URL der Website

import requests
url = "..."
response = requests.get(url)

Schritt 3: Parsen des HTML mit Beautiful Soup

from bs4 import BeautifulSoup
soup = BeautifulSoup(response.text, "html.parser")

Schritt 4: Alle Tags auf der Seite finden

images = soup.find_all("img")

Schritt 5: Durchlaufen Sie jeden Tag und extrahieren Sie die Bild-URL aus dem 'src'-Attribut

for image in images:
img_url = image['src']

Vorteile:

  • Volle Kontrolle und Anpassungsmöglichkeiten
  • Flexibilität bei der Anpassung des Skripts für verschiedene Websites

Nachteile:

  • Erfordert Programmierkenntnisse in Python
  • Weniger benutzerfreundlich als ein visuelles Tool

Für Benutzer ohne Programmierkenntnisse ist Octoparse ein visueller Web Scraper, der verwendet werden kann, um mehrere Bilder von Websites mit einem einfachen Drag-and-Drop-Prozess zu scrapen.

Octoparse bietet über 100 benutzerfreundliche Vorlagen, um Daten zu extrahieren. Über 30.000 Nutzer verwenden die Vorlagen.

Image description

. . . . . .