Úterý , 15 Červenec 2025
Domů Programování Webový scraper v Pythonu
ProgramováníPython

Webový scraper v Pythonu

Webový scraper je program, který extrahuje informace z webových stránek. Pro tento účel můžeme použít knihovny requests a BeautifulSoup. Pokud ještě nemáte tyto knihovny nainstalované, můžete je nainstalovat pomocí následujících příkazů:

pip install requests
pip install beautifulsoup4

Zde je jednoduchý příklad webového scraperu, který extrahuje nadpisy článků z blogu:

import requests
from bs4 import BeautifulSoup

def get_article_titles(url):
    response = requests.get(url)

    if response.status_code != 200:
        print(f"Chyba: Nelze načíst stránku (kód: {response.status_code})")
        return []

    soup = BeautifulSoup(response.content, "html.parser")

    # Najděte všechny elementy, které mají třídu "article-title"
    title_elements = soup.find_all(class_="article-title")

    # Získejte text z každého elementu s třídou "article-title"
    titles = [title.text for title in title_elements]
    
    return titles

if __name__ == "__main__":
    url = "https://example-blog.com/" # Nahraďte vlastním URL
    article_titles = get_article_titles(url)

    for title in article_titles:
        print(title)

Nezapomeňte nahradit https://example-blog.com/ vlastním URL blogu, který chcete procházet. Tento kód extrahuje a vypíše nadpisy článků, které mají HTML třídu „article-title“. Upozorňujeme, že musíte upravit tuto třídu podle struktury HTML konkrétního webu, který chcete scrapovat.

Poznámka: Před scrapováním webových stránek se ujistěte, že respektujete robots.txt a zásady použití webu. Webové stránky mohou mít omezení nebo zákazy pro scrapování a automatické procházení.

Související články

Programování

Windows program pro výuku jazyků

🧠 Program pro výuku jazyků: Vaše interaktivní cesta k ovládnutí slovíček 📝...

ProgramováníUmělá inteligence

Runway Game Worlds: Vytvářejte video hry s generativní AI

Runway Game Worlds: Vytvářejte video hry s generativní AI bez nutnosti programování...

ProgramováníPython

PyCharm JetBrains IDE vývojové prostředí

🚀 Úvod PyCharm je špičkové integrované vývojové prostředí (IDE) od společnosti JetBrains,...

ProgramováníStrojové učeníUmělá inteligence

Neuromorfní čipy vs. GPU/TPU

Top články Neuromorfní čipy vs. GPU/TPU 19. 6. 2025 Edge-AI v IoT:...

×
Avatar
PetrPikora.com
AI Chatbot
Ahoj! Jak vám mohu pomoci?
 

Používáním tohoto chatbota souhlasíte se shromažďováním a používáním vašich dat, jak je uvedeno v našich Zásadách ochrany osobních údajů. Vaše údaje budou použity pouze jako pomoc s vaším dotazem.