Is er iemand hier met tijd teveel die een lijstje van alle mogelijke headliners/sub headliners etc kan maken die op papier zouden kunnen nu met alle aankondigingen?
Ik zou zeggen, gooi het eens in Python:
import requests
from bs4 import BeautifulSoup
from collections import defaultdict
def count_words(url, words):
# Haal de HTML op van de URL
response = requests.get(url)
if response.status_code == 200:
# Maak een BeautifulSoup object van de HTML
soup = BeautifulSoup(response.content, 'html.parser')
# Initialiseer een defaultdict om het aantal voorkomens van elk woord bij te houden
word_count = defaultdict(int)
# Zoek elk woord in de lijst van opgegeven woorden en tel het aantal voorkomens op de webpagina
for word in words:
word_count[word] += soup.get_text().lower().count(word.lower())
return word_count
else:
print("Fout bij het ophalen van de webpagina.")
return None
# Definieer de URL van de webpagina om te scannen
url_to_scan = "
https://www.example.com"
# Definieer de woorden waar je naar wilt zoeken
words_to_find = ["woord1", "woord2", "woord3"]
# Roep de functie aan om de woorden te tellen op de opgegeven URL
result = count_words(url_to_scan, words_to_find)
if result:
# Toon het aantal voorkomens van elk woord
for word, count in result.items():
print(f"{word}: {count}")