Python/web_programming/get_imdb_top_250_movies_csv.py

from __future__ import annotations

import csv

import requests
from bs4 import BeautifulSoup


def get_imdb_top_250_movies(url: str = "") -> dict[str, float]:
    url = url or "https://www.imdb.com/chart/top/?ref_=nv_mv_250"
    soup = BeautifulSoup(requests.get(url).text, "html.parser")
    titles = soup.find_all("td", attrs="titleColumn")
    ratings = soup.find_all("td", class_="ratingColumn imdbRating")
    return {
        title.a.text: float(rating.strong.text)
        for title, rating in zip(titles, ratings)
    }


def write_movies(filename: str = "IMDb_Top_250_Movies.csv") -> None:
    movies = get_imdb_top_250_movies()
    with open(filename, "w", newline="") as out_file:
        writer = csv.writer(out_file)
        writer.writerow(["Movie title", "IMDb rating"])
        for title, rating in movies.items():
            writer.writerow([title, rating])


if __name__ == "__main__":
    write_movies()
from __future__ import annotations (#2464) * from __future__ import annotations * fixup! from __future__ import annotations * fixup! from __future__ import annotations * fixup! Format Python code with psf/black push Co-authored-by: github-actions <${GITHUB_ACTOR}@users.noreply.github.com> 2020-09-23 11:30:13 +00:00			`from __future__ import annotations`

Create get_imdb_top_250_movies_csv.py (#1659) * Create get_imdb_top_250_movies_csv.py * Update get_imdb_top_250_movies_csv.py * Update get_imdb_top_250_movies_csv.py * get_imdb_top_250_movies() Co-authored-by: Christian Clauss <cclauss@me.com> 2020-01-05 21:28:36 +00:00			`import csv`

			`import requests`
			`from bs4 import BeautifulSoup`


from __future__ import annotations (#2464) * from __future__ import annotations * fixup! from __future__ import annotations * fixup! from __future__ import annotations * fixup! Format Python code with psf/black push Co-authored-by: github-actions <${GITHUB_ACTOR}@users.noreply.github.com> 2020-09-23 11:30:13 +00:00			`def get_imdb_top_250_movies(url: str = "") -> dict[str, float]:`
Create get_imdb_top_250_movies_csv.py (#1659) * Create get_imdb_top_250_movies_csv.py * Update get_imdb_top_250_movies_csv.py * Update get_imdb_top_250_movies_csv.py * get_imdb_top_250_movies() Co-authored-by: Christian Clauss <cclauss@me.com> 2020-01-05 21:28:36 +00:00			`url = url or "https://www.imdb.com/chart/top/?ref_=nv_mv_250"`
			`soup = BeautifulSoup(requests.get(url).text, "html.parser")`
			`titles = soup.find_all("td", attrs="titleColumn")`
			`ratings = soup.find_all("td", class_="ratingColumn imdbRating")`
			`return {`
			`title.a.text: float(rating.strong.text)`
			`for title, rating in zip(titles, ratings)`
			`}`


			`def write_movies(filename: str = "IMDb_Top_250_Movies.csv") -> None:`
			`movies = get_imdb_top_250_movies()`
			`with open(filename, "w", newline="") as out_file:`
			`writer = csv.writer(out_file)`
			`writer.writerow(["Movie title", "IMDb rating"])`
			`for title, rating in movies.items():`
			`writer.writerow([title, rating])`


			`if __name__ == "__main__":`
			`write_movies()`