From c6769560301ccff2b606d19ae440136b47482cf8 Mon Sep 17 00:00:00 2001
From: Santosh Mohan Rajkumar <rajkumar.nits@gmail.com>
Date: Sat, 12 Sep 2020 01:55:05 +0530
Subject: [PATCH] lxmlCovidDataFetch (#2416)

* lxmlCovidDataFetch

* lxmlCovidDataFetch1

* Update worldometers_covid_with_lxml.py

* Rename worldometers_covid_with_lxml.py to covid_stats_via_xpath.py

Co-authored-by: Christian Clauss <cclauss@me.com>
---
 web_programming/covid_stats_via_xpath.py | 23 +++++++++++++++++++++++
 1 file changed, 23 insertions(+)
 create mode 100644 web_programming/covid_stats_via_xpath.py

diff --git a/web_programming/covid_stats_via_xpath.py b/web_programming/covid_stats_via_xpath.py
new file mode 100644
index 000000000..d22ed0178
--- /dev/null
+++ b/web_programming/covid_stats_via_xpath.py
@@ -0,0 +1,23 @@
+"""
+This is to show simple COVID19 info fetching from worldometers site using lxml
+* The main motivation to use lxml in place of bs4 is that it is faster and therefore
+more convenient to use in Python web projects (e.g. Django or Flask-based)
+"""
+
+from collections import namedtuple
+
+import requests
+from lxml import html
+
+covid_data = namedtuple("covid_data", "cases deaths recovered")
+
+
+def covid_stats(url: str = "https://www.worldometers.info/coronavirus/") -> covid_data:
+    xpath_str = '//div[@class = "maincounter-number"]/span/text()'
+    return covid_data(*html.fromstring(requests.get(url).content).xpath(xpath_str))
+
+
+fmt = """Total COVID-19 cases in the world: {}
+Total deaths due to COVID-19 in the world: {}
+Total COVID-19 patients recovered in the world: {}"""
+print(fmt.format(*covid_stats()))