Merge pull request #75 from anjali1102/master

[feat]: extract_text_from_pdf
2025-04-15 17:17:36 +00:00 · 2022-10-02 23:27:27 +05:30 · 2022-10-02 23:27:27 +05:30 · 7fd5a2b156
commit 7fd5a2b156
parent 8618617f1e 47f35b7358
2 changed files with 16 additions and 0 deletions
--- a/scripts/extract_text_from_pdf/README.md
+++ b/scripts/extract_text_from_pdf/README.md
@ -0,0 +1,9 @@
 # extract text from pdf
 This simple script will extract text from pdf
 ## Usage
 - requires PyPDF2
 - Use `pip3 install PyPDF2`
 - Run `python script.py`
--- a/scripts/extract_text_from_pdf/script.py
+++ b/scripts/extract_text_from_pdf/script.py
@ -0,0 +1,7 @@
 import PyPDF2
 pdfFileObject = open('sample.pdf', 'rb')
 pdfReader = PyPDF2.PdfFileReader(pdfFileObject)
 count = pdfReader.numPages
 for i in range(count):
    page = pdfReader.getPage(i)
    print(page.extractText())