summaryrefslogtreecommitdiff
path: root/scraper
ModeNameSize
-rw-r--r--.gitignore111logplain
-rw-r--r--README.md5982logplain
-rw-r--r--__init__.py0logplain
-rw-r--r--check-counts.py888logplain
d---------client351logplain
-rw-r--r--content-script.crx26845logplain
-rw-r--r--content-script.pem1708logplain
d---------content-script471logplain
-rw-r--r--countries.json10354logplain
d---------datasets272logplain
-rw-r--r--db_paper_doi.csv4125433logplain
-rw-r--r--db_paper_pdf.csv2006840logplain
-rw-r--r--db_paper_pdf_list.csv6438633logplain
-rw-r--r--expand-uni-lookup.py1033logplain
-rw-r--r--ids.json1603712logplain
-rw-r--r--missing.csv0logplain
d---------reports1993logplain
-rw-r--r--requirements.txt35logplain
-rw-r--r--rm-txt-images.sh74logplain
-rw-r--r--s2-citation-report.py12797logplain
-rw-r--r--s2-doi-report.py9401logplain
-rw-r--r--s2-dump-db-pdf-urls.py3639logplain
-rw-r--r--s2-dump-ids.py736logplain
-rw-r--r--s2-dump-missing-paper-ids.py1270logplain
-rw-r--r--s2-extract-full-pdf-txt.py762logplain
-rw-r--r--s2-extract-papers.py1590logplain
-rw-r--r--s2-extract-pdf-txt.py693logplain
-rw-r--r--s2-fetch-doi.py2083logplain
-rw-r--r--s2-fetch-google-sheet.py70logplain
-rw-r--r--s2-fetch-pdf.py1248logplain
-rw-r--r--s2-final-report.py6009logplain
-rw-r--r--s2-geocode-server.py2240logplain
-rw-r--r--s2-geocode-spreadsheet.py4031logplain
-rw-r--r--s2-geocode.py2462logplain
-rw-r--r--s2-merge-csv.py664logplain
-rw-r--r--s2-papers.py2778logplain
-rw-r--r--s2-pdf-first-pages.py4164logplain
-rw-r--r--s2-pdf-report.py3873logplain
-rw-r--r--s2-raw-papers.py1343logplain
-rw-r--r--s2-scrape.sh902logplain
-rw-r--r--s2-search.py1607logplain
-rw-r--r--s2-tar-papers.sh200logplain
-rw-r--r--s2.py6609logplain
d---------samples185logplain
-rw-r--r--scholar-fetch.py1086logplain
-rw-r--r--split-csv.py1263logplain
-rw-r--r--util.py14435logplain
d---------vendor38logplain