summaryrefslogtreecommitdiff
path: root/scraper
ModeNameSize
-rw-r--r--.gitignore111logplain
-rw-r--r--README.md5982logplain
-rw-r--r--__init__.py0logplain
-rw-r--r--check-counts.py888logplain
d---------client318logplain
-rw-r--r--compare-csv-counts.py559logplain
-rw-r--r--content-script.crx26845logplain
-rw-r--r--content-script.pem1708logplain
d---------content-script471logplain
-rw-r--r--countries.json10354logplain
d---------datasets327logplain
-rw-r--r--db_paper_doi.csv4412757logplain
-rw-r--r--db_paper_pdf.csv2407497logplain
-rw-r--r--db_paper_pdf_list.csv7191630logplain
-rw-r--r--expand-uni-lookup.py1033logplain
-rw-r--r--ids.json1580612logplain
-rw-r--r--missing.csv0logplain
d---------reports1993logplain
-rw-r--r--requirements.txt35logplain
-rw-r--r--rm-txt-images.sh74logplain
-rw-r--r--s2-citation-report.py12657logplain
-rw-r--r--s2-doi-report.py9401logplain
-rw-r--r--s2-dump-db-pdf-urls.py3639logplain
-rw-r--r--s2-dump-ids.py736logplain
-rw-r--r--s2-dump-missing-paper-ids.py1270logplain
-rw-r--r--s2-extract-full-pdf-txt.py762logplain
-rw-r--r--s2-extract-papers.py1590logplain
-rw-r--r--s2-extract-pdf-txt.py693logplain
-rw-r--r--s2-fetch-doi.py2083logplain
-rw-r--r--s2-fetch-google-sheet.py70logplain
-rw-r--r--s2-fetch-pdf.py1248logplain
-rw-r--r--s2-final-report.py8759logplain
-rw-r--r--s2-geocode-server.py4366logplain
-rw-r--r--s2-geocode-spreadsheet.py4262logplain
-rw-r--r--s2-geocode.py3005logplain
-rw-r--r--s2-merge-csv.py664logplain
-rw-r--r--s2-papers.py3102logplain
-rw-r--r--s2-pdf-first-pages.py4164logplain
-rw-r--r--s2-pdf-report.py3873logplain
-rw-r--r--s2-raw-papers.py1375logplain
-rw-r--r--s2-scrape.sh1126logplain
-rw-r--r--s2-search-deep.py2535logplain
-rw-r--r--s2-search.py1607logplain
-rw-r--r--s2-tar-papers.sh200logplain
-rw-r--r--s2.py6652logplain
d---------samples185logplain
-rw-r--r--scholar-fetch.py1086logplain
-rw-r--r--split-csv.py1263logplain
-rw-r--r--util.py15718logplain
d---------vendor38logplain