summaryrefslogtreecommitdiff
path: root/scraper
ModeNameSize
-rw-r--r--.gitignore111logplain
-rw-r--r--README.md5070logplain
-rw-r--r--__init__.py0logplain
-rw-r--r--check-counts.py888logplain
d---------client351logplain
-rw-r--r--content-script.crx26845logplain
-rw-r--r--content-script.pem1708logplain
d---------content-script471logplain
d---------datasets272logplain
-rw-r--r--db_paper_doi.csv4125327logplain
-rw-r--r--db_paper_pdf.csv2006761logplain
-rw-r--r--db_paper_pdf_list.csv6438442logplain
-rw-r--r--expand-uni-lookup.py1033logplain
-rw-r--r--ids.json1603624logplain
-rw-r--r--missing.csv0logplain
-rw-r--r--pdf_dump_all.sh380logplain
-rw-r--r--pdf_dump_first_page.sh300logplain
d---------reports1993logplain
-rw-r--r--requirements.txt35logplain
-rw-r--r--rm-txt-images.sh74logplain
-rw-r--r--s2-citation-report.py12514logplain
-rw-r--r--s2-doi-report.py9401logplain
-rw-r--r--s2-dump-db-pdf-urls.py3639logplain
-rw-r--r--s2-dump-ids.py736logplain
-rw-r--r--s2-dump-missing-paper-ids.py1270logplain
-rw-r--r--s2-extract-papers.py1590logplain
-rw-r--r--s2-extract-pdf-txt.py693logplain
-rw-r--r--s2-fetch-doi.py2083logplain
-rw-r--r--s2-fetch-google-sheet.py70logplain
-rw-r--r--s2-fetch-pdf.py1248logplain
-rw-r--r--s2-final-report.py6163logplain
-rw-r--r--s2-geocode-server.py2240logplain
-rw-r--r--s2-geocode-spreadsheet.py2467logplain
-rw-r--r--s2-geocode.py2307logplain
-rw-r--r--s2-merge-csv.py664logplain
-rw-r--r--s2-papers.py2681logplain
-rw-r--r--s2-pdf-first-pages.py4164logplain
-rw-r--r--s2-pdf-report.py3873logplain
-rw-r--r--s2-raw-papers.py1343logplain
-rw-r--r--s2-scrape.sh572logplain
-rw-r--r--s2-search.py1607logplain
-rw-r--r--s2-tar-papers.sh200logplain
-rw-r--r--s2.py6609logplain
d---------samples185logplain
-rw-r--r--scholar-fetch.py1086logplain
-rw-r--r--split-csv.py1263logplain
-rw-r--r--util.py13479logplain
d---------vendor38logplain