Na dzień 31.07.2013 w wykazie podmiotów znajdowało się 68 OPP.


import requests
from bs4 import BeautifulSoup
import dataset
from itertools import imap,islice
import requests_cache
db = dataset.connect('sqlite:///subjects.db')
table = db['opp']
def grab(krs , s=requests.Session()):
    print "Grab data for ",krs
    r ='' % ( str(krs).strip(),) )
    soup = BeautifulSoup(r.text)
    data = dict([map(lambda x:x.text.strip(),tr.findAll('td')) for tr in soup.table.findAll('tr')])
    data['KRS'] = krs
    print data
    return data
def load(filename):
    s = requests.Session()
    with open(filename) as fp:
        for x in fp:
            yield grab(x,s)

Instrukcja użycia

Powyższy skrypt potrzebuje informacji o podmiotach do scrapowania. Przyjmuje je jako plik 1 numer - 1 linia.


