[[
dip:bip.gov.pl:opp
]]
Narzędziownik
Ślad:
Pokaż stronę
Administracja
Ostatnie zmiany
Indeks
Zaloguj
Szukaj
Zobacz także
bip.gov.pl
inspektoraty_sanitarne
opp
sady
urzedy_skarbowe
uniki
bzdury
doreczenie-elektroniczne
faq
old-long
podpis_elektroniczny
zapytanie-o-bip
wnioski
ministerstwa-o-rejestry-umow
archiwum
procedura
prokuratura
baza
okregowe
opracowanie
do_wojewodow_o_decyzje_tuska
epuap-baza
kgp-art-269b
wykaz-rejestry-umow
2013
2014
2015
2016
uchwaly
1001-tez
bip
etpc
plan-nadzoru
poradnik
rzecznicy-prasowi
slownik
sprawnosc
statutu-i-akty-generalne
szkola
to-do
zarzadzenia
zaskarzanie-bip
Ostatnie zmiany
Ta strona jest tylko do odczytu. Możesz wyświetlić źródła tej strony ale nie możesz ich zmienić.
Na dzień 31.07.2013 w wykazie podmiotów http://www.bip.gov.pl/subjects/index/14013 znajdowało się 68 OPP. ====== Kod ====== <code python> import requests from bs4 import BeautifulSoup import dataset from itertools import imap,islice import requests_cache requests_cache.configure('/tmp/http_cache') db = dataset.connect('sqlite:///subjects.db') table = db['opp'] def grab(krs , s=requests.Session()): print "Grab data for ",krs r = s.post('http://sprawozdaniaopp.mpips.gov.pl/Search/Details/%s' % ( str(krs).strip(),) ) soup = BeautifulSoup(r.text) data = dict([map(lambda x:x.text.strip(),tr.findAll('td')) for tr in soup.table.findAll('tr')]) data['KRS'] = krs print data return data def load(filename): s = requests.Session() with open(filename) as fp: for x in fp: yield grab(x,s) table.insert_many(load('numery_krs.txt')) </code> ====== Instrukcja użycia ====== Powyższy skrypt potrzebuje informacji o podmiotach do scrapowania. Przyjmuje je jako plik 1 numer - 1 linia. ====== Wynik ====== {{:dip:bip.gov.pl:wykaz_opp_za_2012_z_rachunkami_aktualizacja_rach_ods.ods|Dane wejściowe}} pobrane z http://www.mpips.gov.pl/bip/wykaz-organizacji-pozytku-publicznego/ przetworzone do {{:dip:bip.gov.pl:opp_numery_krs.txt|właściwego formatu}} dostarczyły {{:dip:bip.gov.pl:opp_z_emailami.csv|danych}}.
dip/bip.gov.pl/opp.txt
· ostatnio zmienione: 2013/07/31 23:14 przez
naczelnik
Pokaż stronę
Poprzednie wersje
Menadżer multimediów
Do góry