W niektórych przypadkach dochodzi do zbiegu prawa do prywatności z prawem do informacji. Każdorazowo winno się ocenić sprawę zgodnie z zasadą proporcjonalności. Po jej uwzględnieniu nie zawsze możliwe jest ujawniania wszystkich informacji. W takim przypadku winno się dokonać anonimizacji. Nieprawidłowo dokonana anonimizacja dokonana przy użyciu środków informatycznych 1), czy środków analogowych 2) może być nieskuteczna. Na rynku istnieje wyspecjalizowane oprogramowanie służące do usuwania danych z plików

Uwaga! Opisana niżej procedura czyni pliki PDF nie przeszukiwalnymi. Nie jest też możliwe bezpośrednie kopiowanie tekstu.

Rozwiązanie stosowane (Linux)

obecne

W ~/.bashrc mam:

function split_pdf(){
        pages=$(pdfinfo "$1" | grep "Pages" | awk '{print $2}') 
        prefix="`basename "$1"`";
        for i in $(seq 1 "$pages"); do
                pdftk "$1" cat "$i" output "$prefix-$i.pdf";
        done;
};

Mając plik PDF wykonuje:

$ split_pdf aa.pdf;
$ gimp aa.pdf-*; 
$ pdftk aa.pdf-* cat output aa-anon.pdf

W GIMP-ie używam:

  • CTRL + F - użyj ostatni filtr,
  • CTRL + W - zamknij ostatni plik,
  • CTRL + R - zastąp plik

dawna metoda

Prywatnie dobieram metodę indywidualnie z względu na strukturę danych. Screenshoty anonimizuje bezpośrednio w Shutter. W przypadku PDF procedura najczęściej składa się z następujących etapów:

  • konwersja PDF→JPG - przy użyciu pdfimages (składnik poppler-utils)
    pdfimages -j file.pdf prefix
  • usunięcie wrażliwych danych - GIMP, sporadycznie Shutter,
  • przywrócenie pierwotnego formatu wraz z ewentualną redukcją rozmiaru (-threshold, -density) - convert z pakietu Imagemagick
    convert *.jpg *.pdf

Właściwe oprogramowanie jest dostępne w repozytoriach czołowych dystrybucji, a oprogramowanie nie wymaga konfiguracji, więc opis instalacji zostanie pominięty.

Rozwiązanie zalecane (Windows/Linuks)

Screenshot GIMP Mając na uwadze dostosowanie oprogramowanie do użytkowników systemu Windows proponuje się wykorzystanie w front-endzie Gimpa, a w back-endzie skryptu Python odwołującego się do ww. convert. Opiera się to na etapie pośrednim obrazu jak powyższa procedura stosowana.

Konfiguracja środowiska

Należy pobrać i zainstalować w standardowy sposób w kolejności jak wymieniono:

  1. Python w wersji 2.7 - http://www.python.org/download/
  2. PyGTK z modułami PyGTK, PyCairo i PyGObject 3) - http://www.pygtk.org/downloads.html

Konfiguracji należy dokonać następująco:

  1. Pobierz plik wtyczki GIMP export-layers.txt jako export-layers.py do katalogu %UserProfile%\.gimp-2.8\plug-ins (tzn.w katalogu domowym) i dopilnuj, aby plik przestał być zwykłym plikiem tekstowym (zmienił rozszerzenie).
  2. TODO: Ustalić dopuszczalność edycji systemowym notatnikiem (znak nowej linii).
  3. Otwórz plik tekstowy. Zmień ścieżkę w linii
    CONVERT_PATH="C:\Program Files\ImageMagick-6.8.6-Q16\convert.exe"

    na odpowiadającą ścieżce odpowiedniego modułu znajdującego się w miejscu instalacji Imagemagick.

Użytkowanie

W oknie początkowym należy wybrać, aby dokument został otwierany w warstwach. Możesz wybrać DPI wyjściowego dokumentu oraz wybrać strony do załadowania.

Aby otrzymać plik PDF należy wybrać w oknie obrazu „Plik”→„Eksportuj do PDF”.

Uwagi użytkowe

Do zarządzania stronami wykorzystuje się warstwy.

To nie jest błąd, że nie możemy od razu po otwarciu pliku malować.

Należy zaznaczyć (kliknąć) warstwę najwyżej połączoną. Można warstwy przeciągać (TODO: TEST), usuwać, co prowadzi do odpowiednich zmian w pliku wyjściowym. Status warstwy niewidocznej nie jest w żaden sposób odzwierciedlony w pliku wyjściowym. Aby przejść do kolejnej warstwy należy ukryć warstwy wyżej przy użyciu ikony oka (TODO: Znaleźć sposób na zastąpienie zaznaczeniem). Do gwałtownych skoków zaleca się wykorzystywanie skrótu Shift+Ikona, co powoduje natychmiastowe ukazanie wybranej warstwy (strony).

Nie należy korzystać z aerografu, ani pędzla. Niektóre metody rozmycia można odwrócić, dlatego jest ono niezalecane. Zaleca się ołówek. Do kontroli rozmiaru ołówka można wykorzystać skróty klawiaturowe „[” i „]”.

Tips

Doki, karty

Serio, warto poświęcić chwilę raz i poukrywać niepotrzebną listę pędzli, gradientów itd.

Tryb jednego okna

Jeżeli gubisz się w gąszczu okienek możesz przełączyć się do trybu jednego okna.

Optymalizacja Gimpa

Jeżeli chcesz przyspieszyć ładowanie programu Gimp możesz usunąć nadmiarowe wtyczki z katalogu analogicznego do C:\Program Files\GIMP 2\lib\gimp\2.0\plug-ins . Po prostu zmień nazwę tego katalogu i skopiuj jakie pragniesz. Zaleca się zachowanie co najmniej niżej wymienione, lecz pewnie można usunąć jeszcze kilka bez strat. Do odważnych świat należy!

blur.exe
file-pdf-load.exe
file-jpeg.exe
file-png.exe
print.exe
procedure-browser.exe
py-slice.py
pyconsole.py
python-console.py
python-eval.py
script-fu.exe
win-snap.exe

GIMP-a możesz nie zamykać, a zamykać sam dokument (CTRL+W) lub wszystkie dokumenty (CTRL+Shift+W).

Prosta linia ołówkiem

Aby narysować prostą linię ołówkiem:

  • klikamy punkt startowy,
  • przytrzymuje Shift
  • klikamy punkt końcowy
  • ?

~~DISCUSSION~~

it/anonimizacja-pdf.txt · ostatnio zmienione: 2014/02/05 20:41 przez naczelnik
Public Domain
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0