Podręcznik archiwizacji danych społecznych

Bogdan Cichomski, Tomasz Jerzyński, Marcin Zieliński
Zespół Ośrodka Badań Socjologicznych
Instytutu Studiów Społecznych
Uniwersytetu Warszawskiego

Wersja 1

Tekst podręcznika dostępny jest także w formacie dokumentu PDF

Spis treści

  1. Wstęp
  2. Korzyści archiwizacji danych
  3. Znaczenie planowania zarządzaniem danymi
    3.1. Dokumentacja jako część planu projektu
    3.2. Oprogramowanie
  4. Kontrola poprawności danych w zbiorze i jego spójności
    4.1. Kontrola błędów w zbiorze
    4.1.1. “Dzikie kody”
    4.1.2. “Outliers”
    4.2. Kontrola spójności logicznej
    4.2.1 Pytania filtrujące
    4.2.2 Instrukcje przed pytaniem
    4.2.3 Daty i przedziały czasu
    4.3. Kontrola zbiorów o strukturach hierarchicznych
  5. Przygotowanie dokumentacji techniczno-metodologicznej badania
    5.1. Książka kodów (codebook)
    5.2. Rozkłady częstości (frequencies)
    5.3. Statystyki opisowe (descriptive statistics)
  6. Przygotowanie zbiorów do archiwizacji
    6.1. Akceptowane formaty zbiorów danych
    6.2. Techniczne aspekty zbiorów danych
    6.2.1. Słownik definiujący dane (data definition statements)
    6.2.2. Nazwy zmiennych (variable names)
    6.2.3. Etykiety zmiennych (variable labels)
    6.2.4. Wartości zmiennych (values)
    6.2.5. Etykiety wartości (value labels)
    6.2.6. Braki danych i kody specjalne (missing values)
    6.2.6.1 Wybór kodów specjalnych
  7. Zarządzanie danymi
  8. Kopie zapasowe
  9. Anonimizacja
  10. Sumaryczne zestawienie wymagań stawianych deponentom
    10.1. Zbiór danych
    10.2. Dokumentacja
  11. Przekazywanie danych do Archiwum
    11.1 Informacje ogólne
    11.2. Deponowanie danych zarchiwizowanych na płycie CD
    11.3. Przesyłanie danych z wykorzystaniem protokołu FTP
    11.3.1. Konfiguracja programu FTP do pracy z serwerem ADS
    11.3.2. Logowanie się na serwer ADS i upload zbiorów danych
    Aneks A
    Aneks B