Instrukcja


Szybki start

W tej sekcji znajdują się podstawowe instrukcje dla spieszącego się użytkownika, który chce po prostu wykorzystać interfejs korpusu do szybkiego wyszukiwania. Znajdujące się tutaj wątki są rozwinięte w pełnej instrukcji dla Korpusu Barokowego[1], na którego rozwiązaniach opiera się w dużej mierze korpus sejmikowy (nie ma jednak w tym drugim podziału na warstwę ortograficzną i transliterowaną; zastosowany został też tylko jeden tager: Concraft).

Podstawowe zapytania o wyraz

Aby znaleźć wystąpienie jakiejś formy wyrazu w korpusie (np. marszałka), należy po prostu wpisać żądaną formę w polu Zapytanie i kliknąć Wyszukaj.

Zastosowany podział na wyrazy (czy też, technicznie rzecz biorąc, na jednostki zwane segmentami) zarysowany jest w książce o Narodowym Korpusie Języka Polskiego[2].

Jeżeli chcemy znaleźć wszystkie formy jakiegoś słowa, należy znaleźć jego formę podstawową, zwaną też formą hasłową czy słownikową albo lematem. Tabela kategorii gramatycznych w pełnej instrukcji dla Korpusu Barokowego[1] podaje dokładne metody odnajdywania formy hasłowej (często jest to taka sama forma, po jakiej szukalibyśmy słowa w słowniku).

Zapytanie o formę hasłową piszemy według szablonu [base="x"], gdzie x należy zastąpić formą hasłową (cudzysłowy muszą być zachowane). Na przykład jeżeli chcemy znaleźć wszystkie wystąpienia hasła marszałek, wpisujemy jako zapytanie: [base="marszałek"].

Zapytania o ciąg segmentów

Aby zapytać o ciąg następujących po sobie wyrazów, wystarczy podać więcej niż jeden segment w zapytaniu, bądź to po prostu jako ciąg form wyrazowych, bądź to za pomocą wielu specyfikacji wyrazów w nawiasach kwadratowych. (Aby zapytać o konkretną formę w nawiasie kwadratowym, używamy szablonu [orth="x"]: na przykład [orth="marszałek"], co oznacza to samo, co proste zapytanie marszałek).

Jeśli chcemy umożliwić wyszukiwarce ,,złapanie’’ jednego dowolnego segmentu, wystarczy pozostawić nawias kwadratowy pusty: [].

Przykład: zapytanie [base="marszałek"] [] [base="koronny"] odnajdzie wszyskie fragmenty, gdzie występują formy haseł marszałek i koronny przedzielone dowolnym słowem: marszałka wielkiego koronnego, marszałkowi nadwornemu koronnemu itd.

Więcej informacji na temat języka zapytań korpusu znależć można w rozdziale 5 instrukcji Korpusu Barokowego[1].

Wyjaśnienia dotyczące interfejsu

Dodatkowe opcje zapytań

Pod menu Metadane kryje się funkcja zawężenia zakresu wyszukiwania na podstawie cech poszczególnych dokumentów sejmikowych. Nazywa się to dodawaniem ograniczeń. Dodatkowe ograniczenia (więcej niż jedno) da się dodać za pomocą przycisku Dodaj ograniczenie, natomiast zbędne ograniczenia usuwamy za pomocą przycisku ze znakiem minus.

Można, między innymi, wyszukiwać tylko wśród dokumentów z jednego regionu (metadana Jednostka samorządowa) albo z jakiegoś okresu (Data uchwalenia). Zazwyczaj dokładne kryterium należy wpisać w kolumnie Zapytanie o metadane. W kolumnie Ograniczenie można wybrać, czy życzymy sobie, żeby dana musiała odpowiadać kryterium (=), być odeń mniejsza (<) itp.

Ograniczenie zawiera oznacza, że podany napis znajduje się w napisie będącym kryterium. Np. tytuł Uniwersał królewski, zwołujący sejm walny warszawski, i sejmik w Lipnie. zawiera napis uniwersał: ignorujemy tutaj wielkość liter.

Format daty uchwalenia dokumentu to rok-miesiąc-dzień (np. 1768-09-26 oznacza 26 września 1768 r.). Można jednak wpisać także sam rok (1700) albo miesiąc (1650-01). W przypadku szukania przedziału dat początek i koniec należy oddzielić przecinkiem albo spacją (i tak 1590-03 1653-06-03 znajdzie dokumenty między marcem 1590 a 6 czerwca 1653 roku).

Przycisk Usuń obce segmenty automatycznie dodaje dodatkowe opcje do wpisanego już zapytania, odrzucające obce segmenty (łacinę, artefakty OCR) w wyszukiwaniu.

Klikając na przycisk Konstruktor zapytań, zostaniemy skierowani do okna umożliwiającego zaawansowane budowanie zapytań z wykorzystaniem szczegółówych danych.

Wyniki

W wynikach możemy zobaczyć odnaleziony fragment tekstu w kontekście. Środkowa, wyróżniona kolumna przedstawia fragment zdania wychwycony przez zapytanie. Poza samymi wyrazami obecne są informacje w nawiasach kwadratowych, podające formę hasłową (lemat) każdego wyrazu oraz lingwistyczny opis formy. Szczegółowe informacje dotyczące tego opisu podane są w rozdziale 2. instrukcji Korpusu Barokowego[1].

Pozostałe kolumny podają kontekst odnalezionego fragmentu w całym dokumencie, unikalny identyfikator dokumentu oraz datę jego uchwalenia (jeśli została wykryta przez automatyczny system użyty przy konstrukcji korpusu).

Po najechaniu myszą na fragment w środkowej kolumnie pojawia się (w “dymku”) więcej informacji na jego temat: między innymi tytuł dokumentu (jeśli został wykryty przez oprogramowanie) oraz nazwa instytucji, która stała za tekstem. Kliknięcie ukaże jeszcze więcej informacji i dłuższy fragment kontekstu, który można skopiować do schowka.

[1] https://www.korba.edu.pl/manual

[2] Adam Przepiórkowski, Mirosław Bańko, Rafał L. Górski i Barbara Lewandowska-Tomaszczyk (red.). Narodowy Korpus Języka Polskiego. Wydawnictwo Naukowe PWN, Warszawa 2012. S. 60. (http://nkjp.pl/settings/papers/NKJP_ksiazka.pdf)