Terminy proste i frazy
W wyszukiwaniu można używać terminów prostych, czyli pojedynczy wyrazów oraz fraz, czyli wyrażeń złożonych z kilku słów ujętych w cudzysłów np. „więzienie na Pawiaku”. W przypadku użycia cudzysłowu wyszukiwane będą tylko te dokumenty, które zawierają całą frazę.
Terminy wyszukiwawcze można łączyć za pomocą operatorów logicznych. Można też używać tzw. znaków maskujących, które zastępują dowolne litery i cyfry oraz ich ciągi, wyszukiwać terminy podobne, znajdujące się w pewnej odległości od siebie lub określać priorytet wyszukiwanych terminów.
Operatory logiczne
Znaki maskujące
Wyszukiwanie rozmyte
Wyszukiwanie rozmyte (fuzzy search) znajduje zastosowanie w wypadku terminów prostych podobnych do siebie np. Holocaust, Holokaust. Dokumenty zawierające te terminy można wyszukać dodając znak tyldy do terminu: holocaust~.
Stopień poszukiwanego podobieństwa można określić współczynnikiem, który zmienia się w zakresie od 0 (brak podobieństwa) do 1 (terminy identyczne). Domyślnie współczynnik podobieństwa ustawiony jest na wartość 0.5. Aby ją zmienić, do wyszukiwanego terminu należy dodać znak tyldy wraz z wyraźnie określonym współczynnikiem, np. holocaust~0.4.
Wyszukiwanie wg sąsiedztwa
Możliwe jest również określenie w jakiej odległości ma się znajdować jednen z wyszukiwanych terminów od innego (tzw. proximity search). Jeśli np. pamiętamy, że dokumencie w niewielkiej odległości od siebie pojawiały się wyrażenia Gestapo oraz tortury, możemy użyć następującego zapytania: „Gestapo tortury”~6.
Określanie ważności terminu
Można określić priorytet wyszukiwanego terminu przez dodanie znaku ^ wraz z liczbą (większą niż 1). Np. zapytanie Lange^4 Sajnóg zwróci dokumenty, w których występują oba nazwiska, ale na początku listy znajdą się te, w których częściej pojawia się nazwisko oznaczone wyższym priorytetem (Lange). Domyślny priorytet wyszukiwania wynosi 1.
Łączenie zapytań
Wyrażenia w zapytaniach złożonych można grupować za pomocą nawiasów. Zabieg taki pozwala nadać rozbudowanym zapytaniom zamierzony, jednoznaczny sens, podobnie jak to się dzieje w działaniach arytmetycznych.
Najpierw przetwarzane są wyrażenia cząstkowe wewnątrz nawiasów, a następnie większe całości. Zapytanie o kształcie: „obóz zagłady w Treblince” AND (Holokaust OR Holocaust) spowoduje wyszukanie dokumentów, w ktorych występuje wyrażenie „obóz zagłady w Treblince” oraz jedno z dwóch słów (lub oba): Holokaust, Holocaust.
Znaki specjalne
Ze zrozumiałych względów znaki służące do budowania zapytań złożonych (+ – && || ! ( ) { } [ ] ^ ” ~ * ? : ) są traktowane podczas wyszukiwania inaczej niż pozostałe: pełnią rolę elementów składni zapytania, a nie cząstek wyszukiwanego wyrażenia. Aby objąć je procesem wyszukiwania należy umieścić przed nimi tzw. znak ucieczki . Np. w celu wyszukania frazy „(2 + 2)*2” należy wpisać „( 2 + 2 ) * 2”
Źródło opisu
Pełny opis sposobu formułowania zapytań (strona w języku angielskim): Apache Lucene Query Parser Syntax.
Tekst oryginalnie zamieszczony na stronach Kujawsko-Pomorskiej Biblioteki Cyfrowej.
Ten utwór jest dostępny na licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 2.5 Polska.
Archiwum Instytutu Solidarności i Męstwa im. Witolda Pileckiego ul. Foksal 17 00-372 Warszawa
Pon. - Pt. 9:00 - 15:00
(+48) 22 182 24 75
Instytut Solidarności i Męstwa im. Witolda Pileckiego od początku swojego istnienia zajmuje się gromadzeniem i udostępnianiem dokumentów ukazujących oblicza zeszłego stulecia. Wiele z nich było dotąd rozproszonych, nieodkrytych lub zapomnianych. Cześć znajdowała się w archiwach na innych kontynentach. By ułatwić pracę badaczom, stworzyliśmy nowatorskie archiwum cyfrowe, dzięki któremu w łatwy sposób można zapoznawać się ze źródłami. Dążymy do zgromadzenia w jednym miejscu jak największej liczby archiwaliów. Dzięki temu wystarczy kilka kliknięć, by poznawać dzieje Polski i jej obywateli w XX wieku.
Na stronie internetowej Instytutu można zapoznać się z opisem zbiorów dostępnych w Czytelni oraz uzyskać informacje potrzebne do zaplanowania wizyty. Same dokumenty są dostępne tylko w Czytelni Instytutu. To ogólnodostępne miejsce, w którym bezpłatnie są udostępnianie materiały badawcze naukowcom i wszystkim zainteresowanym, oferuje ono także przyjazne środowisko do cichej pracy.
Materiały są pozyskiwane od instytucji, archiwów publicznych, organizacji społecznych, zarówno krajowych, jak i międzynarodowych, a także od osób prywatnych. Zbiory są systematycznie rozbudowywane. Pełnotekstowa wyszukiwarka przeszukująca zarówno treść dokumentów, jak i metadane pozwoli użytkownikowi na szybkie dotarcie do intersującego go źródła. Innym możliwym sposobem poruszania się po zgromadzonych zasobach jest wykorzystanie ich podziału na instytucje archiwalne, z których pochodzą dokumenty. W takiej kolekcji pochodzącej z danego archiwum znajdują się ułożone hierarchicznie zespoły i jednostki archiwalne.
Większość materiałów archiwalnych znajduje się w otwartym dostępie na komputerach w Czytelni. Część naszych zbiorów, np. te pochodzące z Bundesarchiv, jest jednak objęta ograniczeniami dostępności wynikającymi z umów między Instytutem a instytucjami je przekazującymi. Po przybyciu do Czytelni należy dopełnić formalności, podpisując stosowne oświadczenia. Dzięki nim dostęp do treści dokumentów będzie możliwy na miejscu.
Przed wizytą zalecamy zapoznanie się z zakresem i strukturą naszych zasobów archiwalnych, bibliotecznych i audiowizualnych, a także z regulaminem pobytu i korzystania ze zbiorów.
Wszystkich chętnych do zapoznania się z naszymi zbiorami zapraszamy do Instytutu Pileckiego na ul. Foksal 17 w Warszawie. Czytelnia jest otwarta od poniedziałku do piątku w godzinach 9–15. Przed wizytą należy się wcześniej umówić. Można to zrobić, wysyłając e-mail na adres czytelnia@instytutpileckiego.pl lub dzwoniąc pod numer (+48) 22 182 24 75.