Indeksowanie treści : porównanie skuteczności metod tradycyjnych i automatycznych
Na dod. s. tyt.: "Content indexing ".
Słowa kluczowe - klucz do informacji czy źródło chaosu? Autor rozważa zalety i wady reprezentacji treści poprzez słowa kluczowe i analizuje to zjawisko jako dominującą formę wyszukiwania. Badacz skupia się też na porównaniu dwóch typów przetwarzania i opracowania informacji: automatycznego i kognitywnego. W podzielonej na dwie części książce nie zabrakło praktycznych wskazówek z zakresu optymalizacji tekstu na
potrzeby automatycznego przetwarzania oraz prezentacji nowatorskiej metody badawczej. Zagadnienia poruszone w "Indeksowaniu treści“ znajdą swoje miejsce podczas zajęć dotyczących wyszukiwania informacji, przydadzą się osobom pracującym z informacją cyfrową, bibliotekarzom oraz badaczom procesów przetwarzania informacji.***".przeczytałem Pańską książkę i jestem usatysfakcjonowany. Nareszcie konkrety. Powinien Pan dalej zgłębiać problem, bo od automatycznego indeksowania nie uciekniemy, a na razie na tym polu królują slogany, eufemizmy i często bzdury. Nie mogłem tego słuchać, ani tym bardziej czytać - to zresztą na uboczu moich zainteresowań - dopóki nie natrafiłem na książkę p. Woźniak-Kasperek, a teraz na tę Pańską. To zaczyna mieć ręce i nogi także w wymiarze praktycznym i realnie zastosowawczym. Sam pomysł na takie badanie był bardzo dobry."Z listu profesora Jacka Wociechowskiego do autora książki
Zobacz pełny opisOdpowiedzialność: | Piotr Malak. |
Seria: | Nauka, Dydaktyka, Praktyka - Stowarzyszenie Bibliotekarzy Polskich : 133 |
Hasła: | Języki informacyjne Języki informacyjne Języki informacyjne Języki informacyjne Klasyfikacja dziesiętna - komputeryzacja Klasyfikacja dziesiętna - komputeryzacja Klasyfikacja dziesiętna - komputeryzacja Klasyfikacja dziesiętna - komputeryzacja Opracowanie rzeczowe Opracowanie rzeczowe Opracowanie rzeczowe Opracowanie rzeczowe Indeksy Indeksy Indeksy Indeksy |
Adres wydawniczy: | Warszawa : Wydawnictwo Stowarzyszenia Bibliotekarzy Polskich, 2012. |
Opis fizyczny: | 195 s. : il. ; 21 cm. |
Uwagi: | Bibliogr. s. 173-184. Indeks. Druga s. tyt. w jęz. ang.Spis treści również w jęz. ang. |
Skocz do: | Dodaj recenzje, komentarz |
- WSTĘP
- WYSZUKIWANIE INFORMACJI W SIECI ROZLEGŁEJ: KATALOGI STRON WWW A WYSZUKIWARKI INTERNETOWE
- CEL I STRUKTURA PRACY
- ZWIĄZKI NLP Z INFORMACJĄ NAUKOWĄ
- 1.1. WPROWADZENIE TEORETYCZNE DO PRZETWARZANIA JĘZYKA NATURALNEGO
- 1.2.1. Ustalenia terminologiczne związane z nazwą badań nad tekstami języka naturalnego
- 1.2. WYBRANE KIERUNKI BADAWCZE
- 1.2.1. Wyszukiwanie informacji w dokumentach
- 1.2.2. Grupowanie dokumentów (klasteryzacja)
- 1.2.2.1. Grupowanie oparte o wzorce
- 1.2.2.2. Grupowanie bezwzorcowe
- USTALENIA TERMINOLOGICZNE ORAZ WYBRANE METODY KOMPUTEROWEGO PRZETWARZANIA JĘZYKA NATURALNEGO
- 2.1. TERMINY PRZYJĘTE W KSIĄŻCE
- 2.2. ANALIZA KWANTYTATYWNA TEKSTÓW
- 2.2.1. Jednostki badania kwantytatywnego tekstów
- 2.2.2. Cechy statystyczne jednostek leksykalnych
- 2.2.3. Zależności leksykalne
- 2.3. WYBRANE METODY REPREZENTACJI TREŚCI DOKUMENTÓW
- 2.3.1. Zbiór słów (bag-of-words)
- 2.3.2. Lista frekwencyjna
- 2.3.3. Reprezentacja wektorowa
- 2.4. WYBRANE SPOSOBY OKREŚLANIA WAGI SŁÓW
- 2.5. OPTYMALIZACJA LINGWISTYCZNA TREŚCI DOKUMENTU
- 2.5.1. Przygotowanie dokumentów do indeksowania treści
- 2.5.2. Usunięcie wyrazów mało znaczących
- 2.5.3. Wyznaczanie rdzenia wyrazu
- 2.5.3.1. Metody wskazywania wspólnego rdzenia
- 2.5.4. Wskazywanie lematu słowoformy
- ZASADY POSTĘPOWANIA BADAWCZEGO I OPIS PRZYGOTOWANEGO SYSTEMU
- 3.1. PRZEDMIOT, CEL I METODOLOGIA BADAŁ
- 3.1.1. Przedmiot badań
- 3.1.2. Cele i hipotezy badawcze
- 3.2. ZASTOSOWANE METODY, TECHNOLOGIE I NARZĘDZIA BADAWCZE
- 3.2.1. Zastosowane technologie
- 3.2.2. Język Python
- 3.3. ORGANIZACJA I PRZEBIEG BADAŁ
- 3.3.1. Przygotowanie dokumentów do analizy
- 3.3.2. Klasyfikacja zawartości pliku
- 3.3.3. Usunięcie wyrazów nierelewantnych
- 3.3.4. Ustalenie podstawowej postaci wyrazów
- 3.3.5. Zliczenie wystąpień danego słowa
- 3.3.6. Analiza słów wyróżnionych
- 3.3.7. Metody ustalania wagi słów
- 3.3.8. Porównanie zestawów słów kluczowych ustalanych tradycyjnie i automatycznie
- 3.4. PREZENTACJA MATERIAŁU BADAWCZEGO
- 3.4.1. Korpus tekstów
- 3.4.2. Teksty z zakresu informacji naukowej i bibliologii
- 3.4.2.1. Artykuły z czasopism
- 3.4.2.2. Artykuły z materiałów konferencyjnych
- 3.4.3. Subkorpus ekonomia i zarządzanie
- 3.4.4. Słowa kluczowe
- 3.4.4.1. Słowa kluczowe wybierane przez autorów
- 3.4.4.2. Słowa kluczowe wskazane przez indeksatorów
- 3.4.4.3. Słowa kluczowe generowane automatycznie
- ANALIZA ORAZ INTERPRETACJA MATERIAŁU BADAWCZEGO I WYNIKÓW BADAŁ
- 4.1. ANALIZA GŁÓWNEGO KORPUSU TEKSTÓW
- 4.1.1. Czasopisma
- 4.1.2. Materiały konferencyjne
- 4.1.3. Analiza całego korpusu
- 4.2. ANALIZA KORPUSU POMOCNICZEGO
- 4.3. SŁOWA KLUCZOWE UZYSKANE W WYNIKU INDEKSOWANIA TRADYCYJNEGO I AUTOMATYCZNEGO
- 4.3.1. Waga słów wyróżnionych w tekście
- 4.3.2. Słowa kluczowe wskazywane automatycznie
- 4.4. OCENA ZASTOSOWANYCH METOD USTALANIA WAGI SŁOWA
- PODSUMOWANIE
- POSTULATY TECHNOLOGICZNE
- Standardy metainformacji
- Formaty zapisu dokumentów
- PROPOZYCJE DALSZYCH BADAŃ
- BIBLIOGRAFIA
- SPIS TABEL
- SPIS ILUSTRACJI
- SPIS WYKRESÓW
- INDEKS RZECZOWY
Zobacz spis treści
Sprawdź dostępność, zarezerwuj (zamów):
(kliknij w nazwę placówki - więcej informacji)