Miejska Biblioteka Publiczna

im. Jerzego Pilcha w Kielcach

book
book

Indeksowanie treści : porównanie skuteczności metod tradycyjnych i automatycznych

Na dod. s. tyt.: "Content indexing ".

Autor: Malak, Piotr.




Słowa kluczowe - klucz do informacji czy źródło chaosu? Autor rozważa zalety i wady reprezentacji treści poprzez słowa kluczowe i analizuje to zjawisko jako dominującą formę wyszukiwania. Badacz skupia się też na porównaniu dwóch typów przetwarzania i opracowania informacji: automatycznego i kognitywnego. W podzielonej na dwie części książce nie zabrakło praktycznych wskazówek z zakresu optymalizacji tekstu na

potrzeby automatycznego przetwarzania oraz prezentacji nowatorskiej metody badawczej. Zagadnienia poruszone w "Indeksowaniu treści“ znajdą swoje miejsce podczas zajęć dotyczących wyszukiwania informacji, przydadzą się osobom pracującym z informacją cyfrową, bibliotekarzom oraz badaczom procesów przetwarzania informacji.***".przeczytałem Pańską książkę i jestem usatysfakcjonowany. Nareszcie konkrety. Powinien Pan dalej zgłębiać problem, bo od automatycznego indeksowania nie uciekniemy, a na razie na tym polu królują slogany, eufemizmy i często bzdury. Nie mogłem tego słuchać, ani tym bardziej czytać - to zresztą na uboczu moich zainteresowań - dopóki nie natrafiłem na książkę p. Woźniak-Kasperek, a teraz na tę Pańską. To zaczyna mieć ręce i nogi także w wymiarze praktycznym i realnie zastosowawczym. Sam pomysł na takie badanie był bardzo dobry."Z listu profesora Jacka Wociechowskiego do autora książki

Zobacz pełny opis
Odpowiedzialność:Piotr Malak.
Seria:Nauka, Dydaktyka, Praktyka - Stowarzyszenie Bibliotekarzy Polskich : 133
Hasła:Języki informacyjne
Języki informacyjne
Języki informacyjne
Języki informacyjne
Klasyfikacja dziesiętna - komputeryzacja
Klasyfikacja dziesiętna - komputeryzacja
Klasyfikacja dziesiętna - komputeryzacja
Klasyfikacja dziesiętna - komputeryzacja
Opracowanie rzeczowe
Opracowanie rzeczowe
Opracowanie rzeczowe
Opracowanie rzeczowe
Indeksy
Indeksy
Indeksy
Indeksy
Adres wydawniczy:Warszawa : Wydawnictwo Stowarzyszenia Bibliotekarzy Polskich, 2012.
Opis fizyczny:195 s. : il. ; 21 cm.
Uwagi:Bibliogr. s. 173-184. Indeks. Druga s. tyt. w jęz. ang.Spis treści również w jęz. ang.
Skocz do:Dodaj recenzje, komentarz
Spis treści:

  1. WSTĘP
  2. WYSZUKIWANIE INFORMACJI W SIECI ROZLEGŁEJ: KATALOGI STRON WWW A WYSZUKIWARKI INTERNETOWE
  3. CEL I STRUKTURA PRACY
  4. ZWIĄZKI NLP Z INFORMACJĄ NAUKOWĄ
  5. 1.1.  WPROWADZENIE TEORETYCZNE DO PRZETWARZANIA JĘZYKA NATURALNEGO
  6. 1.2.1.  Ustalenia terminologiczne związane z nazwą badań nad tekstami języka naturalnego
  7. 1.2.  WYBRANE KIERUNKI BADAWCZE
  8. 1.2.1.  Wyszukiwanie informacji w dokumentach
  9. 1.2.2.  Grupowanie dokumentów (klasteryzacja)
  10. 1.2.2.1. Grupowanie oparte o wzorce
  11. 1.2.2.2. Grupowanie bezwzorcowe
  12. USTALENIA TERMINOLOGICZNE ORAZ WYBRANE METODY KOMPUTEROWEGO PRZETWARZANIA JĘZYKA NATURALNEGO
  13. 2.1.  TERMINY PRZYJĘTE W KSIĄŻCE
  14. 2.2.  ANALIZA KWANTYTATYWNA TEKSTÓW
  15. 2.2.1.  Jednostki badania kwantytatywnego tekstów
  16. 2.2.2.  Cechy statystyczne jednostek leksykalnych
  17. 2.2.3.  Zależności leksykalne
  18. 2.3.  WYBRANE METODY REPREZENTACJI TREŚCI DOKUMENTÓW
  19. 2.3.1.  Zbiór słów (bag-of-words)
  20. 2.3.2.  Lista frekwencyjna
  21. 2.3.3.  Reprezentacja wektorowa
  22. 2.4.  WYBRANE SPOSOBY OKREŚLANIA WAGI SŁÓW
  23. 2.5.  OPTYMALIZACJA LINGWISTYCZNA TREŚCI DOKUMENTU
  24. 2.5.1.  Przygotowanie dokumentów do indeksowania treści
  25. 2.5.2.  Usunięcie wyrazów mało znaczących
  26. 2.5.3.  Wyznaczanie rdzenia wyrazu
  27. 2.5.3.1. Metody wskazywania wspólnego rdzenia
  28. 2.5.4.  Wskazywanie lematu słowoformy
  29. ZASADY POSTĘPOWANIA BADAWCZEGO I OPIS PRZYGOTOWANEGO SYSTEMU
  30. 3.1.  PRZEDMIOT, CEL I METODOLOGIA BADAŁ
  31. 3.1.1.  Przedmiot badań
  32. 3.1.2.  Cele i hipotezy badawcze
  33. 3.2.  ZASTOSOWANE METODY, TECHNOLOGIE I NARZĘDZIA BADAWCZE
  34. 3.2.1.  Zastosowane technologie
  35. 3.2.2.  Język Python
  36. 3.3.  ORGANIZACJA I PRZEBIEG BADAŁ
  37. 3.3.1.  Przygotowanie dokumentów do analizy
  38. 3.3.2.  Klasyfikacja zawartości pliku
  39. 3.3.3.  Usunięcie wyrazów nierelewantnych
  40. 3.3.4.  Ustalenie podstawowej postaci wyrazów
  41. 3.3.5.  Zliczenie wystąpień danego słowa
  42. 3.3.6.  Analiza słów wyróżnionych
  43. 3.3.7.  Metody ustalania wagi słów
  44. 3.3.8.  Porównanie zestawów słów kluczowych ustalanych tradycyjnie i automatycznie
  45. 3.4.  PREZENTACJA MATERIAŁU BADAWCZEGO
  46. 3.4.1.  Korpus tekstów
  47. 3.4.2.  Teksty z zakresu informacji naukowej i bibliologii
  48. 3.4.2.1. Artykuły z czasopism
  49. 3.4.2.2. Artykuły z materiałów konferencyjnych
  50. 3.4.3.  Subkorpus ekonomia i zarządzanie
  51. 3.4.4.  Słowa kluczowe
  52. 3.4.4.1. Słowa kluczowe wybierane przez autorów
  53. 3.4.4.2. Słowa kluczowe wskazane przez indeksatorów
  54. 3.4.4.3. Słowa kluczowe generowane automatycznie
  55. ANALIZA ORAZ INTERPRETACJA MATERIAŁU BADAWCZEGO I WYNIKÓW BADAŁ
  56. 4.1.  ANALIZA GŁÓWNEGO KORPUSU TEKSTÓW
  57. 4.1.1.  Czasopisma
  58. 4.1.2.  Materiały konferencyjne
  59. 4.1.3.  Analiza całego korpusu
  60. 4.2.  ANALIZA KORPUSU POMOCNICZEGO
  61. 4.3.  SŁOWA KLUCZOWE UZYSKANE W WYNIKU INDEKSOWANIA TRADYCYJNEGO I AUTOMATYCZNEGO
  62. 4.3.1.  Waga słów wyróżnionych w tekście
  63. 4.3.2.  Słowa kluczowe wskazywane automatycznie
  64. 4.4.  OCENA ZASTOSOWANYCH METOD USTALANIA WAGI SŁOWA
  65. PODSUMOWANIE
  66. POSTULATY TECHNOLOGICZNE
  67. Standardy metainformacji
  68. Formaty zapisu dokumentów
  69. PROPOZYCJE DALSZYCH BADAŃ
  70. BIBLIOGRAFIA
  71. SPIS TABEL
  72. SPIS ILUSTRACJI
  73. SPIS WYKRESÓW
  74. INDEKS RZECZOWY

Zobacz spis treści



Sprawdź dostępność, zarezerwuj (zamów):

(kliknij w nazwę placówki - więcej informacji)

Filia nr 10
ul. M. Konopnickiej 5

Sygnatura:
Numer inw.: 1549
Dostępność: tylko na miejscu

schowek

Dodaj komentarz do pozycji:

Swoją opinię można wyrazić po uprzednim zalogowaniu.