Введение в информационный поиск
Введение в информационный поиск — это первый учебник, который содержит взаимосвязанное изложение проблем классического информационного поиска и поиска в вебе, включая смежные задачи классификации и кластеризации текстов. Учебник написан с позиций информатики (computerscience) и содержит современное изложение всех аспектов проектирования и реализации систем сбора, индексирования и поиска документов, методов оценки таких систем, а также введение в методы машинного обучения на базе коллекций текстов.
Несмотря на то что учебник задуман как вводный курс по информационному поиску, он будет интересен исследователям и профессионалам. Полный набор слайдов для лекций и упражнений, сопровождающих книгу, доступен в Интернете.
Об авторах:
Кристофер Д. Маннинг (Christofer D. Manning) — профессор компьютерных наук в Станфордском университете (Stanford University).
Прабхакар Рагхаван (Prabhakar Raghavan) — директор департамента Yahoo! Research и профессор-консультант по компьютерным наукам Станфордского университета.
Хайнрих Шютце (Hinrich Schutze) — заведующий кафедрой теоретической вычислительной лингвистики Института обработки текстов на естественных языках (Университет Штутгарта).
Предисловие
Глава 1. Булев поиск
Глава 2. Лексикон и списки словопозиций
Глава 3. Словари и нечеткий поиск
Глава 4. Построение индекса
Глава 5. Сжатие индекса
Глава 6. Ранжирование, взвешивание терминов и модель векторного пространства
Глава 7. Ранжирование в полнофункциональной поисковой системе
Глава 8. Оценка информационного поиска
Глава 9. Обратная связь по релевантности и расширение запроса
Глава 10. XML-поиск
Глава 11. Вероятностная модель информационного поиска
Глава 12. Языковые модели для информационного поиска
Глава 13. Классификация текстов и наивный байесовский подход
Глава 14. Классификация в векторном пространстве
Глава 15. Метод опорных векторов и машинное обучение на документах
Глава 16. Плоская кластеризация
Глава 17. Иерархическая кластеризация
Глава 18. Разложение матриц и латентно-семантическое индексирование
Глава 19. Основы поиска в вебе
Глава 20. Обход и индексирование веба
Глава 21. Анализ ссылок
Библиография