Предисловие
Введение
Благодарности
1. Введение в коллективный разум
Что такое коллективный разум
Что такое машинное обучение
Ограничения машинного обучения
Примеры из реальной жизни
Другие применения обучающих алгоритмов
2. Выработка рекомендаций
Коллаборативная фильтрация
Сбор информации о предпочтениях
Отыскание похожих пользователей
Рекомендование предметов
Подбор предметов
Построение рекомендателя ссылок с помощью API сайта del.icio.us
Фильтрация по схожести образцов
Использование набора данных MovieLens
Сравнение методов фильтрации по схожести пользователей и по схожести образцов
Упражнения
3. Обнаружение групп
Обучение с учителем и без него
Векторы слов
Иерархическая кластеризация
Рисование дендрограммы
Кластеризация столбцов
Кластеризация методом K-средних
Кластеры предпочтений
Просмотр данных на двумерной плоскости
Что еще можно подвергнуть кластеризации
Упражнения
4. Поиск и ранжирование
Что такое поисковая машина
Простой паук
Построение индекса
Запросы
Ранжирование по содержимому
Использование внешних ссылок на сайт
Обучение на основе действий пользователя
Упражнения
5. Оптимизация
Групповые путешествия
Представление решений
Целевая функция
Случайный поиск
Алгоритм спуска с горы
Алгоритм имитации отжига
Генетические алгоритмы
Поиск реальных авиарейсов
Оптимизация с учетом предпочтений
Визуализация сети
Другие возможности
Упражнения
6. Фильтрация документов
Фильтрация спама
Документы и слова
Обучение классификатора
Вычисление вероятностей
Наивная классификация
Метод Фишера
Сохранение обученных классификаторов
Фильтрация блогов
Усовершенствование алгоритма обнаружения признаков
Использование службы Akismet
Альтернативные методы
Упражнения
7. Моделирование с помощью деревьев решений
Прогнозирование количества регистраций
Введение в теорию деревьев решений
Обучение дерева
Выбор наилучшего разбиения
Рекурсивное построение дерева
Отображение дерева
Классификация новых наблюдений
Отсечение ветвей дерева
Восполнение отсутствующих данных
Числовые результаты
Моделирование цен на недвижимость
Моделирование степени привлекательности
В каких случаях применять деревья решений
Упражнения
8. Построение ценовых моделей
Построение демонстрационного набора данных
Алгоритм k--ближайших соседей
Взвешенные соседи
Перекрестный контроль
Гетерогенные переменные
Оптимизация масштаба
Неравномерные распределения
Использование реальных данных - API сайта eBay
В каких случаях применять метод k--ближайших соседей
Упражнения
9. Более сложные способы классификации: ядерные методы и машины опорных векторов
Набор данных для подбора пар
Затруднения при анализе данных
Простая линейная классификация
Категориальные свойства
Масштабирование данных
Идея ядерных методов
Метод опорных векторов
Библиотека LIBSVM
Подбор пар на сайте Facebook
Упражнения
10. Выделение независимых признаков
Массив новостей
Прошлые подходы
Неотрицательная матричная факторизация
Вывод результатов
Использование данных о фондовом рынке
Упражнения
11. Эволюционирующий разум
Что такое генетическое программирование
Программы как деревья
Создание начальной популяции
Проверка решения
Мутация программ
Скрещивание
Построение окружающей среды
Простая игра
Направления развития
Упражнения
12. Сводка алгоритмов
Байесовский классификатор
Классификатор на базе деревьев решений
Нейронные сети
Метод опорных векторов
k--ближайшие соседи
Кластеризация
Многомерное шкалирование
Неотрицательная матричная факторизация
Оптимизация
Приложения
А. Дополнительные библиотеки
В. Математические формулы
Алфавитный указатель