Код бестселлера - страница 21



 – книга Эрнеста Клайна о компьютерном игроке в виртуальной реальности. Ее тоже сейчас экранизируют. В четырех романах – Филипа К. Дика, «Все, чего я не сказала»[60], «Поезд сирот»[61] и «Бруклин»[62] – действие происходит в ХХ веке, но в разные десятилетия. Может быть, ключ к мегауспеху – не насилие, а историческая тематика? Даже если это и так, ее все же маловато для обобщения: четыре книги – это не десять. Что же это все-таки за тема, общая для всего списка? Может быть – путешествие?

Пока ясно только одно: во всех книгах списка персонажам приходится нелегко. Но чтобы обнаружить закономерности, нужно в первую очередь наблюдать за фактами и проверять гипотезы. Давайте шутки ради скажем, что если издательство намерено выложить несколько миллионов долларов за новый бестселлер, то, судя по этому списку, он должен быть о путешествии, которое главный герой совершает против своей воли или в страхе. Пожалуй, на сегодняшнем рынке такая книга имеет хорошие шансы на успех. И конечно, это предоставит редактору большую свободу действий, поскольку книга, соответствующая этому описанию, может быть и любовным романом, и триллером, и фантастическим романом, и произведением серьезной литературы. Этот сюжет можно отдать на разработку разным писателям и получить множество непохожих книг, несущих читателю разные послания, – поэтому все бестселлеры кажутся различными, хотя, как мы скоро увидим, в каком-то смысле они сходны.

Вот важный вывод из этого блиц-анализа, который следует запомнить: тема шире границ жанра. Первое, что нужно сделать, если вы хотите писать, публиковать или распознавать бестселлеры, – вообще забыть о понятии жанра, несмотря на его роль в книжном деле. Свадьба и супружеская жизнь могут фигурировать в книге любого жанра. Любовь и преступление – тоже. Пропорции тем в разных жанрах могут отличаться, но важно, чтобы где-то в тексте эти ключевые темы были. Вся проделанная нами работа доказывает, что концепция жанра подобна смирительной рубашке. Забудьте о ней. Если вы готовы взять на вооружение подобный образ мыслей, значит, вы уже начали мыслить как наш компьютер, строящий прогностическую модель.

Проверка

Для каждой книги в нашей коллекции были вычислены процентные значения, указывающие на содержание в ней той или иной из 500 тем, попавших в наш список. Конечно, в некоторых книгах какие-то темы не появляются вообще – например, в «Коде да Винчи» нет ковбоев. Но для каждого текста мы получили диаграмму вроде той, что изображена на рис. 3. Эта диаграмма – для книги Джоди Пиколт «Последнее правило»[63]: 23 % объема занимает тема, которую мы условно назвали «Дети и школа», 10 % – «Преступления», 7 % – «Судебные процессы и юридические вопросы», 6 % – «Домашние дела» и 2 % – «Близкие отношения».


Рис. 3. Основные темы романа Джоди Пиколт «Последнее правило»


После того как наш компьютер выделил основные темы, каталогизировал их и определил пропорцию каждой темы в каждой книге, мы обработали случайно выбранное подмножество результатов с помощью алгоритма машинного обучения, которому было заранее известно, какие книги в коллекции являются бестселлерами, а какие – нет. Используя эту информацию, программа подсчитала, какие темы и в каких пропорциях наиболее вероятно встретить в случайно выбранном бестселлере. Более того, эта же программа может определить, в использовании каких тем наиболее ярко проявляется различие между бестселлерами и небестселлерами.