Что больше всего похоже на грейпфрут: киви, апельсин или тигр? Кажется, ответить просто. Для человека старше трех лет, по крайней мере, ответ очевиден. Но вот понять сходство у тысяч слов и сделать это быстро можно только с помощью компьютера. Об анализе слов и том же методе, примененном к видеоконтенту, — этот материал из нетривиальной книги «Как люди убеждают».
Работа алгоритмов
Программе не всегда просто дать правильный ответ на приведенный выше вопрос. Машины способны работать с предоставленными данными, они умеют использовать любую доступную информацию, выявлять закономерности и даже принимать решения с минимальным вмешательством человека или без него. Примером могут служить рекомендации на Amazon или Netflix, где анализ информации проводят не люди и не эльфы. Это делают алгоритмы. Они учитывают, что смотрели или покупали вы и все остальные пользователи. Людям, купившим предмет А, обычно нравится предмет Б, следовательно, для купивших А лучшим предложением станет Б.
Автозаполнение и предиктивный набор текста в телефоне работают аналогичным образом. Введите букву «Д», и телефон предложит слово «делать». Принимая это предложение, вы получите следом ряд таких слов, как «будем», «надо», «еще» и «ноги». Алгоритм находит подходящие слова или словосочетания, которые ранее использовали вы или другие пользователи.
Однако программе будет сложно определить, на что больше похож грейпфрут — на киви или на апельсин, — ведь в этом случае для нее не прослеживается никакой взаимосвязи. Одни люди покупают грейпфруты, другие — киви или апельсины, но эта схема покупок не дает должного понимания связи между отдельными товарами. Помимо грейпфрутов, люди могут купить хлеб, рыбу и многое другое. Создание алгоритма невозможно, поскольку взаимосвязь проследить нельзя. Грейпфрут покупают с творогом, хотя у них нет ничего общего.
Данные о словах
Как мы видим, информация о покупках не помогла бы при определении сходства продуктов, однако данные о словах, напротив, могут быть весьма полезны. Ежедневно миллиарды людей пишут триллионы слов в интернете.
Рассмотрим предложение: «Врач вошел в операционную и надел перчатки». На первый взгляд это предложение очень простое, но для программы, устанавливающей взаимосвязь между словами, оно весьма информативно. Оно говорит, что объект «врач» входит в помещение, которое называется «операционной», и надевает предмет под названием «перчатки». Мы получаем представление о том, как связаны разные слова, идеи и концепции. «Доктора» с некоей периодичностью входят и выходят из «операционной», используют «перчатки» или, например, «ведут прием пациентов». Это дает приблизительное представление о том, чем занимается «врач».
Так учат детей. Если вы посмотрите на малыша пяти месяцев, ткнете куда-то в середину своего лица и произнесете: «Нос», ребенок не поймет, что вы хотите сказать. Для него слово «нос» ничем не отличается от слова «демократия» или «истеблишмент». Однако если постоянно произносить это слово, указывая на свой нос или на нос малыша, рано или поздно ребенок его усвоит.
Векторное представление слов
По тому же принципу учатся машины. Загрузив в себя все статьи из «Википедии» или сообщения из Google News, компьютер может начать понимать значения разных слов и улавливать связь между ними.
Если со словом «собака» часто употребляется прилагательное, например «дружелюбный», то читатели (и машины тоже) смогут связать эти два слова и в будущем легче их находить. О «кошке» чаще говорят как о животном «независимом», что тоже позволяет связать два этих слова. Для образования смысловых связей совсем необязательно, чтобы слова употреблялись вместе. Фразы «собаки — животные» и «животные дружелюбны» уже позволят программе соединить понятия «собака» и «дружелюбие», даже при отсутствии точного указания, что собаки дружелюбны.
Лингвист Дж. Р. Ферт сказал: «Смысл слова можно понять из его окружения». Иными словами, можно больше узнать о понятии, изучив контекст — слова, которые стоят рядом. По тому же принципу логично предположить, что люди, которые много времени проводят вместе, вероятно, станут друзьями. Слова, употребляемые в одном предложении, несомненно, так или иначе связаны между собой. На этом основывается метод, который называется векторным представлением слов — сопоставлением слов и представлением их в определенном окружении.
Когда люди переезжают в новый дом или квартиру и раскладывают вещи, то, как правило, при выборе места для них основываются на том, как пользуются этими вещами. Например, ложки кладут в ящик с приборами, овощи — в холодильник, чистящие средства ставят под раковину.
Векторное представление слов поступает так же со словами. Чем сильнее слова связаны друг с другом, тем ближе они расположены. Слова «собака» и «кошка» расположены довольно близко друг к другу, потому что означают животных, причем домашних. Основываясь на ассоциациях, «собака» ближе к понятию «дружелюбный», а «кошка» — к «независимый». Родственные слова находятся близко друг к другу, и расстояние между ними можно измерить. «Грейпфрут», например, ближе к «апельсин», чем к «киви», следовательно, у них больше сходства. Неудивительно, что фрукты будут далеки от слова «тигр».
А что с контентом?
Выстраивание слов — увлекательное занятие. При помощи преобразования текста в векторную форму можно изучить любую тему — от гендерных предубеждений до эволюции мышления. Например, выяснить, способствует ли повышению популярности книги или фильма быстрое развитие сюжета. Применяется тот же метод, но уже не к словам, а к предложениям и даже абзацам.
Чтобы понять, как это работает, вспомним уроки географии. В учебнике есть параграфы, рассказывающие о земной коре, землетрясениях, погоде и даже Солнечной системе. Возьмем для рассмотрения первый абзац любого параграфа — скажем, о землетрясениях. Мы обнаружим, что он тесно связан со следующим абзацем. Параграф может начинаться с того, что дается определение землетрясению, а затем говорится о том, какие процессы его вызывают. В обоих случаях используются одинаковые слова, фразы и понятия (например, «землетрясение», «разлом» и «тектоника плит»).
Например, в параграфе, рассказывающем о землетрясениях, используются понятия, отличные от тех, что встречаются в параграфе о Солнечной системе.
Сцена, где показана свадьба, вероятно, будет очень похожа на любую другую сцену со свадьбой: те же действующие лица, похожая обстановка, аналогичные действия людей. При этом сцена со свадьбой будет меньше похожа на сцену вторжения инопланетян или на сцену, где показаны погружение с аквалангом или ремонт автомобиля в сервисе. Действующие лица могут оставаться прежними, однако обстановка, предметы и занятия людей будут иными. Важно отметить, что каждая последующая глава книги или сцена фильма, как правило, связана с предыдущей, однако степень близости между ними может значительно отличаться.
Если в начальной главе говорилось о свадьбе, а в следующей уже о вторжении инопланетян, значит, действие происходит быстро по сравнению с повествованием, где и в первой, и во второй частях ведется рассказ о свадьбе. Если в определенном произведении части или сцены меньше связаны между собой, значит, сюжет развивается быстро, если не стремительно.
Скорость сюжета и успех у аудитории
Для изучения взаимосвязи между скоростью развития сюжета и успехом у аудитории автор с командой провели анализ тысяч книг, фильмов и сериалов — от классики вроде Чарльза Диккенса и Джека Керуака до более современных книг и фильмов, включая «Звездные войны», «Криминальное чтиво» и мультсериал «Южный Парк». Они выяснили, что в целом скорость развития сюжета в этих произведениях довольно высока.
Такие книги, фильмы и сериалы нравятся публике больше, чем те, в которых действие развивается более размеренно. Стремительное развитие сюжета делает произведение увлекательным по тому же принципу, по которому песни с нестандартными текстами становятся хитами. Вместо медленного шествия рука об руку с героями люди предпочитают молниеносно перемещаться между разными по смыслу темами, сценами и главами: это вызывает интерес.
В некоторых моментах произведения сюжет развивается быстро, в других же словно замирает. В самом начале книги или фильма холст, на котором будет развиваться действо, пуст. Зритель или читатель не знает, какие ему встретятся персонажи, какие это будут временной период и место действия. Начало произведения закладывает основу, являет собой отправную точку для последующего повествования.
Аудитории нужно время на то, чтобы привыкнуть к персонажам и прочему, поэтому большая скорость может сбивать с толку. На начальном этапе быстрое развитие сюжета вредно. Зрители более благосклонно принимают те произведения, события в которых поначалу развиваются медленно.
Правило трех
Вспомним известные народные и детские сказки: в них используется принцип повторения. Например, в сказке «Три поросенка» первый поросенок строит себе дом из соломы, а волк дует и разрушает его. Затем все повторяется со вторым поросенком. По схожему принципу создаются комедии, комиксы и все остальные смешные истории. В них соблюдается «правило трех»: что-то смешное происходит трижды с разными людьми.
Повторение помогает подготовить почву, сформировать ожидания. Как только зрителю или читателю становится ясен контекст, самое время сделать резкий поворот. Таким образом, скорость развития сюжета имеет большое значение в любом произведении, и только от того, в какой точке сюжета мы находимся, зависит, лучше ускорить его или замедлить.
Все сказанное выше важно для любого повествования и общения в целом. Если вы хотите развлечь собеседника, то выбирайте быстрый темп рассказа: он поможет увлечь и удержать внимание. Но начало должно быть более медленным, чтобы всем стало ясно и понятно, о чем пойдет речь. Затем, по мере развития действия, можно менять тактику.
Если же ваша цель состоит в передаче информации, лучше будет применить другой подход. Авторы исследований просмотрели немало научных работ и пришли к выводу, что в них высокий темп является недостатком. Резкая смена темы, перескакивание с одного на другое усложняют восприятие и удержание нити рассуждения. Используйте медленное повествование, если хотите, чтобы передаваемая вами информация была хорошо усвоена.
Много полезного для пишущих тексты и снимающих видео — в книге «Как люди убеждают».