Что это такое, как это работает и что это значит для поиска

Google заявил, что его последнее крупное обновление поиска, включающее алгоритм BERT, поможет лучше понять цель поисковых запросов пользователей, что должно означать более релевантные результаты. По словам компании, BERT повлияет на 10% поисковых запросов, а это, вероятно, окажет некоторое влияние на органическую видимость и посещаемость вашего сайта — вы можете просто не заметить этого.

Это наш высокоуровневый взгляд на то, что мы знаем о том, что Google рекламирует как «один из самых больших скачков в истории поиска».

Когда BERT появился в Поиске Google?

BERT начал разворачиваться в поисковой системе Google 21 октября 2019 года для запросов на английском языке, включая избранные фрагменты.

«Алгоритм будет распространяться на все языки, на которых Google предлагает поиск, но пока нет установленной временной шкалы», — сказал Дэнни Салливан из Google. Модель BERT также используется для улучшения рекомендуемых фрагментов в двух десятках стран.

Что такое БЕРТ?

BERT, обозначающий двунаправленное представление кодировщиков от Transformers, представляет собой метод на основе нейронной сети для подготовки к обработке естественного языка. На простом языке — его можно использовать, чтобы помочь Google лучше различать контекст слов в поисковых запросах.

Например, в словосочетании «от девяти до пяти» слово «до» имеет разные значения, которые могут быть очевидны для людей, но в меньшей степени для поисковых систем. BERT предназначен для разграничения таких нюансов, чтобы облегчить получение более актуальных результатов.

Google открыл исходный код BERT в ноябре 2018 года. Это означает, что любой может использовать BERT для обучения своей собственной системе языковой обработки для ответа на вопросы или других задач.

Что такое нейронная сеть?

Проще говоря, нейронные сети алгоритмов предназначены для распознавания образов. Распределение изображений по категориям, распознавание рукописного ввода и даже прогнозирование тенденций на финансовых рынках — это обычные приложения для нейронных сетей, не говоря уже о приложениях для поиска, таких как модели кликов.

Они тренируются на наборах данных для распознавания паттернов. БЕРТ предварительно обучался с использованием простого текста Википедии, объяснил Google, когда открывал его.

Что такое обработка естественного языка?

Обработка естественного языка (NLP) относится к области искусственного интеллекта, которая занимается лингвистикой, с целью дать компьютерам возможность понять, как люди естественным образом общаются.

Примеры достижений, которые стали возможными благодаря NLP, включают в себя инструменты для прослушивания в социальных сетях, чат-ботах и предложения слов на вашем смартфоне.

Сам по себе NLP не является новой функцией для поисковых систем. BERT, однако, представляет собой прогресс в НЛП посредством двунаправленного обучения (подробнее об этом ниже).

Как работает BERT?

Прорыв BERT заключается в его способности обучать языковые модели на основе всего набора слов в предложении или запросе (двунаправленное обучение), а не в традиционном способе обучения в упорядоченной последовательности слов (слева направо). BERT позволяет языковой модели изучать контекст слова на основе окружающих слов, а не только слова, которое непосредственно предшествует или следует за ним.

Google называет BERT «глубоко двунаправленным», потому что контекстные представления слов начинаются «с самого низа глубокой нейронной сети».

«Например, слово «банк». Контекстные модели генерируют представление каждого слова на основе других слов в предложении. Например, в предложении «Я получил доступ к банковскому счету» однонаправленная контекстная модель будет представлять «банк» на основе «Я получил доступ к» но не «счету». Однако BERT представляет «банк», используя как предыдущий, так и следующий контекст — «Я получил доступ к… аккаунту».

Google показал несколько примеров того, как приложение BERT в поиске может повлиять на результаты. В одном примере, запрос «учебники по математике для взрослых» ранее вывел список книг для 6–8 классов в верхней части результатов. С применением BERT Google выдает список книг под названием «Математика для взрослых» в верхней части результатов.

Использует ли Google BERT для осмысления всех поисков?

Нет, не совсем. BERT улучшит понимание Google примерно одного из 10 поисковых запросов на английском языке в США.

«В частности, для более длинных, более разговорных запросов или поисков, где предлоги, такие как «для» и «к», имеют большое значение и Поиск сможет понять контекст слов в вашем запросе», — пишет Google в своем блоге.

Однако, не все запросы являются диалоговыми или включают предлоги. Поиск брендов и короткие фразы — это только два примера типов запросов, которые могут не требовать обработки BERT на естественном языке.

В чем разница между BERT и RankBrain?

Некоторые из возможностей BERT могут звучать аналогично первому методу искусственного интеллекта Google для понимания запросов, RankBrain. Но это два отдельных алгоритма, которые могут использоваться для информирования о результатах поиска.

«Первое, что нужно понять о RankBrain, — это то, что он работает параллельно с обычными алгоритмами обычного ранжирования поиска и используется для корректировки результатов, рассчитанных этими алгоритмами», — сказал Эрик Энге, генеральный менеджер Perficient Digital.

RankBrain корректирует результаты, просматривая текущий запрос и находя похожие прошлые запросы. Затем он проверяет эффективность результатов поиска для этих исторических запросов. «На основании того, что он видит, RankBrain может регулировать вывод результатов обычных алгоритмов ранжирования в обычном поиске», — сказал Энге.

RankBrain также помогает Google интерпретировать поисковые запросы, чтобы он мог отображать результаты, которые могут не содержать точных слов в запросе. В приведенном ниже примере Google удалось выяснить, что пользователь ищет информацию об Эйфелевой башне, несмотря на то, что название башни не фигурирует в запросе «высота ориентира в Париже».

«BERT работает совершенно по-другому», — сказал Энге. «Традиционные алгоритмы пытаются взглянуть на контент на странице, чтобы понять, о чем он и к чему он может относиться. Тем не менее, традиционные алгоритмы НЛП, как правило, способны только просматривать контент перед словом ИЛИ контент после слова для дополнительного контекста, чтобы помочь ему лучше понять значение этого слова. Двунаправленный компонент BERT — это то, что отличает его от других ». Как уже упоминалось выше, BERT просматривает содержимое до и после слова, чтобы прояснить свое понимание значения и актуальности этого слова. «Это критическое улучшение в обработке естественного языка, поскольку человеческое общение естественно многоуровневое и сложное».

Как BERT, так и RankBrain используются Google для обработки запросов и содержимого веб-страниц, чтобы лучше понять, что означают эти слова.

BERT здесь не для замены RankBrain. Google может использовать несколько методов для понимания запроса, что означает, что BERT может применяться самостоятельно, наряду с другими алгоритмами Google, в тандеме с RankBrain, любой их комбинацией или не использоваться вообще, в зависимости от условия поиска.

Какие другие продукты Google могут повлиять на BERT?

Объявление Google о BERT относится только к поиску, однако это окажет некоторое влияние и на помощника. Когда запросы, выполняемые в Google Assistant, запускают его для предоставления избранных фрагментов или веб-результатов поиска, эти результаты могут зависеть от BERT.

Google сообщил Search Engine Land, что BERT в настоящее время не используется для рекламы, но если он будет интегрирован в будущем, это может помочь смягчить некоторые из неудачных вариантов, которые мешают рекламодателям.

Как я могу оптимизироваться под BERT?

«Нет ничего, что можно оптимизировать под BERT», — сказал Салливан. «Основы нашего стремления вознаграждать большое содержание остаются неизменными».

Совет Google по обеспечению хорошего рейтинга, постоянно учитывал пользователей и создавал контент, удовлетворяющий их поисковым запросам. Поскольку BERT предназначен для интерпретации этого намерения, имеет смысл, что предоставление пользователю того, что он хочет, по-прежнему является рекомендацией Google.

«Оптимизация» теперь означает, что вы можете больше сосредоточиться на хорошем и четком тексте, вместо того чтобы идти на компромисс между созданием контента для вашей аудитории и построением линейных фраз для машин.

По материалам Search Engine Land

Другие новости Google: