Новые стандарты оптимизации поиска Google
Karina | 22.09.2014
Информация постоянно меняется и требует обновления. Ежедневно кто-то меняет образ жизни, случается стихийное бедствие или ставится новый рекорд. Изменения происходят постоянно, поэтому поисковые системы, как средство подбора релевантной информации, постоянно должны поддерживать её актуальность.
Патент, опубликованный Google 18 сентября 2014, сообщает о новых способах поиска необходимой пользователю информации и избегания отсутствия требуемых данных в выдаче. Такая проблема стала в последнее время наиболее острой и начала требовать максимальной автоматизации, которая до этого была не всегда возможна.
Новая патентная заявка Google имеет несколько интересных способов определения свежей информации для существующих запросов. Мы выделим из них несколько основных.
Информация для результатов поиска Google на основе уточняющих запросов
Для предоставления более релевантной информации поисковая система анализирует журналы запросов, которые делал пользователь, сопоставляет их с уточняющими запросами, которые вводил этот же пользователь, а также другими поисковыми фразами, которые использовались в той же сессии.
Google, используя данные по поиску, уточняющим запросам, а также сопутствующим, теперь отслеживает число уточняющих данных, таким образом делая вывод, что выдача была нерелевантна данному запросу и требует смены. Также поисковик определяет необходимую частоту обновления выдачи в соответствии с запросами пользователей. То есть, если на один запрос начинает возникать множество уточняющих, Google должен обновить данные.
Например, современная система выдачи необходимой справочной информации непосредственно в результатах поиска постоянно требует обновлений. Так, погоду надо обновлять ежечасно, курс валют – ежедневно, а данные о населении страны – каждый месяц.
Благодаря новому патенту настройка обновлений данной информации будет осуществляться автоматически, в зависимости от актуализации этой информации и востребованности пользователями.
Обработка запросов для выявления релевантных включает в себя анализ следующих данных:
- существующие результаты выдачи;
- автоматические ответы на вопросы;
- существующие ответы людей в формах вопрос-ответ;
- выдача по предыдущим запросам пользователя, связанным с новым;
- использование естественного языка запросов и анализ запроса по узловым сочетаниям (об этом ниже);
- дополнительные технологии обработки запросов и их комбинации.
Естественный язык против формального
Натуральная речь – это та, которая используется в ежедневном общении или письме. Она включает в себя полные предложения, знаки пунктуации и представляет собой максимальное соответствие правилам языка.
Формальный или искусственный язык более узок в вариантах употребления и представляет собой ограниченное количество слов и отсутствие пунктуации. То есть, человек не говорит в повседневной жизни: «Купить телефон дешево Киев». По этой причине новый патент Google также максимально ориентирован на живую речь и постепенно уходит от искусственных фраз, позволяя вводить запросы так, как они используются в речи.
В настоящее время поисковая система уже не воспринимает лишь прямые вхождения фраз. Существует огромная база данных, где собраны все семантические связи слов и их варианты употребления. На современном этапе в тексте не обязательно должны присутствовать прямые вхождения слов в определённой форме – автоматизированная система понимает особенности времён, падежей, чисел и учитывает их при выдаче.
Благодаря новому патенту Google использует и дополняет свою базу данных информацией о:
- синонимах и антонимах;
- словах со сходным значением;
- гипонимии (сочетаемости слов);
- отношении членства (судья – работник суда);
- метонимии (целое – часть этого целого);
- составе (мебель содержит дерево);
- продукте (молокозавод такой-то производит молоко определённой марки);
- атрибутах времени (вчера, завтра и т. п.);
- причинно-следственных связях;
- контекстуальной сходности (только в этом контексте или в одном из значений слово связано с другим).
Каждое значение, представляет собой некий узел, к которому, на основании приведённых выше значений, поисковая система подбирает соответствия (обычно 1-2), наиболее часто используемые в текстах. Существующие и формируемые узлы Google использует для дополнения выдачи, которая может быть уже не релевантна существующим запросам, а благодаря новым сочетаниям и связям освежается новой информацией.
Таким образом, новый патент Google, зарегистрированный в США под номером 20140280307, позволяет поисковой системе улучшать выдачу, сокращая количество дополнительных запросов по периодически обновляемой информации и полностью автоматизируя процесс частоты обновления выдачи.
Более подробно ознакомиться с документацией по патенту (на английском языке) можно здесь.
Оставить комментарий