Семантическая релевантность. Что называется релевантностью? Релевантность - что это простыми словами на конкретных примерах

Приветствую, мои уважаемые читатели и подписчики блога. В данной статье подробно расскажу вам, в чем смысл этого понятия без использования заумных фраз и научной стилистики. На данный момент интернет заполнен значительным объемом бесполезной и искаженной информации. Масса безграмотных авторов наполняют свои работы большим количеством ключевых фраз, чтобы поисковая система нашла их творения на страницах сайтов. Но загвоздка заключается в том, что полезного контента, который бы раскрывал смысл ключевого слова, являющегося поисковым запросом, просто нет. Чтобы уменьшить число сайтов с таким бесполезным содержанием, было введено понятие релевантности.

Состояние наблюдений за поведением пользователя

В последней части мы синтезируем результаты и предлагаем стратегии, которые могут улучшить поисковые системы. Лабораторные исследования и исследования, как говорят, являются супер-нацеленными, когда субъект знает, что он наблюдается исследователем. Не-супер-целевые методы состоят из анализа историй транзакций и реального наблюдения за поисковыми системами. Также возможно связать эти два, но эта комбинация редко наблюдается в качестве основного подхода.

Мы кратко суммируем эти два метода наблюдения за поведением пользователя, чтобы вывести параметры оценки качества. Они также дают субъективную точку зрения, с точки зрения пользователя, того, что они знают о поисковых системах и их дополнительных сервисах.

Релевантность что это такое

Релевантность в целом – это характеристика, которая выражает соответствие чего-либо, желаемого полученному. Данное понятие в интернете является показателем, который характеризует полезность информации, относительно запроса, отправляемого в систему. Существует еще характеристика релевантности статьи, она описывает соответствие заголовка тексту, который располагается под ним. Одним словом, это то что наиболее подходит по запросу пользователя среди всей той информации что будет ему выдана.

В большинстве случаев лабораторные исследования включают лишь небольшие образцы и, следовательно, не являются репрезентативными. Также случается, что испытуемые, чувствуя себя замеченными, пытаются принять более профессиональный метод исследования, например, используя большее число операторов или функции поиска. Более типичный способ сбора информации о фактическом поведении пользователя - это анализ истории транзакций или живых данных. В этом случае проблема заключается в том, что у пользователя нет дополнительной информации, такой как его демографические характеристики и привычки в целом.

Данный тезис станет куда прозрачнее и яснее, если посмотреть на несколько примеров, приведенных ниже.

Релевантность что это простыми словами на примерах

Допустим, Вы не знаете, как приготовить греческий салат. Очевидно, что в эру компьютерных технологий вы прибегнете за помощью к всемирной паутине, а именно, к какому-либо онлайн сервису для поиска. Вы вводите запрос, например, в Яндекс: «рецепт греческого салата», после чего вам предлагается огромный список ссылок с различной информацией, связанной с приготовлением этого блюда. После чего, Вы переходите по одной из них, и там четко и ясно описан рецепт приготовления греческого салата. Перед Вами релевантная страница, где текст полностью соответствует указанному запросу.

Это исследование показывает, что 14% пользователей поисковых систем используют расширенные возможности поиска. Только 3% опрошенных знают, что можно настроить интерфейсы поисковой системы. Заголовок и описание страниц в результатах поиска поисковой системы очень важны для оценки списков результатов. Для 44% из них пользователи недовольны, когда результаты не имеют никакого отношения к представленному запросу. Кроме того, 36% отвергают то, что известно как мертвые ссылки. Кристоф Хольшер и Герхард Страуб наблюдали различные исследования поведения в зависимости от того, является ли пользователь экспертом или новичком.

Для того чтобы окончательно разобраться что это такое, можно рассмотреть еще один пример:

Вам потребовалось починить свой автомобиль, Вы уже знаете, что сломалось, но как произвести ремонт остается загадкой. Как и в прошлом примере, Вам приходиться обратиться за помощью к поисковику. Вы рассматриваете предоставленные ссылки по указанному запросу и останавливаете свой выбор на самой привлекательной по Вашему мнению. Но перейдя по ней, открывается сайт, на котором предлагают купить запчасти, совершить техобслуживание, и множество других услуг, которые Вам совсем не интересны. Такая целевая страница не является релевантной.

Горд Хотчкисс проводит различие между различными группами исследовательского поведения при исследовании страниц результатов. Кроме того, пользователи предпочитают естественные результаты по сравнению со спонсируемыми ссылками. Исследователи также смогли работать над историей поисковой системы испанского бива. Джейсон Зиен, Йорг Мейер, Джон Томлин и Джой Лю смотрели онлайн-запросы веб-браузера в течение 66 дней. Также можно найти общее состояние и описание всех этих данных. В этом исследовании также указаны наиболее важные параметры для описания поведения пользователя, такие как средняя длина запросов, процент сложных запросов, включая процент запросов на выражения, и доля поисковых сеансов, где обрабатывается только первая страница результатов.

Как поисковые системы вычисляют релевантность страницы

Раньше, для того чтобы определить этот показатель, поисковые системы анализировали число ключевых фраз на предоставленной странице. Многие люди, чтобы поднять свою статью в списке выданных поисковиком материалов, старались занести в нее как можно больше ключей в той форме, которая указана в запросе. В результате предоставленная информация зачастую не являлась релевантной, а текст был настолько изуродован, что даже читать его пропадало желание.

Очевидно, что запросы очень короткие. Во-вторых, большая часть запросов содержит только один термин. За немногими исключениями использование булевых операторов очень редко. Использование поиска выражений является одним из наиболее распространенных способов уточнения запросов. Пользователи обычно просматривают только первую страницу результатов. Эти факты показывают, что пользователи поисковых систем интуитивно формулируют свои запросы и не оценивают каждый результат списка. Кроме того, пользователи не изменяют параметры поиска по умолчанию для двигателей, потому что они не используют определенные функции поиска.

Через некоторое время поисковые системы кардинально изменили подход к определению релевантности. За чрезмерное употребление ключей теперь предусмотрен блок. На сегодняшний день Google, Yandex, Ramblerи другие подобные сервисы используют множество сложных алгоритмов для вычисления такой полезной характеристики.

Самым действенным и одновременно простым способом для вычисления этого показателя использует Гугл. Особые программы анализируют действия человека, а в частности время, на которое он остановился на открытой странице. Если перейдя по ссылке, пользователь не увидел ничего соответствующего его запросу, то он сразу же ее закрывает. Соответственно, время, на которое он там задержался, составит всего пару секунд, но если на этом сайте находится исключительно полезная и интересная ему информация, то, скорее всего, потребуется больше времени на ее изучение.

Эталонная структура качества поисковых систем

Авторы полагаются на сервлетовую модель, применяемую к поисковым системам. Они сравнивают ожидания пользователей с воспринимаемой производительностью поисковых систем, но не взвешивают наблюдаемые факторы. В рамках, которые они предлагают, очевидно, что модель не ориентирована на систему оценки поиска информации. Интересно отметить, что, согласно этому исследованию, один из основных пунктов оценки существенно не отличается от одного двигателя к другому.

Тефко Сарачевич выделяет две широкие категории подходов для оценки информационно-поисковых систем, каждая из которых имеет три уровня: системный уровень, инженерный уровень, уровень входа и уровень обработки; уровни ориентированной на пользователя оценки - уровень выпуска, уровень использования и пользователя и социальный уровень.

Чтобы узнать релевантную страницу нужному поисковому запросу, к примеру «релевантная страница» следует в сроке поиска Яндекса прописать следующее:

site: www.сайт релевантная страница

После этого вы получите список страниц, наиболее подходящих (релевантных) вашему запросу и самая точная будет первая, остальные менее подходящие, но их можно использовать как доноры ссылок .

Только комбинация как системно-ориентированных, так и ориентированных на пользователя подходов может дать более точное представление об общем качестве поисковой системы. Вот почему мы расширяем структуру анализа качества, впервые примененную Дирком Левандовски, к следующим четырем рубрикам.

Качество индекса; подчеркивает важность баз данных поисковых систем для получения соответствующих и всеобъемлющих результатов; меры, применяемые в этой рубрике, включают охват веб-сайтов, смещение стран и обновление. Как показывает анализ вышеизложенных мер, необходимо спросить, какие меры следует применять и какие новые меры необходимы для удовлетворения специфики поисковых систем и их пользователей. Например, здесь должна применяться дополнительная мера, а именно сингулярность результатов по отношению к другим поисковым системам. Качество функциональности поиска; двигатель предлагает последовательный набор функций, которые дают надежные результаты. Удобство использования поисковой системы; он ретроактивно информирует поведение пользователя и оценивается посредством пользовательских опросов или анализа истории транзакций. Он предоставляет параметры, которые можно сравнить с дизайном интерфейса - просмотр спонсируемых ссылок - и производительность поисковой системы - скорость, мертвые ссылки и нежелательные результаты. Помощь, предоставляемая пользователю и предоставляющая расширенные возможности поиска, также является важным аспектом этой темы. В то время как традиционные информационно-поисковые системы обычно полагаются на базы данных, созданные вручную человеческими индексаторами из выбранных источников, поисковые системы должны использовать сетевую структуру Интернета для поиска своих документов путем просмотра Ссылка на веб-ссылку.


Но время посещения – это не единственный критерий, используемый для определения релевантности. Бесчисленное множество программ и сервисов анализируют выданную по запросу информацию относительно:

  • Объема символов и ключевых фраз. Программа анализирует общий объем символов текста и количество ключевых слов в нем. Если количество превышает допустимое, то сайт блокируют. Нормальным содержанием ключей в тексте считается от 3% до 7%.
  • Числа посещений. Программа считает, сколько пользователей посетило страницу за определенный промежуток времени. Если в дальнейшем число посещений уменьшается, то это означает, что она не является релевантной.
  • Вхождение заголовка в смысл текста. Программа проверяет каждое слово в тексте и определяет, насколько оно соответствует указанному заголовку. Если слова даже близко не относятся к содержанию заголовка, то статья удаляется или дорабатывается.

И это только самые распространенные и популярные характеристики.

Это огромная проблема для создания и поддержания индекса, созданного сборкой роботов. Кнут Магне Рисвик и Рольф Михельсен дают хорошее резюме. Во многих отношениях можно оценить качество индекса данной поисковой системы. Во-первых, индексы должны быть расширены. Идеальной поисковой системой будет та, которая хранит полную копию Интернета в своей базе данных. Однако по разным причинам это невозможно. Важный индекс необходим по двум причинам. Во-первых, пользователь хочет получить полный список результатов, например, чтобы ознакомиться с темой.

Заключение

Итак, релевантность, что это простыми словами? Это залог успеха в поисковых сетях. Помимо этого она может способствовать значительному увеличению прибыли от сайта. Так как если размещенная статья действительно полезна для читателя, то он точно не будет единственным. Качественные тексты до сих пор достаточно сложно найти на просторах всемирной паутины. Если в данной статье Вы нашли ответ на вопрос: «Что такое релевантность», то уже можно предположить, что она будет находиться на первых страницах выдачи.

Второй случай - это нечеткие запросы, которые дают небольшой результат. Здесь, двигатель, который имеет больший индекс, чтобы получить больше шансов найти больше результатов. Индексы поисковых систем иногда сравниваются друг с другом, исходя из их соответствующих абсолютных размеров. Но некоторые исследования, которые касаются размера Сети, также заинтересованы в пропорции, которую покрывают поисковые системы.

Кришна Бхарат и Андрей Бродер используют робот-сборщик для просмотра части Интернета и создания словаря, из которого они выбирают запросы и отправляют их в четыре основные поисковые системы. Из случайного набора найденных страниц авторы подсчитывают процент охвата этих поисковых систем. Самое последнее исследование, основанное на коллекции, - это Антонио Гулли и Алессио Синьорини. Охват поисковой системы набора данных составляет от 57% до 76% для четырех основных поисковых систем. Авторы оценивают размер индексируемого Интернета примерно на 800 миллионов страниц.

Хорошая релевантность значительно увеличивает приток пользователей. Для блога или информационного сайта, который постоянно обновляется, это очень важно. Сейчас блоги ведут в основном профессионалы, исключительные мастера своего дела, убивая на него очень много времени. Но иногда создатели предпочитают заказывать статьи для своих творений у других людей. Временами это приводит к тому, что загружаемый контент написан в поверхностном изложении и совсем не интересен для читателя. Чтобы избежать таких ситуаций, необходимо грамотно подходить к вопросу о выборе писателя, нужно узнать, имеет ли он определенные знания в области, соответствующей тематике вашего блога.

Двигатели, представленные на эту оценку, охватывали всего лишь 42% индексируемой сети. Подводя итог, невидимая сеть является частью сети, которую поисковые системы не интегрируют со своими индексами. Однако, как показали Дирк Левандовски и Филипп Майр, эти оценки размеров слишком велики из-за статистических и фундаментальных ошибок. Необходимо провести дальнейшие исследования, чтобы отличить видимую и невидимую сеть. Хотя эта практика в основном осуществляется коммерческими субъектами, другие поставщики, такие как библиотеки, придерживаются того же подхода с разной степенью успеха.

Надеюсь материал был полезен и не забываем подписаться на рассылку новостей блога. До скорых встреч, а за репост статьи +100 к вашей карме -))).

С уважением, Галиулин Руслан.

Релевантность (образовано от английского relevant – относящийся к делу) – в общем смысле это соответствие документа ожиданиям пользователя. Таким образом, релевантность поиска - это степень удовлетворения пользователя показанными в ответ на его запрос поисковыми результатами. В идеале, страница выдачи должна полностью удовлетворять информационную потребность пользователя в независимости ее полноты и точности.

Например, пользователь, который ищет контент на французском языке, не будет удовлетворен, если поисковая система предоставляет общий 80% охват веб-сайта, но вообще не включает документы на французском языке или только очень мало. В процессе сбора веб-контента индекс будет отличаться в зависимости от выбранных исходных точек, а с другой стороны, в зависимости от структуры сети. Страницы, которые являются объектом многих ссылок, имеют больше шансов быть найденными двигателями, чем страницы в «периферии» Интернета.

Андрей Бродер и др. смоделировали структуру Сети в виде галстука-бабочки. Тем не менее, страницы в центре Интернета, вероятно, самые старые и, учитывая эволюционную структуру Интернета, из Соединенных Штатов. Удивительно, но есть только два исследования смещения, связанные с этой страной. В частности, в европейском контексте, учитывая многие языки, на которых они говорят, этот предмет должен привлекать повышенный интерес.

Высчитывается релевантность с помощью алгоритмов поисковых систем. Каждая поисковая машина работает по своему алгоритму. В ранжирование строится за счет технологии Матрикснет.

Виды релевантности поиска

  • Формальная – именно на этом виде строится ранжирование поисковиков. Алгоритмическим путем сравнивается образ поискового запроса с образом документа в индексе поисковой машины. Это означает, что релевантность рассчитывается без непосредственного участия человека - по определенной формуле на основе данных, собранным поисковым роботом.
  • Содержательная – релевантность определяется неформальным путем. Данный вид также применяется поисковыми системами, но уже для оценки качества поиска. Специальные сотрудники оценивают поисковые результаты, исходя из их предположения о соответствии данного документа запросу. Этих специалистов называют асессорами.
  • Пертинентность – полное удовлетворение информационной потребности пользователя. Это именно то, к чему стремятся все поисковые системы.

В поисковой выдаче показываются наиболее релевантные с точки зрения поисковика страницы сайтов. Перед началом продвижения всегда необходимо определять наиболее подходящую для раскрутки страницу. Здесь можно руководствоваться такими факторами как возраст, ссылочный вес, уровень и уже имеющаяся релевантность страницы.

Они отмечают, что американские сайты лучше охватываются как пропорциональностью, так и глубиной индексации. Они заключают, что недостаток в пользу этих сайтов должен исходить из структуры ссылок Сети, а не из разных языков. Полученные результаты практически не отличаются от результатов первого исследования. Эти исследования показывают, что в индексах поисковых систем имеются значительные смещения по странам. Мы считаем важным проводить подобные исследования.

Если мы вернемся к вопросу о том, следует ли строить чисто европейскую поисковую систему, чтобы конкурировать с доминирующими поисковыми системами США и анализировать полезность конкретных поисковых систем по странам, мы считаем, что существует настоятельная необходимость в исследованиях по вопросу о предвзятости по конкретным странам, по крайней мере для некоторых европейских стран. Третьим важным фактором качества индексов является их актуализация. Веб находится в постоянном потоке: новые документы добавляются, старые исчезают, а другие обновляются.

Чтобы определить наиболее релевантную страницу из уже существующих достаточно воспользоваться языком запросов или расширенным поиском.

Страница расширенного поиска для Яндекса http://yandex.ru/search/advanced

Страница расширенного поиска для Google https://www.google.com/advanced_search



Составляющие релевантности страницы

В подавляющем большинстве случаев SEO-оптимизаторы работают над сайтом в следующих направлениях:

  • Техническая составляющая релевантности страниц сайта – общие ошибки, затрудняющие корректную индексацию роботами поисковых систем:
    • доступность сайта;
    • скорость загрузки страниц;
    • выдача кодировки ресурса;
    • настройка кодов ответа сервера (редиректы, страницы с ошибками);
    • зеркала сайта;
    • файл robots.txt и мета-тег robots;
    • файл sitemap.xml;
    • фреймы;
    • скрытые от пользователя элементы;
    • структура URL;
    • дубликаты страниц;
    • битые ссылки;
    • дата последнего изменения страниц;
    • спам;
    • другие помехи для индексации.
  • Текстовая составляющая релевантности страниц сайта – соответствие контента запросу пользователя:
    • мета-теги;
    • заголовки текста;
    • вхождения ключевых фраз в текст;
    • атрибуты тега img.
  • Ссылочная составляющая релевантности – факторы, связанные со :
    • внешняя перелинковка;
    • анкоры ссылок;
    • характеристики доноров;
    • динамика роста ссылочной массы.
  • Поведенческая составляющая релевантности – факторы, связанные с поведение пользователей:
    • количество посетителей;
    • источники посетителей;
    • время пребывания;
    • показатель отказов;
    • глубина просмотра;
    • конверсия;
    • удобство навигации;
  • Иные факторы:
    • региональность;
    • аффилиаты.
E H J K N O Q V