Fg
0,4022
0,6024
0,8228
0,9159
0,7500
0,8443
1
0,7558
Fi
0,4041
0,5877
0,7909
0,7460
0,8979
0,8138
0,7558
1
алгоритмов показало, что производительность нашего метапоиска
Алгоритмы, по крайней мере так хорошо, как Vivisimo и изобилие или
Иногда даже лучше, чем Vivisimo и изобилие с
Единственное исключение из запроса "скалолазание", так как полностью ИК-
соответствующей странице в разделе «http://www.rocknroad.com" (Rhino
Постановка и события Solutions) была возвращена, как лучше всего
наши метапоиска алгоритмов. По непонятным причинам, это
абсолютно никакого отношения страницы высоко оценены большинство
поисковые системы (1-й по HotBot, 3-й по Google, 6-й по Teoma,
Тридцать пятой по AltaVista, 15-ю по AllTheWeb). Таким образом, наши метапоиска
Алгоритмы Оцените эту страницу как самый лучший. Этот пример показывает,
, что с нашей взвешенной подвержены в основном полагается на мнение
поисковые системы, если большинство поисковых систем высоко смещены
определенную страницу, то наш алгоритм как правило, терпят неудачу.
Для краткости мы снова только представить наши
результаты по запросам "Шекспир", "классическая гитара", "блюз"
и "настольный теннис" в таблице V, VI, VII и VIII. На
Запрос «Шекспир», выступление наших алгоритмов
и изобилие приемлемо при Vivisimo не возвращается
хороший власти на тему, поскольку она получает страниц, как
"Http://www.shakespeare-ef.com" (Шекспир и композитов
электроника) и «http://www.shakespeare-fishing.com" (стр.
компании, которая продает рыболовные снасти). На запрос
"Классическая гитара", большинство наших алгоритмов метапоиска за
сформировать лучше, чем Vivisimo и изобилие получение только одного
не имеет значения страницы, а Vivisimo и изобилие получить 3 страницы
, которые кажутся слабыми власти на тему «классическая
гитара ". На запрос "блюз", все поисковые системы и алгоритмов,
ритмы показывают низкие показатели, так как почти все поисковые системы
смещены "http://www.bluesnews.com", который представляет собой страницу
посвященные обзоры игр и различных страниц, связанных с
НХЛ команды Сент-Луис Блюз
6
. Тем не менее, наши алгоритмы
, кажется, менее предвзято, чем Vivisimo и гораздо лучше, чем
изобилии. Vivisimo занимает "http://www.stlouisblues.com" и
"Http:/www.bluesnews.com", как 3 и 4 ее вершине
6We предполагаем здесь, что запрос "блюз" исключительно относится к
музыки "блюз", а не в НХЛ блюз или любой другой тип "блюз"
20 страниц в то время как изобилие сильно предвзятое возвращение некоторых
не имеет значения страниц, включая страницы, связанные с хоккейной командой
Сент-Луис Блюз. На запрос "настольный теннис", но все изобилие
выполнять хорошо. Profusion не будет работать на эту тему с 3 страниц его
списка страницах компаний, занимающихся продаем оборудование
и аксессуары для внутренней спорта.
V. ЗАКЛЮЧЕНИЕ
В этой работе мы представили алгоритм, основанный на совместном
Цитата модели поисковых систем и страницы подойти к
слияние проблемы. Наша работа открывает возможность применять-
ING другую ссылку анализ алгоритмов слияния с
взвешенная версия любой алгоритм анализа ссылок на веб-страницах
может применяться для совместного цитата граф модели. Так как наша
Алгоритм может быть использован для оценки качества поиска
Двигатели на систематической основе, мы в настоящее время изучает
способы переработки нашей методологии ранжирования поисковых систем.
VI. ПОДТВЕРЖДЕНИЕ
Я хотел бы поблагодарить профессора Аллана Бородина за неоценимую
Комментарии и отзывы на эту работу.
Ссылки
[1] С. Дворк, Р. Кумар, М. и Д. Наор Sivikumar "Ранг агрегации
методы в Интернете ", Proc. 10-я Международная конференция WWW, май
2001 год.
[2] Р. Феджин, Р. Кумар, Д. Sivikumar, "Сравнение списков топ К", Proc.
из ACM-СИАМ симпозиум по дискретных алгоритмов, 2003.
[3] В. Мэн, К. Ю. и К. Л. Лиу, "Создание эффективной и действенной
Метапоиска двигателей ", опросы ACM Computing, 34 (1), стр. 48-89 марта
2002 год.
[4] Дж. М. Аслам и Монтекки., "Модели Мета", Proc. ACM
SIGIR '01, стр. 276-284, 2001.
[5] И. Ли, "Анализ нескольких сочетание доказательств", Proc. ACM
SIGIR 97, стр. 267-275, 1997
[6] BU Oztekin, Г. Karypis и В. Кумар, "Соглашение экспертов и
Содержимое основе Reranking в метапоиска среды с использованием Mearf "
Proc. Одиннадцатой Международной конференции WWW 2002.
[7] А. Фокс и JA Шоу, "Комбинация нескольких запросов",
Второй текст поиска конференция (TREC-2), 1994 год.
[8] Дж. Клейнберг. "Авторитетные источники в гиперссылками окружающей среды",
Proc. из ACM-СИАМ симпозиум по дискретных алгоритмов, 1998.
[9] Р. Lempel и Морана. "Стохастический подход к ссылке структуры
анализ (сальса) и ТКС эффект ". Proc. 9-й Международной
World Wide Web конференции, май 2000 года.
[10], А. Бородина, Г. О. Робертс, С. Розенталя и П. Tsaparas. "В поисках
власти и концентраторы с ссылкой структур на всемирной паутине ", Proc.
10-й Международной конференции WWW, стр. 415-429, май 2001 года.
[11] С. Gauch, Г. Ван, М. Гомес, "Profusion: Intelligent Fusion от
Несколько, распределенные поисковые ", журнал универсального компьютера
Наук, 2 (9) :637-649, 1996.
[12] А. Д. Хау и Dreilinger "SavvySearch: мета-поисковую систему, которая
Учится которые поисковые системы с запросом ", А. И. Magazine, 18 (2), 1997.
[13] Моника Henzinger, Раджив Мотвани, и Крейг Silverstein, «Проблемы
в поисковые машины ". SIGIR Форум 2002
[14] Даниэль Dreilinger и Адель Э. Хоу, "Опыт выбора
поисковые системы использования метапоиска ". ACM Сделки по информации
Системы, 15 (3) :195-222, 1997.
[15] Е. А. Сельберга и Этциони, "Multi-службы поиска и сравнения по
MetaCrawler ", Proc. 4-й Международной World-Wide Web
Конференция, Дармштадт, Германия, декабрь 1995 года.
[16], К. и М. Бхарат Henzinger "Совершенствование алгоритмов Тема дистилляции-
Тион в гиперссылки окружающей среды ", Proc. Двадцать первого ACM SIGIR конференции
1998 год.