Рейтинг основных поисковых систем.
Кто-то знает, а кто-то ищет! Занимаясь поисковой оптимизацией всегда интересно понимать насколько актуальны Ваши труды. Для этого необходимо знать какова популярность поисковых систем в интернете (search engine popularity). На какие поисковые системы люди ходят, а какие игнорируют. Данная статья об этом.
Рейтинг глобальных поисковых систем (по данным Nielsen NetRatings).
Основные поисковые системы
http://www. / - 46.2%
http://www. / - 22.5%
http://search. / - 12.6%
http://www. / - 5.4%
http://www. / - 2.2%
http://www. / - 1.6%
http:/// - 1.6%
Прочие поисковые системы (7.9%)
http://home. /
http://www. /
http://www. /
http://www. /
http://www. /
http://www. /
http://www. /
http://www. /
http://www. /
http://www. /
http://dmoz. org/
http://www. /
http://www. /
http://www. /
http://www. . au/
http://www. /
http://www. /
http://www. /
http://www. /
http://www. /
http://www. /
Рейтинг российских поисковых систем (по данным SpyLog).
Основные поисковые системы
http://www. *****/ - 54.8267%
http://www. *****/ - 21.7645%
http://www. / - 15.6207%
http://www. *****/ - 4.5466%
http://www. *****/ - 1.5788%
Прочие поисковые системы (1,6627%)
http://www. /
http://www. /
http://www. *****/
http://www. /
http://www. /
http://www. /
http://www. /
http://www. /
http://www. *****/find/
http://www. /
http://www. *****/
http://www. /
http://www. *****/
Рейтинг английских поисковых систем (по данным Nielsen NetRatings).
Основные поисковые системы
http://www. / - 41.9%
http://www. / - 32.3%
http://www. / - 26.0%
http://www. ifind. / - 17.0%
http://www. / - 13.8%
http://www. / - 12.6%
http://www. friendsreunited. co. uk/ - 8.9%
http://www. / - 8.0%
http://www. tiscali. co. uk/ - 7.0%
http://www. / - 6.4%
Поиско́вая систе́ма — веб-сайт, предоставляющий возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet. В последнее время появился новый тип поисковых движков, основанных на технологии RSS, а также среди XML-данных разного типа.
Комплекс программ, обеспечивающий функциональность поисковой системы, называют поиско́вый движо́к или поиско́вая маши́на. Основными критериями качества работы поисковой машины являются релевантность, полнота базы, учёт морфологии языка. Индексация информации осуществляется специальными поисковыми роботами. Основные проблемы в работе поисковых систем описаны в статье Глубокая паутина. Улучшение работы поисковых систем — это одна из приоритетных задач сегодняшнего Интернета.
Содержание[убрать]
| ||
Хронология | ||
Год | Система | Событие |
1993 | Aliweb | Запуск |
1994 | WebCrawler | Запуск |
1994 | Lycos | Запуск |
1995 | AltaVista | Запуск (Создана DEC) |
1995 | Excite | Запуск |
1996 | Inktomi | Основана |
1996 | Ask Jeeves | Основана |
1996 | Rambler | Запуск |
1996 | Aport | Запуск |
1997 | Northern Light | Запуск |
1997 | Яндекс | Запуск |
1998 | Запуск | |
1999 | AlltheWeb | Запуск |
2000 | Teoma | Основана |
2004 | Yahoo! Search | Окончательный запуск |
2004 | MSN Search | Бета запуск |
2005 | MSN Search | Окончательный запуск |
2006 | Webalta | Начало публичного тестирования |
Примечание: годом запуска считается | ||
// История
Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэйем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой (т. н. «crawler-based» — то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице, с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.
Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины Rambler и Aport. 23 сентября 1997 года была открыта поисковая машина Яндекс.
Помимо поисковых машин для Всемирной паутины существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.
Популярные поисковые системы
- Всеязычные:
- Google (18% Русскоязычного сегмента [1]) Yahoo! (1% Рунета) и принадлежащие этой компании поисковые машины:
- Overture Inktomi AltaVista Alltheweb FAST-Engine
- Англоязычные и международные:
- AskJeeves (механизм Teoma)
- Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.
- Aport (1% Рунета) Rambler (18% Рунета) Яндекс (47% Рунета) ***** (7% Рунета, использует поисковую машину Яндекс) Webalta Вершки Рунета -- поиск по заглавным страницам
- Abacho. de de.
- Французские:
- fr. Francité Locace Nomade Voilà
- Украинские:
- (поиск реализован на основе Yandex. XML) Мета Bigmir)net (поиск реализован на основе Yandex. XML) Поиск
- www. ee neti. ee
- seznam. cz
- Узбекские:
- Voydod. uz
Специализированные поисковые системы
- Поиск картинок
- Поиск картинок Яндекса Поиск картинок Google Поиск картинок Yahoo Поиск картинок Picsearch
- Scandoo: Поиск с проверкой сайтов на наличие вирусов, вредоносных программ
- Yahoo! Subscriptions: Поиск по «подписным» сайтам CompletePlanet: Поиск по базам данных и специальным движкам QProber: Классификация и поиск по «скрытым» базам данных MetaQuerier: Обследуя и интегрируя глубокую паутину
- *****
- ***** *****
- http://www. /codesearch
- Malware Search
- Astalavista Security Group: поиск через все движки «подпольного Интернета» astalavista. box. sk: популярная поисковая система
- Новотека Автоматическая рубрикация и кластеризация новостей, архив новостей с 2003-го года. Новостная поисковая система «Redtram» Осуществляет поиск более чем по 4500 новостным источникам.
- *****
- ***** Поиск по материалам о программировании
Что такое PageRank или что надо знать о PR.
Как известно, статус сайта в Интернете измеряется в двух величинах: Яндекс тИЦ и Google PageRank. Про первую есть отдельная статья, а вот с тем, что за зверь такой - Google PageRank - мы сейчас постараемся разобраться.
Прежде всего, стоит сказать, что PR высчитывается по достаточно сложному алгоритму, который, как и в случае с тИЦ, известен только работникам самого поисковика, в нашем случае - Google - крупнейшей и популярнейшей поисковой машины в мире.
Основная задача поисковой машины, как известно, не просто найти все страницы, содержащие нужную информацию, а упорядочить найденные документы так, чтобы наиболее полезная информация отображалась выше, чем менее важная. К тому же те алгоритмы ранжирования, которые были разработаны для коллекций документов, используемых поисковиками при поиске, оказались беззащитны перед простейшими способами воздействия на них, когда для обеспечения хорошего результата достаточно было просто скопировать порядок расположения ключевых слов из текста хорошо ранжируемого по этому запросу документа. Появилась необходимость разделять информацию на более и менее достоверную, учитывать важность, авторитетность и уникальность данных на ресурсах, предоставляющих ее. Остаётся выбрать оптимальный способ для этого. Лучше всего на основе данных о популярности страницы у пользователей, например посещаемости. Но тогда потребуется устанавливать какой-либо счетчик на каждую страницу (А именно так и сделал, к примеру, Rambler со своим счётчиком Rambler top100). Такой вариант для глобального поиска не подходит - всё-таки Рамблер - это исключение из правила.. Тогда в качестве критерия была выбрана теоретическая посещаемость страницы.
Была разработана модель, эмулирующая движение пользователя по документам сети путем перехода по ссылкам с документа на документ, подразумевающая, что пользователь с равной долей вероятности перейдет по любой из ссылок, содержащихся в документе, который он в данный момент просматривает. То есть вероятность пользователя попасть на конкретный документ зависит от количества ссылок на него с других документов и от того, на сколько вероятно нахождение пользователя на одном из ссылающихся документов и сколько уникальных исходящих ссылок содержит этот ссылающийся документ. Именно эта вероятность и была принята за показатель авторитетности или ранг страницы (PageRank):
PR a = (1-d) + d * ([Сумма от i=1 до n] PRi/Ci), где
PR a – PageRank рассматриваемой страницы,
d – коэффициент затухания (означает вероятность того, что пользователь, зашедший на страницу, перейдет по одной из ссылок, содержащейся на этой странице, а не прекратит путешествие по сети, обычно устанавливается равным 0,85),
PR i – PageRank i-й страницы, ссылающейся на страницу a,
C i – общее чисто ссылок на i-й странице.
Одним из самых распространенных заблуждений, связанных с PageRank является то, что можно вычислить PageRank по этой формуле для отдельно взятого документа, используя уже известные значения PageRank для документов, ссылающихся на него. На самом деле всё намного сложнее. Чтобы подсчитать PageRank одного документа, надо составить систему из N линейных уравнений данного вида для каждого из документов из поисковой базы, где число N – количество документов в поисковой базе. Эта система будет содержать N неизвестных. Решив ее, получим значения PageRank для каждого документа, известного поисковой машине. В поисковой базе крупнейших поисковых машин содержится огромнейшее число документов. Несмотря на то, что матрица, соответствующая системе уравнений будет сильно разряжена, численное решение этой системы требует огромных вычислительных мощностей. Поэтому поисковая система должна постараться максимально упростить процесс расчета, вводя некоторые допущения. Вот эти конкретные особенности реализации классической формулы PageRank, увы, составляют коммерческую тайну поисковых машин.
Возникает логичный вопрос: "А как узнать свой PageRank или PageRank какого-либо сайта? Узнать PageRank можно с помощью Google Toolbar - надстройки для браузера от крупнейшего мирового поисковика.
Ange1's fall - специально для . ru
О тИЦ (Тематическом Индексе Цитирования)
Итак, все вы наверняка знакомы со словосочетанием "Индекс Цитирования" или просто тИЦ, но давайте разберёмся по порядку: что же скрывается за этим понятием?
Традиционнно существует два параметра сайта, по которым определяется значимость сайта - Индекс Цитирования (тИЦ) и Google PageRank (PR), которому посвящена на нашем сайте отдельная статья.
Согласно словарям, индекс цитирования - это общее количество доменов, ссылающихся на сайт, для которого высчитывается индекс цитирования. Как правило, тИЦ устанавливается кратным десяти до , 20, 30, ..., 290, 300), кратным 50 до 1, 400, ..., 950),
тИЦ высчитывается Яндексом - лучшим на данный момент поисковиком в России. При его подсчёте также используются многие другие правила, которые, пожалуй, известны только работникам Яндекса.
На данный момент, как утверждает Яндекс, тИЦ абсолютно никак не влияет на порядок сайтов в выдаче поиска. Он служит лишь для расстановки сайтов в Яндекс. Каталоге. Но косвенное значение в расстановке сайтов на странице поиска он имеет - для упорядочения сайтов в результатах поиска служит ВИЦ - Взвешенный Индекс Цитирования, так сказать, аналог PageRank от Яндекса. Его значение до 2002 года можно было увидеть, посмотрев на Яндекс. Бар, но теперь Яндекс. Бар показывает тИЦ - гораздо менее важный показатель. При расчёте ВИЦ учитывается не только количество ссылок, но и их "Качество", то есть ВИЦ ресурсов, на которых они стоят. Это - довольно сложный алгоритм, и опять-таки с точностью об этом вам могут рассказать только сотрудники Яндекса.
Чем больше ваш тематический индекс цитирования, тем выше будет цена ссылки с главной страницы вашего сайта, да и вообще к вашему сайту будет более уважительное отношение. Но для увеличения тИЦ следует пользоваться только легальными, "Белыми" методами.
Разрешено в мире поисковой оптимизации всё, что не запрещено поисковиками. А запрещено ими: создавать страницы, бесполезные для пользователя, служащие для перенаправления на другой сайт (Дорвеи - DoorWay), скрывать ссылки от пользователя (Cloaking - Клоакинг), поисковой спам, некоторые другие методы. Покупка-продажа ссылок также не приветствуется поисковиками. Поэтому я призываю вас не прибегать к вышеперечисленным методам, а пользоваться другими, легальными методами.
Ange1's fall © - специально для . ru
Апорт
Материал из Википедии — свободной энциклопедии
(Перенаправлено с Aport)
Перейти к: навигация, поиск
Апо́рт — российская поисковая система. Используется с 1995 года. Часть портала РОЛ. Принадлежит Golden Telecom. При поиске учитываются особенности русского языка.
Логотип Апорт
В Рунете с начала 2000-х годов поисковая система стала резко сдавать позиции, заметно уступая по популярности Яндексу и Рамблеру. По богатству языка запросов заметно уступает другим популярным системам.
Ссылки
- Поисковая система Апорт Алгоритм работы "Апорта"
Алгоритмы "Апорта"
Апорт в 1999 году первым из отечественных поисковых систем стал использовать для ранжирования документов модификацию классического алгоритма PageRank. Показатель авторитетности документа имеет название «Индекс цитирования» - ИЦ (так же представители Апорта называют его в своих документах как PageRank, так и взвешенный индекс цитирования). Самым кардинальным отличием от классического PageRank в Апорте является то, что при расчете ИЦ документа им учитывается всего одна, «лучшая», ссылка со всех страниц домена второго уровня. «Лучшей» считается та ссылка, которая передает наибольший вес документу. Индексом цитирования сайта (он же Site Rank), использующегося для ранжирования сайтов в каталоге Апорта, считается наибольший индекс цитирования из всех страниц сайта. Значение ИЦ можно узнать только для сайтов, зарегистрированных в каталоге, в соответствующей ему категории.
Апорт (Aport) www. *****
"Ищет что надо"
Из подписи под логотипом сайта
Старейшая русскоязычная поисковая система (с 1995 г.). Когда то занимала 10% аудитории Рунета. Поисковая система Апорт впервые была презентована на пресс-конференции компании "Агама" в феврале 1996 года. Тогда система работала только по сайту russia. . К моменту официальной презентации, 11 ноября 1997 года, в поисковой системе Апорт был проиндексирован первый миллион документов, расположенных на 10 тысячах серверов. Отцом www. ***** стала компания "Агама" - разработчик программного обеспечения для Windows. Это отразилось и на создании поисковой системы, в отличие от большинства конкурентов Aport продолжает работать под управлением ОС Windows.
Ноябрь 1998 года - Aport продан гражданину Израиля Джозефу Авчуку. Сумма сделки составила 55 тысяч долларов. Торговые марки "Апорт" и "Агама" сохранились, каталогу Ау! повезло гораздо меньше. В 1999 году Авчук окончательно покупает каталог и переименовывает его в AtRus, а после и вовсе уничтожает при экспорте на сайты "Омен", "Россия он-лайн" и "Апорт".
Конец 1999 года - в поисковую систему Апорт вложен первый миллион долларов, это позволило, некоторое время спустя, представить на компьютерных выставках "Апорт - 2000". Полностью интегрированный с AtRus; теперь Каталог - Апорт (Catalog - Aport).
Поисковая система Aport 2000 была построена на основе выдачи результатов по отдельно взятым сайтам. Для разделения ресурсов на сайты Апорт использует информацию, которую предоставляет каталог AtRus, или владельцы ресурсов.
www. ***** - первым из поисковых систем Рунета реализовал базовые технологии Google. "Page rank" - характеристика популярности ресурса по формуле "обратных ссылок": ссылки с других сайтов на данный ресурс. Причем учитывается не только количество, но и важность ссылок. Вес ссылки с популярного сайта больше, а ссылки включающие слова запроса ценятся выше, чем ссылки со словом "здесь". К тому же, при обработке запроса поисковая система Aport 2000 ориентируется на HTML - код страницы, и наличие слов запроса в URL.
Первым www. ***** стал использовать платную нулевую строку в выдаче (контекстная реклама). Но на Апорт купить не нулевое, просто более высокое место в ответной странице.
31 июля 2000 года Golden Telecom купил семейство интернет-проектов "Агама", включающее "Апорт" и AtRus, для включения в "Россию-он-лайн" и околоконтентные проекты.
Май 2001 - года окончательно завершилась сделка по смене владельца "Апорт" самого "Golden Telecom", новым владельцем стал "Альфа-Банк". NASDAQ к тому времени переживал бурный спад, и шансов перепродать Интернет проекты за приемлемую сумму не было. Это обусловило решение новых хозяев "Golden Telecom" минимизировать расходы на поддержку дорогостоящих Интернет проектов.
Rambler
Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
Рамблер | |
URL | http://*****/ |
Коммерческий? | Да |
Тип сайта | поисковая система, интернет-портал |
Регистрация | Нет |
Владение | |
Авторство | |
Начало работы | 1996 |
Оборот | ? |
Прибыль | ? |
Rambler Media Group — интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов российского Интернета, информационный портал (см. описание).
Контрольный пакет Rambler Media Group (около 48,8 % акций), ранее принадлежавший инвестиционным фондам, в октябре 2006 был выкуплен холдингом «Проф-Медиа» ориентировочно за $230 млн[1][2].
Rambler создан в 1996 году. Ранее принадлежавшая Rambler’у телекомпания «Rambler Телесеть» в октябре 2006 была также продана компании «Проф-Медиа». Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова. По умолчанию в Рамблере результаты ранжируются по степени соответствия (релевантность) запросу и группируются по сайтам.
Настройки языка поиска: любой, русский, английский, украинский. Учитывается морфология.
Одно время поисковая система Рамблер была самой популярной в рунете, но позже уступила лидерство Яндексу.
Источники
↑ «Интеррос» в Интернете. «Ведомости», № , 1 ноября 2006 ↑ http://www. *****/db/press/msg. html? mid=9017070&s=Алгоритмы "Рамблера"
С осени 2002 года поисковая машина стала рассчитывать для каждого документа коэффициент популярности. Вот, что сказано на сайта Рамблера об этом коэффициенте: «Данный коэффициент, как алгоритм PageRank, основан на учете гиперссылок между страницами сети, однако наша реализация дополнительно использует данные о реальной посещаемости страниц, полученные от счетчика Top100. Дело в том, что «классические» ссылочные алгоритмы фактически учитывают мнение только одной категории пользователей сети – web-мастеров. Действительно, если большому количеству web-мастеров нравится тот или иной ресурс, они размещают на него ссылки. Обычные пользователи, как правило, созданием страниц и сайтов не занимаются, и поэтому учесть их мнение оказывается невозможно. Счетчик Top100 как раз и предназначен для того, чтобы сделать коэффициент популярности более справедливым». Однако, судя по всему, в последнее время данные о посещаемости документов, полученные от счетчика Top100, оказывают все меньше влияние на коэффициент популярности, так как счетчик не в состоянии противостоять массовым накруткам, практикуемым владельцами некоторых сайтов. Соответственно, все большее значение приобретает составляющая, вычисляемая на основе учета гиперссылок между страницами сети. Необходимо заметить, что некоторые документы и даже целые сайты в поисковых машинах могут по той или иной причине исключаться из процесса расчета ранга документа, на который они ссылаются. Так, например, в Яндексе для этих целей существует так называемый «непот-фильтр», который накладывается на ресурсы, находящиеся на бесплатных хостингах, но не описанные в Яндекс-каталоге, ресурсы со свободным размещением ссылок (например, гостевые книги, доски объявлений), сайты, размещающие на своих страницах ссылки, невидимые пользователю и т. п.
Краткий обзор
Поисковая система Рамблер начала свое существование с 1996 года. На сегодняшний день она является одной из самых популярных в РуНете, уступая лишь Яндексу (по популярности). По оценкам SpyLog на Рамблер приходится 20-25% от всех поисковых запросов РуНета.
Поисковая система Рамблер при поиске учитывает морфологию русского языка, что дает больше возможностей для эффективного поиска информации. Реализована также система так называемых "перевязок", которая позволяет выдавать в результатах поиска не только страницы содержащие запрос, но и слова, которые являются синонимами запроса. Еще одной функцией "перевязок", думаю более значимой, является выдача контекстной рекламы не только по конкретному запросу, но и по запросам, которые тесно связаны с исходным, это позволяет перекрыть большее количество целевой аудитроии.
На Rambler функционирует также рейтинговая система Rambler's Top 100 (http://www. *****/, здесь можно прочитать его описание), в которой можно найти наиболее посещаемые сайты по определенной тематике. На данный момент это самый популярный рейтинг РуНета, даже можно сказать, что это один из немногих рейтингов РуНета, в которых стоит участвовать.
В далеком 1991 году в маленьком подмосковном научном городке Пущино появилась группа единомышленников. Вдохновленная только что появившейся коммуникационной средой интернет, группа активно занималась внедрением сетевых технологий в бизнес-среду. Через пять лет, в 1996 году, программист Дмитрий Крюков написал первую уникальную российскую поисковую программу, которая сразу же была запущена в эксплуатацию. Название Rambler переводится как "бродяга, странник, скиталец". Так появилась информационно-поисковая система Rambler, а 3 марта 1997 года заработала рейтинговая система Rambler's Top100, которая с момента своего существования и по сей день считается лучшим классификатором российского интернета и пользуется репутацией независимого арбитра российского интернет-рынка. На базе этих двух проектов - поисковика и рейтинг-классификатора - был выстроен портал "Рамблер" в том виде, в каком мы все его знаем. . |
Позже на Рамблере появились новости, бесплатная почта для пользователей и множество других популярных проектов. Каждый год истории Рамблера была ознаменована новыми достижениями. В 2001 г. посетителям Рунета был представлен интернет-провайдер - компания "Rambler-Телеком" , в 2003 г. появились телеканал Rambler, рекламное агентство lndex20 и компания мобильных сервисов SMXCOM. А осенью 2004 г. была организована группа компаний Rambler Media, предоставляющая информацию, контент-услуги и развлечения для русскоязычной аудитории во всем мире.
В июне 2005 г. состоялось первичное размещение акций (IPO) Rambler Media на Лондонской Фондовой Бирже. IPO Rambler Media стало первым размещением российской интернет-компанией на зарубежном рынке капиталов. В ходе IPO были размещены 29% акций Rambler Media на сумму $40 млн.
В начале 2006 года Rambler Media - группа компаний, владеющая порталом Рамблер - приобрела контрольный пакет акций ведущего оператора электронной торговли России - компании "Прайс Экспресс". В ее состав входят такие известные площадки, как ***** и Тындекс. Ru.
2006 год закрепил позиции Рамблера как активного игрока интернет-рынка. Рамблер приобрел 51% "Прайс-Экспресс", ведущей российской компании в сфере электронной торговли. Были куплены активы проектов "Баннербанк". Группа компаний Rambler Media, владеющая интернет-холдингом Рамблер, объявила о создании на базе действующего сайта газеты "Из рук в руки" нового информационного портала. Договоренность о таком проекте была достигнута с компанией Trader Media East, владеющей газетой "Из рук в руки".
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 |


