Московский Государственный Институт Электроники и Математики
(Технический Университет)
Кафедра «Информационно-коммуникационных технологий»
Курсовая работа по теме:
«Поисковая оптимизация сайта auditory.ru»
Выполнила:
Группа: С-35
Проверил:
Москва, 2008 г.
Содержание
Содержание.................................................................................................................................................................................... 2
ВВедение......................................................................................................................................................................................... 3
Ребрендинг...................................................................................................................................................................................... 4
Задачи.............................................................................................................................................................................................. 5
Анализ сайта до поисковой оптимизации.............................................................................................................................. 6
Составление семантического ядра сайта............................................................................................................................ 10
Составление первичного списка слов и словосочетаний..................................................................................... 10
Расширение списка с использованием ассоциированных запросов................................................................. 10
Выбор релевантных страниц сайта...................................................................................................................................... 12
Оптимизация индексирования сайта..................................................................................................................................... 13
Упавление индексацией................................................................................................................................................. 13
Адреса страниц................................................................................................................................................................. 13
Заголовки HTTP.......................................................................................................................................................................... 13
Коррекция сайта для ранжирования..................................................................................................................................... 14
Цитата................................................................................................................................................................................. 14
Вес ключевых слов.......................................................................................................................................................... 14
Титулы, заголовки, теги выделения и изображений............................................................................................... 14
Внутренние ссылки.......................................................................................................................................................... 15
Ссылочное ранжирование....................................................................................................................................................... 15
Анализ продвижения сайта...................................................................................................................................................... 15
Список литературы.................................................................................................................................................................... 15
ВВедение
В 1969 году в Америке появилась первая компьютерная сеть, необходимая для быстрой и надежной передачи информации. С тех пор прошло 40 лет, компьютерная сеть охватывает все уголки планеты, и мы не можем представить себе жизнь без Интернета. Теперь Компьютерные сети не просто способ отправить электронную почту: уже существует и IP-телефония[1], и IP-телевидение[2], через Интернет проводят конференции, работают и получают образование удаленно, совершают покупки и т. д.
Интернет стал удобнейшей средой для рекламы. Сейчас практически каждая организация имеет свой сайт во всемирной сети. Почему? Именно через интернет все чаще и чаще клиент приходит к предпринимателю[3]. Это отличная реклама, позволяющая увеличить число продаж.
Кафедра ИКТ (информационно-коммуникационных технологий) конечно же ничего не продает, но также нуждается в клиентах. Наши клиенты – абитуриенты и студенты. Логично, что чем большее количество абитуриентов поступает в МИЭМ и в частности на кафедру ИКТ, тем выше конкурс, проходной балл; чем выше проходной балл, тем выше начальный уровень образования поступивших студентов, тем проще и приятнее с ними будет работать. Это пусть косвенно, но влияет на престижность кафедры/вуза.
Итак, сайт кафедры ИКТ предоставляет удобные сервисы студентам и выполняет представительскую функцию для абитуриентов и их родителей.
Ребрендинг[4]
В марте 2008 кафедра сменила свое название с ЭВА (электронно-вычислительная аппаратура), на соответствующее сегодняшней деятельности - ИКТ (информационно-коммуникационные технологии).
После этого студентами был нарисован новый логотип, а затем в июле, во время летней практики студенты[5] начали работу над новым сайтом.
Сайт был запущен в ноябре, изменился не только его внешний вид, изменилась функциональность, были заложены возможности дальнейшего развития страницы. ***** после некоторых модификаций мог бы стать и стартовой страницей студента ИКТ, на ней отображаются новости о последних событиях, фотографии из галереи и работы видеостудии, дни рождения, а в будущем появится расписание занятий и интерактивный учебный «ежедневник» - словом разнообразная полезная для студента информация. Студенты могут сами вести активное участие в изменении контента[6] сайта: добавлять новости и события, цитаты, фотографии и так далее.
Но замена старого сайта свела ряд достигнутых позиций в поисковых системах к минимальным показателям, поскольку изменились уже проиндексированные пути к страницам, а позиции в поисковых системах играют немаловажную роль в продвижении кафедры.
рис.1 Внешний вид новой и старой версий сайта auditory.ru
Задачи
Итак кафедра имеет представительский сайт, кроме того удобный и многофункциональный, с большим количеством дополнительных сервисов, таких как форум, фото-галерея, файловое хранилище. Эти сервисы в полной мере доступны студентам и преподавателям и ими уже активно используются. Но на данный момент наша задача – привлечь абитуриентов и их родителей, привести их на сайт и заинтересовать. Естественно, чтобы привести пользователя на сайт, нужно чтобы он его нашел.
Пользователи приходят на сайт несколькими путями: вводят прямой адрес сайта, приходят со ссылающихся ресурсов, из поисковых систем [7]и каталогов. Можно предположить, что большинство абитуриентов, на которых мы ориентируемся приходят из поисковых систем, таких как «Яндекс», Google. Значит для продуктивной раскрутки сайта следует повышать его позиции в выдаче поисковых систем, оптимизировать его к поисковым системам.[8]
На начальном этапе наши задачи сводятся к
§ составлению правильного семантического ядра[9], те списка поисковых запросов, по которым будет продвигаться сайт;
§ модификации сайта и его контента в соответствии с семантическим ядром;
§ повышение ИЦ[10] сайта;
Анализ сайта до поисковой оптимизации[11]
Таблица 1. | ||
Параметры анализа/Поисковая система | Яндекс/тИЦ[12] | Google/PR[13] |
Индекс цитирования | 190 | 3 |
Проиндексировано страниц | 68000 | 13300 |
Ссылки на сайт | 70755/1190 | 4 |
Наличие в каталоге | есть |
Как видно из таблицы 1, тИЦ в «Яндекс» не высокий, но значительно выше чем PR в Google, это значит что на наш сайт мало ссылаются с других интернет-ресурсов.
Выянилось, что индексация [14]страниц сайта запрещена в файле ROBOTS. txt:
«User-agent: *
Disallow: /».
Это значит, что страницы сайта не индексируются поисковиком, и сайт появляется по минимальному количеству запросов, таких как «миэм» и «кафедра ИКТ» (эти слова указаны в заголовках страниц).
Естественно такие результаты анализа неудовлетворительны.
Следует разрешить индексацию сайта поисковым робота, повысить тИЦ и PR, произвести внутренние изменения сайта для нахождения поисковым роботом слов, соответствующим поисковым запросам.
После проведенных операций останется дождаться, когда поисковый робот зайдет на сайт, проиндексирует его страницы и изменит ранг страниц.
Регистрация ***** в каталоге ***** (http://top. *****/jump? from=1522674) позволяет узнать и проанализировать данные о посещаемости сайта, пути по которым приходит пользователь и т. д. В нем ***** занимает 83 место среди вузов.

Рис.2 Динамика визитов на auditory.ru в каталоге mail.ru.

Рис.3 Auditory.ru в каталоге «Yandex»

Рис.4 Ресурсы, с которых приходят пользователи на auditory.ru. статистика mail.ru
В позициях каталога «Yandex» (http://search. yaca. *****/yca/cy/ch/www. *****/) сайт находится значительно ниже, лишь на 188 среди технических вузов.
Составление семантического ядра сайта
Список поисковых запросов в семантическом ядре должен наилучшим образом соответствовать смыслу и основному содержанию сайта. Я буду использовать пошаговую методику составления семантического ядра.
Составление первичного списка слов и словосочетаний
Первичный список слов и словосочетаний составляется из основных слов характеризующих деятельность кафедры ИКТ.
Список:
ВУЗ, высшее образование, ИКТ, информационно-коммуникационные технологии, информационные технологии, кафедра ИКТ, качественное образование, коммуникационные технологии, куда пойти учиться, МИЭМ, молодые специалисты, мультимедиа, программирование, профильное образование, сетевые технологии, технический ВУЗ, техническое образование.
Такой список можно составить, представив себя на месте пользователя, которому нужна информация предлагаемая на сайте; выбрав подходящие словосочетания, просмотрев свой и сайты конкурентов; проанализировав поисковую рекламу по теме вузов; опросив нескольких студентов, узнать с помощью каких запросов они искали бы ВУЗ.
Расширение списка с использованием ассоциированных запросов
Составляя первичный список с помощью опросов или «из головы» можно не вспомнить некоторые важные слова, поэтому первичный список следует уточнять, используя ассоциируемые запросы. Это легко сделать, воспользовавшись сервисом «Яндекса» «Статистика запросов» (http://wordstat. *****)
ВУЗ:
технический ВУЗ, институт, технический институт, куда пойти учиться
высшее профессиональное образование, высшие учебные заведения.
Образование:
высшее образование, профильное образование, техническое образовании, е качественное образование.
ИКТ :
информационно-коммуникационные технологии, информационные технологии, кафедра ИКТ, коммуникационные технологии.
МИЭМ:
МГИЭМ, московский государственный институт электроники и математики.
Мультимедиа:
мультимедиа системы.
Программирование:
программирование на ЯВУ, web программирование, курсы программирования, обучение программистов.
Сетевые технологии:
сетевые информационные технологии, сетевая технология образование, компьютерные сети.

Рис.5 Статистика запросов «Яндекса» - пример подбора ассоциированных запросов
Выбор релевантных[15] страниц сайта
Поисковые системы сортируют ссылки в результатах поиска по убыванию релевантности, на одном сайте может быть несколько релевантных запросу страниц, поисковая система старается не перегружать результаты поиска ссылками на один и тот же сайт. Для каждого сайта поисковик показывает одну, наиболее релевантную запросу страницу.
Для поиска наиболее релевантной страницы выполняется поиск по запросам, ограниченный страницами сайта. Такие возможности предоставляет функция «расширенный поиск», существующая практически во всех поисковиках. Например в «Яндекс» http://*****/advanced. html
Для ***** релевантными страницами будут «Главная», «Абитуриенту», «Состав», «Наука».
Рис. 6 Страница расширенного поиска «Яндекс», на которой можно задать ограничение поиска по одному сайту для определения наиболее релевантных страниц
Оптимизация индексирования сайта
На индексацию страниц сайта влияет несколько факторов, рассмотрим их.
Упавление индексацией
Иногда требуется, чтобы страницы не индексировались поисковыми роботами, например если это страницы форума, страницы в разработке, страницы для печати.
Поэтому существует возможность запрета индексации некоторых страниц или всего сайта.
Запретить роботу индексировать страницу можно в meta-теге robots, тогда в коде запрещенной страницы появляется строка <meta name=”robots” content=”none”>. А можно запретить индексирование, добавив в корневой каталог сайта файл robots. txt. в файле указывается кому и что запрещено индексировать.
Содержание файла robots. txt, который забыли удалить после запуска *****, следующее:
User-agent: *
Disallow: /
Это значит, что всем поисковым роботам запрещено индексировать весь сайт. Чтобы поисковый робот смог вновь индексировать сайт я просто удаляю этот файл.
Адреса страниц
Поисковые роботы без проблем индексируют статические страницы. Это страницы, имеющие постоянный адрес, редко меняются и чаще всего имеют расширение. html. Это такие страницы как «Абитуриенту», «Состав», «Наука».
Однако существуют страницы с динамическими адресами, как правило страницы, генерируемые скриптами при обращении к серверу. Адреса таких страниц желательно приводить к псевдостатическому виду, это легко реализуется с помощью инструкций в файле. htaccess.
Заголовки HTTP
Клиент (браузер или поисковый робот) «общается» с сервером сайта на языке HTTP с помощью запросов и откликов. При каждом запросе к серверу браузер или поисковый робот передает служебную информацию в заголовках HTTP. Важно, чтобы сервер был правильно настроен, иначе при нестандартных запросах поискового робота он выдаст роботу сообщение об ошибке, и тогда сайт просто не будет проиндексирован.
С помощью следующих запросов можем убедиться в правильности работы нашего сеовера:
kernelmadness@kernelmadness-laptop:~/crit/dev/php/powerpanel/ppn$ telnet ***** 80
Trying 80.250.162.181...
Connected to *****.
Escape character is '^]'.
GET / HTTP/1.1
Host: *****
HTTP/OK
Server: nginx/0.6.24
Date: Mon, 22 Dec 2008 15:46:28 GMT
Content-Type: text/html; charset=utf-8
Transfer-Encoding: chunked
Connection: keep-alive
Keep-Alive: timeout=20
X-Powered-By: PHP/5.2.6-pl7-gentoo
Set-Cookie: symfony=6994dcb8741526c1d1a87c7d71ebee82; path=/
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Коррекция сайта для ранжирования
В индексе поисковой системы слово, соответствующее запросу, может быть найдено на многих веб-страницах. При этом количество страниц может быть очень большим – тысячи и даже десятки страниц. И система должна отсортировать эти результаты так, чтобы наиболее релевантные страницы оказались на первых позициях в выдаче. Для решения этой задачи поисковая система учитывает много факторов, которые можно условно разделить на внутренние и внешние.
Внутренние факторы ранжирования – это параметры, которые владелец сайта имеет возможность легко изменить самостоятельно. То есть это тексты, теги, рисунки, внутренние ссылки на сайте.
Цитата
Поисковая машина оценивает страницы, где слова запроса идут рядом и в том же порядке, как в запросе, как более релевантные. Это значит, что использование в тексте страницы точных формулировок, «цитат», тех поисковых запросов, по которым хочется привлечь посетителей, увеличит ранг страницы. Также может иметь смысл использование слов в тех же падежах и числах, что и в целевом запросе. Точное совпадение формы и порядка следования слов даст значительное приращение релевантности страницы.
Поисковые системы учитывают и положение слов запроса на странице. Пользователь читает сверху вниз, поэтому и поисковики стараются оценить выше страницу, где слова, соответствующие поисковому запросу, расположены выше.
Вес ключевых слов
Вес ключевого слова тоже может увеличивать релевантность страницы этому запросу. Вес ключевых слов это отношение количества вхождений слова к общему количеству слов в документе. Больший вес означает наибольшую релевантность страницы запросу, так как чем подробнее текст, тем чаще может встречаться ключевой слово, однако нельзя перебарщивать с этим, иначе страница не будет «естественной» и может значительно понизиться в позициях поисковика.
Титулы, заголовки, теги выделения и изображений
Титулом веб-страницы называется текст заголовка веб-страницы, пользователь видит его в верхней полосе окна своего браузера и прописывается в теге <title>. На странице результатов поиска титул чрезвычайно важен – он используется поисковой машиной для того, чтобы озаглавить сайт, найденный по запросу. Титул – наиболее заметная деталь оформления ссылки на сайт в результатах поиска, именно его пользователь читает в первую очередь. Важно чтобы титульные фразы соответствовали поисковым запросам пользователя.
Естественные тексты, как правило, имеют заголовки разных уровней, это помогает пользователю ориентироваться на странице. Это актуально и для веб-страниц, поэтому для поисковых систем такие слова имеют больший вес.
В естественных текстах обычно отмечают места, на которых читатель должен акцентировать свое внимание, для этого слова выделяют жирным шрифтом, курсивом, подчеркиванием, в разметке веб-страницы это делается тегами <strong>, <em>, <b>, <i>. Страница, где поисковые слова будут найдены в таких тегах, может быть ранжирована выше.
В тексты вставляют изображения, это оживляет текст, иллюстрирует его. Текст с картинками воспринимается пользователями гораздо лучше, чем сплошной. На веб-страницах иллюстрации размещаются с помощью тега <img>. В этом теге присутствует атрибут alt, предназначенный для описания, подписи изображения. Тест в подписи может давать важную дополнительную информацию, а вместе с тем и повышать ранг страницы - подпись можно включить ключевые слова. Например:
<img src=”auditory.ru/logo.jpg” alt=”МИЭМ. Кафедра ИКТ”>
Внутренние ссылки
Большое значение для поисковых систем имеет авторитет страницы, иными словами количество ссылок на нее и авторитетность ссылающихся ресурсов. Также учитываются и внутренние ссылки сайта. Путем расстановки внутренних ссылок можно улучшить ранжирование наиболее релевантных страниц в результатах поиска.
Для ранжирования имеет значение не только количество и качество ссылающихся страниц, но и то, как именно они ссылаются. Ведь ссылки могут выглядеть как графические изображения или текст. В первом случае, чтобы поисковая система смогла распознать, о чем «говорит» изображение, ссылка должна иметь описание, например такое:
<a href=”*****”>Сайт кафедры ИКТ МИЭМ</a>
В таком случае ссылка будет правильно восприниматься поисковиком, а релевантность страницы указанной в ссылке увеличится.
Ссылочное ранжирование
Работа со ссылками – один из наиболее важных аспектов методов поисковой оптимизации. Влияние ссылок на документ делят на два типа. Первый связан с авторитетностью страницы, второй с текстом ссылок, его называют ссылочным ранжированием (о нем было рассказано выше).
Для повышения авторитетности сайта нужно увеличить количество ссылок на него, причем чем выше авторитетность ссылающихся источников, тем лучше.
Нашей кафедре принадлежит целая система сайтов, сервисов: forum. *****, share. *****, photo. ***** и так далее. Организовав перекрестные ссылки между этими сайтами и ***** мы сможем повысить ранг последнего.
Также можно размещать ссылки на наш сайт в разнообразных каталогах, правды повышение авторитетности от таких источников будет незначительным, однако может привести на сайт пользователя. Также на авторитетность могут влиять ссылки на с блогов[16] и форумов, упоминание о сайте кафедры на сайте МИЭМ-а.
Анализ продвижения сайта
Скорость продвижения сайта зависит от разных факторов. Это может зависеть как от того, насколько быстро поисковый робот проиндексирует сайт, так и от того, насколько предоставляемая на сайте информация востребована в данный момент. Нас в этой работе интересуют посетители-абитуриенты. Студенты уже знают о сайте, знают его адрес, их мы привлекаем уже с помощью контента, а абитуриентов еще нужно привести на сайт.
Следует оценить, когда абитуриент потребуется наш сайт? Скорее всего, в начале учебного году, когда абитуриент решает что надо выбирать ВУЗ для поступления; и весной, в преддверии дня «Открытых дверей», первых вступительных экзаменов, желая узнать место, время и прочие условия поступления.
Таким образом, результат продвижения вряд ли можно будет увидеть сразу, потребуется несколько месяцев.
Список литературы
«Оптимизация и продвижение сайтов поисковых системах», И. Ашманов, А. Иванов;
«Словосочетания для раскрутки: как правильно целиться» Е. Трофименко (http://*****/articles/se-work/report-optimization-2003.php);
«Основные факторы, влияющие на релевантность» С. Людкевич, Е. Есипова (http://www.promo-techart.ru/analysis/relevants.htm);
[1] IP – телефония (VoIP - англ. Voice over Internet Protocol) — система связи, обеспечивающая передачу речевого сигнала по сети Интернет или по любым другим IP-сетям. (источник: ru. wikipedia. org)
[2] IP-телевидение (Технология IPTV - англ. Internet Protocol Television) — цифровое интерактивное телевидение в сетях передачи данных по протоколу IP, новое поколение телевидения. (источник: ru. wikipedia. org)
[3] Узнать данные 2007 года о недельной аудитории российского Интернета можно по адресу http://*****/news/res_results/354.html, количество проиндексированных «Яндексом» страниц около миллиарда по словам Ильи Сегаловича (технический директор «Яндекс»)
[4] Ребрендинг - изменение названия, логотипа, визуального оформления бренда с изменением позиционирования, а также изменение целостной идеологии бренда. (источник: ru. wikipedia. org)
[5] Под руководством Дениса Королева и Дмитрия Столярова работали Екатерина Сотова (дизайн), Андрей Колаштов (программирование), Антон Климов (верстка).
[6] Конте́нт (англ. content — содержание) — любое информационно значимое (содержательное) наполнение информационного ресурса (например, веб-сайта) — тексты, графика, мультимедиа — вся информация, которую пользователь может загрузить на диск компьютера с соблюдением соответствующих законностей, как правило, только для личного пользования. (источник: ru. wikipedia. org)
[7] Поиско́вая систе́ма — веб-сайт, предоставляющий возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet. (источник: ru. wikipedia. org)
[8] Поиско́вая оптимиза́ция (англ. search engine optimization, SEO) — процесс корректировки HTML-кода, текстового наполнения (контента), структуры сайта, контроль внешних факторов для соответствия требованиям алгоритма поисковых систем, с целью поднятия позиции сайта в результатах поиска в поисковых системах по определенным запросам пользователей. Чем выше позиция сайта в результатах поиска, тем больше заинтересованных посетителей перейдет на него с поисковых систем. (источник: ru. wikipedia. org)
[9] Семантическое ядро - набор слов и словосочетаний, наиболее вероятных в качестве запросов тематической аудитории сайта. Включает в себя ключевые слова как отдельно, так и в уточняющих сочетаниях. (источник: www. *****)
[10] Индекс цитирования (ИЦ) — показатель поисковой системы, вычисляемый на основе числа ссылок на данный ресурс с других ресурсов сети интернет. (источник: ru. wikipedia. org)
[11] Данные собраны программой Site-Auditor v1.63
[12] Тематический индекс цитирования — показатель поисковой системы, вычисляемый на основе числа ссылок на данный ресурс с других ресурсов сети интернет. Учитывает также тематику ссылающихся на ресурс сайтов, а взвешенный индекс цитирования — популярность ссылающихся сайтов
[13] PageRank — это числовая величина, характеризующая «важность» страницы в Google. Чем больше ссылок на страницу, тем она становится «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы путем подсчета важности ссылок на нее. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайта в результатах поиска Google. (источник: ru. wikipedia. org)
[14] Индексация в поисковых системах — процесс добавления сведений (о сайте) роботом поисковой машины в базу данных, впоследствии использующуюся для (полнотекстового) поиска информации на проиндексированных сайтах. (источник: ru. wikipedia. org)
[15] Релева́нтность (англ. relevant) — степень соответствия запроса и найденного, т. е. уместность результата. В более общем смысле, одно из наиболее близких понятию качества «релевантности» - «адекватность», т. е. оценка степени соответствия, но и степени практической применимости результата, а так же степени социальной применимости варианта решения задачи.
[16] Блог -



