Парад кластерных метапоисковиков
Проблема сортировки и дополнительной обработки результатов метапоиска стоит даже более остро, чем в случае отдельного поисковика. Неудивительно, что интерес к кластерным технологиям пришел и в эту сферу. Идея "скрестить" две технологии — метапоиск по интернет-ресурсам и механизмы кластеризации результатов — оказалась на удивление удачной. Во-первых, сохраняются преимущества метапоисковиков в части широты охвата ресурсов. Во-вторых, совершенно новыми красками начинает играть кластерная сортировка результатов такого поиска — ведь именно в такой ситуации проявляются сильные стороны данной технологии, которая нивелирует главные недостатки метапоиска для конечного пользователя — перегрузка информацией, проблемы ранжирования результатов и не очень богатые возможности уточнения запроса. Давайте пройдемся по современным лидерам кластерного метапоиска и посмотрим, какие преимущества они способны дать при поиске нужных сведений.
Vivisimo
Поисковик Vivisimo представляет собой демонстратор технологий — основной заработок его разработчиков состоит в лицензировании движка для других приложений. Работает Vivisimo как с поисковиками широкого профиля, так и со специализированными тематическими машинами. Присутствует поиск по крупным новостным лентам. Для широкого пользователя он интересен в первую очередь тем, что кластерная технология здесь представлена практически в чистом виде, не замутненном различными дополнительными примочками. В отличие от уже знакомого нам поисковика , кластеры Vivisimo представлены не набором дополнительных ключевых слов, а в виде наглядного иерархического дерева результатов. По умолчанию показывается только часть дерева, и для того, чтобы увидеть все разделы, потребуется щелкнуть по ссылке More, расположенной под списком. Доступна опция быстрого поиска в кластерах (Find in clusters). Она по сути своей работает на уточнение запроса. Если внести в это поле дополнительное ключевое слово, то все кластеры в дереве, в которых встречается данный термин, получат цветную подсветку. Есть несколько интересных находок и в интерфейсе поисковика. В аннотациях к ссылкам показывается традиционная для метапоисковиков строка, сообщающая, в чьих именно базах был найден данный документ, а также его рейтинг в этих системах. Удобная особенность Vivisimo — предварительный просмотр найденных страниц в небольшом окошке прямо на странице результатов поиска, рядом со ссылками (кнопка preview). Это значит, что вам не придется уходить с поисковика или бороться с толпой новых окон браузера в попытке бросить взгляд на найденные сайты.
Страница расширенного поиска предлагает выбор баз данных, по которым будет вестись поиск, а также такие служебные инструменты, как ограничение по языкам документов (что приятно, в списке присутствует не только русский, но также и белорусский и украинский), "семейный" фильтр и состав дополнительной информации о найденной ссылке, выводимой в списке результатов. Отметим, что Vivisimo отрабатывает запросы на русском, выделяя довольно корректные кластеры. Правда, результаты такого поиска не будут полными, поскольку система практически ничего не знает о русских поисковиках. Пользователям браузера Firefox предлагается скачать бесплатную панель поиска Vivisimo. Таким образом, иерархическая организация результатов серьезно сокращает время, затрачиваемое на знакомство с результатами. Vivisimo выглядит очень даже неплохим выбором при поиске по широким темам. В "минус" запишем игнорирование русскоязычных поисковиков, а также отсутствие поиска изображений и других не-HTML-документов.
Clusty
В основу этого метапоисковика положен движок Vivisimo, к которому, как и полагается в случае полноценного решения, был добавлен ряд новых функций. Стартовал Clusty в 2004 году. Среди доступных баз данных — MSN, Ask, Gigablast, Wisenut, Looksmart и Open Directory. Как и положено близкому родственнику Vivisimo, Clusty выводит результаты поиска организованными в тематические категории-кластеры. Кроме общей кластеризации по собственному алгоритму системы, можно "заказать" кластерный поиск по определенному источнику или URL. Что касается языка запросов, то Clusty понимает операторы AND, OR, NOT и NEAR. Можно также вести поиск по фразе, взятой в кавычки, правда, последняя возможность является недокументированной. Используя операторы, стоит учесть, что Clusty отправит их только на те поисковики, которые поддерживают их использование. Сразу отметим более широкий выбор направлений поиска. Кроме веб-документов, доступен метапоиск по изображениям и новостям, а также блогам. В настройках поиска выставляется количество выводимых по умолчанию кластеров, набор инструментов для работы с найденными ссылками и другие служебные настройки. Кроме того, можно выбрать конкретные поисковики, на которые уйдет ваш запрос. Интересная функция Clusty — выбор основы для кластеризации. Проводится он с помощью выпадающего меню над деревом кластеров. Доступны три варианта: кластеризация по теме, источнику и URL. Если первый режим не требует пояснений, то второй позволяет быстро сгруппировать результаты по нашедшим их поисковикам, а третий — по зонам (.com, .net, .org и т. д.). Просмотрев найденные результаты, можно сразу отправиться на оказавшиеся самыми полезными поисковики. К сожалению, среди них вы не найдете Google и Yahoo, что стоит признать существенным недостатком Clusty. Как и Vivisimo, Clusty предлагает панель инструментов для Firefox. Доступна и панель для Internet Explorer, так что его сторонники в этом случае не должны чувствовать себя обделенными.
ez2Find
Как и рассмотренные выше метапоисковики, данный ресурс использует кластеризацию для обработки собранных ссылок, при этом заявляя о поддержке поиска по базам Google и Yahoo. Метапоиск ведется по веб-страницам, каталогам, изображениям, новостям, коммерческим предложениям и энциклопедиям. Среди последних — Encarta, Wikipedia, InfoPlease, Encyclopedia, XReferer и Bartleby. В каждом направлении поиска можно выбрать собственный набор поисковиков, на который уйдет ваш запрос. Выбрать среди них нужные можно просто проставив галочки в предлагаемом списке. Это дает одну любопытную возможность — отметив какой-нибудь один поисковик, вы, по сути, получите для него внешний "кластерный" интерфейс. Ez2Find удачно работает с локальными поисковиками. На стартовой странице ресурса присутствует раздел Local, в котором можно быстро перейти к поиску по местным поисковикам, каталогам и другим подобным ресурсам. Эта функция ez2Find поистине уникальна и существенно экономит время при поиске редкой информации в не самых популярных национальных сегментах Интернета. В отличие от Vivisimo с его иерархическим деревом, ez2Find показывает кластеры единым одноуровневым списком. Уточнить запрос можно только один раз, после чего дополнительная панель кластеров становится недоступной. Над основным списком ссылок на странице выводится небольшая панель, на которой можно выбрать используемые поисковики. Если один ресурс нашли сразу несколько поисковиков, то Ez2Find показывает рядом со ссылкой несколько звездочек — по числу нашедших ее серверов. Под общим списком дается статистика обработки вашего запроса различными поисковиками. Из дополнительных сервисов можно отметить доступ к справочным данным о найденных сайтах (используется Alexia) и онлайновому переводчику веб-страниц (основан на Systran). Результаты перевода, как это пока свойственно машинным переводчикам, во многом оставляют желать лучшего, однако общий смысл понять можно — этакая приятная мелочь.
Nigma
www. *****
Российский кластерный метапоисковик Nigma можно назвать достойным ответом западным ресурсам. Это разработка Московского государственного университета им. . Предварительная версия сервиса была запущена в начале 2005 г. Несмотря на все еще ведущуюся доработку, Nigma уже сейчас демонстрирует весьма достойный результат. Кстати говоря, авторы системы обещают открыть ее коды после того, как будет получена полностью стабильная версия системы. Nigma опрашивает Google, Yahoo, Altavista, MSN, Yandex и Rambler, обеспечивая тем самым замечательный охват источников. В Nigma заложен ряд интереснейших решений, которые заслуживают отдельного разговора, поэтому сейчас ограничимся только самым вкусным.
Во-первых, поисковикам отправляются запросы не только по точно заданному вами слову, но и по его автоматически сгенерированным формам, что существенно увеличивает количество найденных страниц. Работа этого механизма видна в служебной информации о ссылке: если документ был найден без морфологического преобразования запроса, то там будет просто указан использованный поисковик и рейтинг страницы. Если же была найдена сгенерированная словоформа, то после названия поисковика будет стоять буква "М". Поскольку проект разработан в России, этот механизм работает весьма корректно. Во-вторых, для обработки массива ссылок Nigma использует собственный алгоритм кластеризации, опять-таки, оптимизированный с учетом особенностей русского языка. Результат получается в лучших традициях уже рассмотренных зарубежных метапоисковиков. Отметим, что степень детализации кластеров здесь довольно высока, поэтому примененные в Nigma иерархические схемы их демонстрации здесь очень даже кстати. Таких схем две. Первая реализована посредством обычного HTML-интерфейса — кластеры показываются иерархическим деревом сбоку от списка ссылок. Вторая, на сегодняшний день экспериментальная, построена на AJAX и выглядит куда интересней. Нам предлагается особая панель, на которой выводятся названия выделенных кластеров. При щелчке на конкретном кластере, во-первых, загружается список относящихся к нему ссылок. Кроме того, на панели кластеров появляются связанные с активным кластером категории. Работа в таком режиме потребует некоторого привыкания, но затем становится очень удобной и на редкость наглядной. Как и подавляющее большинство уважающих себя поисковых ресурсов, Nigma предлагает загрузить собственную специализированную панель для браузера Firefox. Короче говоря, если у вас возникнет желание попробовать кластеризацию для поиска документов на русском языке, обязательно обратите самое серьезное внимание на этот некоммерческий проект.
Подведем некоторые итоги. Комбинация метапоиска и кластеризации дает весьма интересные результаты — эти технологии удачно дополняют друг друга, выгодно подчеркивая свои сильные стороны и уменьшая недостатки. Что радует, конкретные реализации данной схемы не подкачали. Vivisimo/Clusty и Easy2Find представляют собой удачные инструменты, заточенные в первую очередь под исследования широких тем. Весьма достойно выглядит российский поисковик Nigma. Результаты при этом достигаются гораздо быстрее, чем при использовании классических поисковиков.
Алексей Кутовенко, *****@***by уточнить ссылку
© Компьютерная газета\
Quintura Search
Quintura Search помогает найти плоходоступную информацию, у которой может быть невысокий рейтинг и которая не отображается на первых страницах стандартных поисковых результатов, а значит скрыта от глаз пользователя. Quintura Search работает так, “Как ищут люди”™, предлагая подсказки и ведя пользователя в том направлении, в котором он/она хочет искать, помогая конкретизировать смысл запроса, таким образом находить искомую информацию даже с низким рейтингом.
Программа Quintura Search 1.0 скачивается на компьютер пользователя. При работе с программой пользователь выбирает одну из существующих поисковых систем, отсылает в нее свой поисковый запрос и затем выбирает среди результатов запроса, уточняя его смысл.
НЕВИДИМЫЙ ИНТЕРНЕТ
SiteSputnik. Невидимый интернет.
SiteSputnik. Поиск невидимых ссылок, папок и файлов. Автор
Алексей Мыльников
Дата выхода публикации - 03.09.09г.
Последнее изменение - 22.09.10г.
Предисловие.
В настоящей публикации рассматриваются базовые функции программы SiteSputnik (вариант Invisible), предназначенные для работы с невидимым интернетом. Выражаю благодарность членам СПКР (Сообщества Практиков Конкурентной Разведки) с никами "Vinni" и "CI-КР", а также "Николаичу", "petryashov", "Искендер", "MOS" и другим специалистам за полезные советы и замечания, высказанные на форуме и в личной переписке.
Основные понятия, терминология и сокращения.
Основные поисковики. К ним отнесем Яндекс, Google, Yahoo, MSN (Live Search, Bing) и Altavista.
Видимый интернет - это проиндексированные хотя бы одним основным поисковиком ссылки. Другими словами, информация, размещенная на видимых ссылках, может быть найдена при помощи хотя бы одного поисковика.
Невидимый интернет (глубокий веб, Deep Web, Invisible Web, Hidden Web) - это ссылки, непроиндексированные ни одним из основных поисковиков. Соответственно, не существует такого запроса, при помощи которого можно найти информацию, размещенную на невидимой ссылке.
Веб-карта. Упорядоченная иерархическая структура сайта, ресурса или папки, составленная на основе видимых ссылок.
Цель, назначение, базовые функции программы.
Одна из причин существования невидимого интернета - его огромный размер, высокая скорость обновления и появление в большом количестве новых ссылок и сайтов. Поисковики не в силах своевременно, полно и точного проиндексировать, другими словами, "увидеть" все эти изменения.
Цель, назначение.
Целевое назначение программы SiteSputnik Invisible - поиск информации, по каким-либо причинам непопавшей в поле зрения основных поисковиков, повышение точности и полноты поиска.
Функции программы. В настоящей публикации рассматриваются следующие базовые функции программы SiteSputnik Invisible.
Сбор видимых ссылок и построение на их основе веб-карты сайта. Веб-карта - критерий видимости ссылок.
Поиск невидимых ссылок при помощи спайдера (паука).
Поиск невидимых ссылок в окрестности видимой ссылки или папки по "образу и подобию".
Поиск невидимых ссылок в папках открытых и папках, вложенных в открытые папки.
Поиск невидимых ссылок и папок со стандартными именами с использованием специальных словарей.
Важно.
Ни для одной из своих базовых функций SiteSputnik не "маскирует" IP пользователя. Назначение программы не "подглядывание в замочную скважину", а углубление поиска, выполненного основными поисковиками (Deep Web - глубокий веб).
Никаких открытий файлов robots. txt и, тем более, использования хранящейся в них информации не осуществляется.
Несанкционированные средства доступа к размещенной на сайтах информации в СайтСпутник''е отсутствуют.
Сбор видимых ссылок. Построение карты сайта.
О критерии видимости ссылок.
Для того, чтобы приступить к поиску невидимых ссылок, сначала собираются видимые ссылки. Для этого SiteSputnik использует несколько поисковиков, а именно: Google, Yahoo, Яндекс, MSN (Live Search, Bing) и Altavista. Кроме составления списка "Объединение", содержащего все уникальные ссылки, найденные всеми поисковиками, он строит еще карту сайта - специальную упорядоченную иерархическую структуру этих ссылок. Эта структура содержит все видимые ссылки и будет использована как плацдарм для поиска невидимых ссылок.
Есть два варианта построения карты сайта: стандартный и углубленный.
Стандартный вариант.
Выполняется один пакет из пяти запросов: по одному на каждый поисковик. Результаты поиска объединяются, дубли ссылок отбрасываются. Для Гугля, например, для ресурса ***** выполняется запрос "site:*****". Стандартного варианта, по моим оценкам, вполне достаточно для сайтов, содержащих до 300 ссылок - он сумеет найти практически все видимые ссылки.
Углубленный вариант.
Выполняется до 2100 пакетов, каждый из которых содержит по пять запросов: по одному на каждый поисковик. Первым выполняется пакет из Стандартного варианта. Для каждого найденного ресурса или папки, принадлежащего сайту, например, *****/Help, создается и выполняется очередной пакет из пяти запросов. Результаты его выполнения будут объединены с результатами, полученными при выполнении предыдущих пакетов, дубли ссылок отбрасываются.
Указанным способом SiteSputnik "вгрызается" в сайт, пятью поисковиками "обыскивает" каждый ресурс и каждую его папку и приносит практически все ссылки, видимые из интернета. На их основе он строит карту сайта. Имею опыт построения карт "размером" около 50000 ссылок. Формирование карты сайта не заметно для его владельца, так как вся информация берется только из поисковиков.
Можно сказать, что карта сайта является материализацией видимого интернета.
Последовательность действий (Стоит ли давать технологию?)
Обращаемся к подменю "Золотого ключика" и выбираем пункт Карта сайта → Базовая или Карта сайта → Углубленная.
На появившейся картинке вводим имя сайта, ресурса или папки (префиксы http:// и www. перед именем сайта не обязателены, кавычки не нужны).
Нажимаем на кнопку Карта.
Это все действия, которые требуются от пользователя для сбора видимых ссылок. Остальное сделает SiteSputnik.
Подробнее о карте сайта с картинками и пояснениями можно прочитать в отдельной публикации о построении веб-карт ресурсов и объектов.
Поиск невидимых ссылок при помощи спайдера (паука).
Основное назначение
Поиск недавно созданных ссылок.
Поиск недавно удаленных ссылок.
Поиск архивных и других неофисных файлов.
Последовательность действий
Спайдер запускается С карты сайта. Он загружает все видимые ссылки и ищет в них невидимые. Если таковые находятся, то спайдер загружает невидимые ссылки и ищет в них невидимые. Процесс продолжается до тех пор, пока не будет обработана последняя ссылка или пользователь не остановит его. На приведенном ниже рисунке показано как добраться до обращения к спайдеру.
С точки останова можно продолжить работу спайдера, если его работа была остановлена.
Включение в карту сайта найденных невидимых ссылок целесообразно выполнить для того, чтобы они были задействованы в других базовых функциях поиска в невидимом интернете.
Результаты своей работы спайдер оформляет в двух списках: невидимые ссылки и серые ссылки.
Невидимые ссылки.
Список "Невидимые" содержит все найденные невидимые ссылки.
Большая вероятность того, что эти ссылки были созданы сравнительно недавно: менее, чем две недели назад.
Серые ссылки.
Список "Серые" содержит ссылки, которые не удалось открыть.
Большая вероятность того, что это несуществующие ссылки. Возможно, что они были удалены сравнительно недавно: менее, чем две недели назад.
Поиск невидимых ссылок в окрестности видимой ссылки.
Основное назначение
Поиск ссылок и файлов в окрестности ссылки или файла по "образу и подобию".
Последовательность действий
Выбираем построенную карту сайта. На рисунке ниже представлен ее фрагмент для ресурса *****/arc/businessman.
Переходим в режим редактирования. Для этого на панели инструментов, расположенной в правом нижнем углу, нажимаем на кнопку "Редактировать". На картинке ниже эта кнопка обведена красной окружностью.
Для произвольной ссылки, например, под номером 5,
*****/arc/businessman/issue1673, вводим с клавиатуры прямо живьем в карту сайта правило [73,74,82]:
*****/arc/businessman/issue16[73,74,82], Это правило означает, что сгенерятся девять ссылок, за исключением трех видимых,
а именно шесть следующих:
*****/arc/businessman/issue1674
*****/arc/businessman/issue1675
*****/arc/businessman/issue1677
*****/arc/businessman/issue1679
*****/arc/businessman/issue1680
*****/arc/businessman/issue1682.
На рисунке ниже показано как будет выглядеть отредактированный фрагмент карты сайта. Он обведен красной линией.
Выполняем Невидимый интернет → Поиск в окрестности → Найти ссылки и файлы . Это приведет к проверке на существование каждой сгенерированной ссылки. Найденные существующие ссылки будут помещены в список "Невидимые". На картинке ниже приведен фрагмент этого списка.
Включение в карту сайта найденных невидимых ссылок целесообразно выполнить для того, чтобы они были задействованы в других базовых функциях поиска в невидимом интернете.
Результат включения невидимых ссылок в карту сайта для нашего случая приведен на картинке ниже.
Еще три примера.
1. Для ссылки dvfo. *****/new/2006.htm при помощи одного правила dvfo. *****/new/200[6,5,9].htm сгенерятся пять ссылок за минусом одной видимой, а именно следующие четыре:
dvfo. *****/new/2005.htm
dvfo. *****/new/2007.htm
dvfo. *****/new/2008.htm
dvfo. *****/new/2009.htm
Тотже результат Вы получите, если напишите dvfo. *****/new/[2006,2005,2009].htm
2. Для этой же ссылки: dvfo. *****/new/2006.htm при помощи другого правила dvfo. *****/new/2006.[htm;doc;xls;ppt] сгенерятся три ссылки, а именно:
dvfo. *****/new/2005.doc
dvfo. *****/new/2007.xls
dvfo. *****/new/2008.ppt
Обратите внимание, что в примере 1 для разделения чисел используется знак - ",", а в примере 2 для разделения символов знак - ";".
3. Для этой же ссылки: dvfo. *****/new/2006.htm при одновременном применении двух правил dvfo. *****/new/200[6,5,7].[htm;doc;xls;ppt;htm] сгенерятся двенадцать ссылок за минусом одной видимой, а именно следующие одиннадцать:
http://dvfo. *****/new/2005.doc
http://dvfo. *****/new/2005.xls
http://dvfo. *****/new/2005.ppt
http://dvfo. *****/new/2005.htm
http://dvfo. *****/new/2006.doc
http://dvfo. *****/new/2006.xls
http://dvfo. *****/new/2006.ppt
http://dvfo. *****/new/2007.doc
http://dvfo. *****/new/2007.xls
http://dvfo. *****/new/2007.ppt
http://dvfo. *****/new/2007.htm
Сложный пример.
С более сложным примером и формальными правилами описания окрестности можно ознакомиться здесь.
Проверка.
Можно предварительно проверить себя на предмет правильного ввода и генерации множества ссылок.
Для этого выполните Невидимый интернет → Сервисные функции → Просмотр окрестности
Добавить ссылку.
Можно добавить произвольную ссылку в карту сайта, для того чтобы ввести на ней правила.
Для этого выполните Невидимый интернет → Сервисные функции → Добавить ссылку в карту
Внимание.
Очень тщательно отнеситесь к набору правил генерации имен ссылок во встроенном редакторе:
помните о синтаксисе и семантике правил,
не изменяйте символы в имени ссылки - только добавляйте символы,
не рекомендуется пользоваться буфером обмена - набирайте правила прямо с клавиатуры.
Ограничение.
В настоящей версии программы SiteSputnik Invisible для некоторых сайтов (около 5%) возможны погрешности при определении существования ссылок. Для достижения 100% точности на этих сайтах необходимо скачивать все сгенерированные ссылки и анализировать их контент, что существенно замедлит процесс поиска невидимых ссылок.
Поиск невидимых ссылок в папках открытых и папках, вложенных в открытые папки.
Основное назначение
Поиск при помощи основных поисковиков папок открытых (доступных любому пользователю) и нахождение в них невидимых ссылок.
Существуют два варианта поиска невидимых ссылок в папках открытых: "Применить поисковики" и "Применить Apache".
Последовательность действий в режиме "Применить поисковики"
Выбираем: Невидимый интернет → Папки открытые → Применить поисковики → Поиск автоматический.
На появившейся картинке вводим имя сайта, ресурса или папки, в которых следует осуществить поиск папок открытых (префиксы http:// и www. перед именем сайта не обязателены, кавычки не нужны).
Нажимаем на кнопку Папка.
SiteSputnik, используя специальный пакет запросов, отыщит папки открытые, откроет все вложенные в них папки, соберет во всех папках все невидимые ссылки, папки и файлы, сохранит их в списке "Невидимые" и вставит их на свое место в карту сайта.
Для того, чтобы увидеть как работает робот СайтСпутник''а в автоматическом режиме, попробуйте запустить его для ресурса ФНС: dvfo. *****. По крайней мере на момент публикации он содержал три открытые папки, видимые из Yahoo.
В режиме Поиск интерактивный все перечисленные для автоматического режима действия SiteSputnik''a могут целенаправлено выполняться под управлением пользователя.
Последовательность действий в режиме "Применить Apache".
В карте сайта выбираем список "Папки".
Выбираем: Невидимый интернет → Папки открытые → Применить Apache → Поиск папок открытых.
Это приведет к тому, что SiteSputnik откроет все открытые папки из списка, откроет все вложенные в них папки, соберет во всех папках все невидимые ссылки, папки и файлы и сохранит их в списке "Невидимые".
Включение в карту сайта найденных невидимых ссылок целесообразно выполнить для того, чтобы они были задействованы в других базовых функциях поиска в невидимом интернете.
Сложно сказать, сколько сайтов имеют открытые папки, возможно, что 3% сайтов, возможно, меньше.
Поиск невидимых ссылок и папок со стандартными именами с использованием специальных словарей.
Основное назначение
Поиск ссылок, папок и файлов со стандартными именами на основе заранее подготовленных списков стандартных имен, называемых словарями.
Предварительные действия
Формируем словари. Максимальное число словарей - 8. Для этого открываем Настройки → Параметры → Вкладка Invisible, выбираем словарь и вводим в него стандартные имена (слова). Можно задействовать до трех словарей под имена папок и до трех словарей под имена ссылок и файлов. Четвертая пара словарей, называемая Словари-Own, создается автоматически перед выполнением "Поиска со словарем" и содержит все имена (слова) из всех ссылок, папок и файлов видимых и найденных невидимых.
Основные действия
В карте сайта выбираем список "Папки". На базе этого списка осуществляется поиск со словарем, а именно, к каждому элементу видимой из интернета папочной структуры сайта, СайтСпутник присоединит имена (слова) из четырех пар словарей и определит физическое существование получаемых таким образом ссылок, папок и файлов.
В подменю "Золотого ключика" выбираем Невидимый интернет → Поиск со словарем → Найти папки и файлы, что приводит к инициированию поиска невидимых ссылок, папок и файлов с использованием словарей. Как отмечалось выше, невидимыми считаются физически существующие ссылки, папки или файлы, которые не содержатся в карте сайта.
Включение в карту сайта найденных невидимых ссылок целесообразно выполнить для того, чтобы они были задействованы в других базовых функциях поиска в невидимом интернете.
Заключительные замечания к поиску в невидимом интернете.
От пользователя не требуется никаких специальных знаний: языка HTML, языков запросов и других профессиональных навыков. При помощи мышки он выбирает базовые функции поиска в невидимом интернете и вводит имя исследуемого сайта, ресурса или папки. Остальную работу выполнит SiteSputnik Invisible.
Все рассмотренные базовые функции могут применяться в любой последовательности.
Включение найденных невидимых ссылок в карту сайта может быть произведено в любое время. Целесообразно это делать сразу по факту их нахождения.
Возможно, что повторное применение любой базовой функции после удачного применения другой базовой функции, приведет к нахождению новых невидимых ссылок.
Для больших сайтов целесообразно разбить поиск на более "мелкие" поиски по его составным частям, например, aa. *****/xx/yy/01. Для всего сайта можно построить карту только для того, чтобы увидеть эти составные части.
Включенные невидимые ссылки, папки и файлы в карте сайта выделяются зеленоватым фоном.
Список литературы.
Как искать научную информацию
(наверное первым темпом в начало лекции)
Основной результат научного труда — это информация, которая отражается в книгах, статьях и других публикациях. Каждое поколение ученых занято не только получением новых данных, но и проводит огромную работу по систематизации всей суммы ранее накопленных знаний. В настоящее время поток научной информации настолько возрос, что его называют информационным взрывом. По данным ЮНЕСКО, в начале XIX в. во всем мире выходило около 100 научных журналов. К 1850 г. их количество достигло 1000, к 1900 г. — превысило 10000, а в настоящее время — около 100000. Управлять этим потоком без определенных знаний невозможно.
Поиск информации часто трудоемок не только из-за обилия литературы, но и рассеянности данных, то есть опубликования статей определенной тематики в непрофильных источниках. Поэтому минимум библиотечно-библиографических знаний облегчит поиск информации и даст возможность значительно эффективнее работать с ее источниками. Рассмотрим основные источники научной информации.
Издающие организации
Наиболее крупные универсальные отечественные издательства.
Академиздатцентр «Наука» РАН. Осуществляет основную издательскую деятельность РАН. Старейшее отечественное научное издательство, которое в 2004 году отметит 280-летие, и крупнейшая издательская организация страны, одна из крупнейших в мире. Имеет филиалы в Новосибирске, Санкт-Петербурге и других городах.
Международная академическая издательская компания (МАИК) «Наука/Интернериодика». Создана в 1992 г. для издания научных журналов, с 1997 г. издает научно-популярную и учебную литературу. В 1992 году МАИК «Наука/Итерпериодика» начала свою деятельность с вьшуска 5 журналов на английском языке. К 2001 году их количество возросло до 95. Совместно с Академиздатцентром «Наука» издает более 100 журналов на русском языке.
«Высшая школа» — специализированное государственное издательство по выпуску учебной и методической литературы.
«Мир» выпускает переводную литературу по фундаментальным исследованиям в области естественных наук, а также учебную, справочную и научно-популярную.
«Научный мир» издает научную, научно-популярную, учебно-методическую литературу, в основном при поддержке РФФИ.
Издательство МГУ выпускает литературу практически по всем областям современной науки.
Издательство СПбГУ ежегодно издает более 200 наименований учебной, научной и научно-популярной литературы по всем разделам естественных наук.
Существует также много издательств, специализирующихся на выпуске литературы по отдельным отраслям («Недра», «Медицина», «Гидрометеоиздат» и др.). Кроме этого многие НИИ и ВУЗы имеют собственные издательские структуры.
С описанием изданий (журналы, монографии, энциклопедии и пр.) крупных зарубежных общенаучных издательств можно ознакомиться на их сайтах.
В большинстве случаев, к сожалению, доступ к полнотекстовым версиям изданий платный, а бесплатно можно получить лишь название статьи (книги), фамилии и адреса авторов и краткое резюме.
Но, благодаря Российскому фонду фундаментальных исследований, для всех академических институтов и многих ВУЗов эта проблема в значительной степени (но не полностью) решена. Создана Научная электронная библиотека: http://*****.
В ней сосредоточены полнотекстовые версии журналов многих зарубежных издательств (Elsevier, Springer Verlag, Academic Press и других). Библиотека охватывает период с годов и по настоящее время. Частично в ней представлены и отечественные издания. Электронная библиотека имеет очень удобный интерфейс. Для доступа к ресурсам от пользователя требуется зарегистрироваться (но только с IP-адреса организации, входящей в консорциум пользователей электронной библитеки) и запомнить свой логин и пароль. Для просмотра статей необходима программа AcrobatReader (распространяется свободно).
Электронные информационные ресурсы
В сети Интернет представлены огромные массивы информации. Важно не утонуть в этом море и найти именно то, что Вам необходимо. Используйте поисковые системы общего назначения:
Яндекс: русскоязычный Интернет — http://www. *****
Рамблер: русскоязычный Интернет — http://www. *****
Google: русско - и англоязычный Интернет — http://www.
Yahoo: англоязычный Интернет — http://www.
AltaVista: англоязычный Интернет — http://www.
Для поиска библиографической информации используйте поисковые системы специального назначения:
Scirus: поиск библиографии - http://www.
ISI: институт научной информации (библиография, цитирование) – http://wos. *****
He забывайте, что эффективность поиска зависит от того, насколько правильно был сформулирован запрос и набраны ключевые слова. Во всех поисковых системах существует так называемый «расширенный поиск» с разветвленной логикой запросов (операторы AND, OR, NOT). Лучше потратить время на составление и отладку запроса, чем просматривать сотни случайно отобранных страниц.
Поиск можно начать с этих мест в Интернете:
http://vm. cfsan. fda. gov//~frf/biologic. html/;
http://biodiversty. uno. edu/;
http://vlib. org/;
http://media. lib. kth. se/ejournal/.
Поиск можно производить на сайтах крупных органов НТИ и библиотек России, на которых бывает открыт полнотекстовый доступ к российским и зарубежным журналам.
Сбор фактического материала: работа с литературой, анализ основных идей и концепций
# 01, январь 2009
автор: .
Сбор фактического материала
РАБОТА С ЛИТЕРАТУРОЙ, АНАЛИЗ ОСНОВНЫХ ИДЕЙ И КОНЦЕПЦИЙ
Важным этапом исследовательского процесса является работа по сбору и систематизации фактического материала.
С чего следует начинать работу с литературой?
Приступая к научной работе, следует составить общее представление о системе хранения и использования научной информации. В отличие от простых студентов, исследователи вынуждены гораздо шире использовать информационные источники, недоступные ни в библиотеке их вуза, ни в книжных магазинах.
Например, для аспирантов работа с научной информацией обычно начинается с ознакомления с диссертациями. Один экземпляр всех защищенных в СССР и РФ диссертаций хранится в Российской государственной библиотеке 1 (в читальном зале в г. Химки). Там же имеются экземпляры авторефератов диссертаций, причем авторефераты попадают в РГБ на 3-12 месяцев раньше, чем сами диссертации (последние проходят утверждение в ВАК и только затем попадают в библиотеку, а авторефераты рассылаются за месяц до защиты диссертации). Электронный каталог диссертаций (начиная с 1995 г.) и авторефератов диссертаций (начиная с 1987 г.), хранящихся в РГБ, доступен в Internet. Поиск диссертаций, смежных по тематике, целесообразно начать именно с этого каталога.
Где находятся основные хранилища научной литературы?
Для централизованного сбора, обработки и хранения основных видов научной и технической документации в СССР в 50-х гг. была создана Государственная система научно-технической информации (ГСНТИ), которая функционирует до сих пор. Обработкой отечественной и зарубежной литературы по естествознанию и техническим наукам занимается ВИНИТИ (Всероссийский институт научной и технической информации), по общественным наукам – ИНИОН (Институт научной информации по общественным наукам при РАН). Одной из основных функций этих институтов является регулярный выпуск информационных изданий, содержащих не только оперативную информацию о последних публикациях, но и их аннотации. Существуют три основных вида информационных изданий: библиографические, реферативные и обзорные.
Библиографические пособия, как правило, имеют форму указателей, списков и обзоров литературы и содержат систематизированные сведения о печатных произведениях.
Реферативным журналом называется периодическое издание, публикующее рефераты научных работ и другие вторичные информационные материалы (библиографического описания, аннотации) во взаимосвязи со справочно-поисковыми средствами, включающими содержание (оглавление), рубрикацию (классификационную схему) издания и вспомогательные указатели. Установлено, что без помощи реферативных журналов специалист может ознакомиться не более чем с 6% опубликованных работ, а с их помощью – около 80%.
Обзорные издания ставят своей задачей обобщение уже опубликованной первичной информации.
Какую пользу может принести работа с научной литературы?
Работа с научной информацией полезна не только из-за найденных публикаций, но и благодаря знакомству со многими системами классификации, помогающими прояснить выбранное научное направление и смежные с ним. К таким системам относятся ГАСНТИ, УДК (универсальная десятичная классификация), ББК (библиотечно-библиографическая классификация), МКИ (международная классификация исследований) и многие другие. Владение системами классификации необходимо для оформления заявки на НИР, быстрого поиска необходимых публикаций, издания собственных учебных и методических работ.
Где еще можно искать научную информацию?
Помимо РГБ и ИНИОН и иных учреждений системы ГСТНИ, поиск научной информации проводится в ГПНТБ (Государственная публичная научно-техническая библиотека), Всероссийской книжной палате, институтах РАН, вузах, с помощью сайтов всемирных общественных организаций (ЮНЕСКО, МОТ) и т. д. В эпоху информационного взрыва нельзя ограничивать круг поиска, так как это может поставить под вопрос актуальность используемых в исследовании данных.
Как начинается подбор источников?
Подбор информационных источников можно начать уже при чтении первых публикаций, просматривая их библиографические перечни и выписывая из них наиболее интересные описания. После определения темы исследования нужно выделить несколько смежных с ней научных областей и изучать информацию в каждой области, не забывая об остальных. Например, при исследовании поведения компаний на рынке банковских услуг смежными научными областями могут быть: банковское дело, маркетинг, социология.
С самого начала исследователю полезно определить круг периодических изданий для постоянного отслеживания. Помимо деловых журналов, требуют внимания академические, такие как «Вопросы экономики», «Проблемы теории и практики управления» и международные, например, «Economic Modeling», «Marketing science», «Social Science». В международных журналах Вы сможете обнаружить весьма интересную информацию, перевод которой может быть затруднен используемой специфической лексикой. Это естественно, так как научные тексты значительно сложнее деловых и учебных – они попросту не рассчитаны на массового читателя.
Важным направлением поиска литературы являются информационные издания, доступные, в том числе, в ИНИОН. В начале исследования может сложиться мнение, что тема слишком мало изучена, так как, на первый взгляд, ей посвящено очень мало литературы. Работа с информационными изданиями поможет избавиться от стереотипа «непаханого поля», так как даже один день работы с информационными изданиями, скорее всего, даст возможность выявить несколько десятков источников, о которых Вы и не подозревали.
Очень полезно составить свой словарь терминов, выписав в него различные определения одних и тех же научных терминов, связанных с Вашим исследованием. Это позволит Вам сопоставлять различные точки зрения на тематику Вашего исследования, выявлять общее и частное мнение по данному вопросу и составлять на основании этого собственное мнение.
Следует запомнить:
С самого начала следует составить общее представление о системе хранения и использования научной информации.
Нельзя ограничивать круг поиска информации.
Следует обращать внимание на библиографические перечни в просматриваемых публикациях, а также не стоит забывать о смежных научных областях.
ПЕРВИЧНАЯ СИСТЕМАТИЗАЦИЯ ФАКТИЧЕСКОГО МАТЕРИАЛА
Какое место занимает сбор фактического материала в ходе исследования и как он осуществляется?
Сбор фактического материала является важнейшим этапом исследовательской работы. Перед тем как приступить непосредственно к выдвижению и проверке различных гипотез исследователь должен в достаточном количестве собрать первичную информацию об исследуемом объекте. На первых этапах может показаться, что единственный способ для этого – изучение литературы. На самом деле, опубликованные данные (полученные методами изучения литературы, изучения документов) не всегда дают достаточные или достоверные знания о действительности. Большое значение могут иметь факты, полученные исследователем в результате практической работы с предметом исследования. Правильно проведенные непосредственно на рынке или в организации наблюдения, мониторинг, сравнения, опросы также дают большие возможности для научных выводов, так как полученные данные зачастую содержат более полную информацию, и исследователю лучше известна их природа.
Чем интересен сбор первичной информации?
Процесс получения первичных, а не уже установленных фактов значительно более привлекателен, в нем исследователь выступает творцом, а не просто созерцателем чужих результатов, полученный материал постоянно создает стимулы к дальнейшей работе. Самые простейшие методы способны дать человеку значительно более глубокое понимание сути предмета его исследования, чем принято считать. Существует стереотип, что в современных условиях нужны современные, т. е. технократические, усложненные, подходы к познанию. Но классические методы исследования, как буквы алфавита, без которых невозможно ни простое, ни заумное слово, всегда будут необходимы и будут приносить такую же высокую отдачу, как и тысячелетия назад. Они помогут исследователю «увидеть за деревьями лес», не входя при этом в заблуждение. Как очень удачно отметил канадский физиолог Селье, «невозможно понять, на что похожа мышь, если каждую ее клетку в отдельности тщательно изучать под электронным микроскопом». Даже в самых подробных экономических показателях деятельности предприятия может быть замаскировано, например, отсутствие полноценного управленческого ресурса. Руководствуясь этими показателями, можно предсказать предприятию блестящее будущее, которое, на самом деле, вскоре превратится в печальное настоящее. Но такого прогноза не дал бы ни один специалист, нашедший способы ознакомиться с практикой делопроизводства на фирме, сложившейся там системой мотивации, управленческим стилем, проведя наблюдение за типичным рабочим днем сотрудников.
Оперируя чужими данными при исследовании мира, мы смотрим на него чужими глазами. Возникает цепочка: исследователи, не склонные к наблюдению, публикуют факты, необъективно отражающие действительность. На эти факты позже ссылаются другие авторы, еще сильнее нарушая объективность. Таким образом, участие в исследовательской работе, безусловно, начинается с приобретения навыка по-новому взглянуть на окружающий мир, увидеть в нем то, на что прежние исследователи не обращали внимания.
Какие еще могут быть источники фактического материала?
Еще одним весьма важным направлением подбора информации при научном исследовании является работа в Интернет. Скорость и удобство, с которыми в Сети можно найти информацию, являются колоссальными преимуществами такого способа поиска. Однако использовать полученную информацию следует крайне осторожно, ибо «обратной стороной медали» в Сети является проблема достоверности данных. Ясно, что у авторов постоянно обновляемых сайтов не хватает времени даже для элементарной коррекции размещаемых текстов (например, лента новостей агентства «Росбизнесконсалтинг», http://www. ***** порой содержит опечатки, искажающие смысл представляемых объявлений). А ведь факты, включаемые в результаты исследования, должны проходить научную редакцию. Поэтому использовать Интернет, несомненно, нужно, но, в основном, в качестве промежуточного звена или для доступа к уже опубликованной информации. Имеется, например, электронная версия журнала «Проблемы теории и практики управления», http://www. *****, но и там были замечены ошибки, например, один из номеров 1998 г. был представлен как вышедший в 1999 г. Тексты законов, приказов и положений, которые явно имеют твердые копии, также можно использовать. Если же предполагается прямое использование непроверенной информации с Web-сайта, целесообразно повысить достоверность данных за счет приведения ряда аналогичных показателей из других источников. Допустим, Вы собираете в Интернет данные о тарифной политике зарубежных банков. Не следует использовать обобщающие показатели, бесплатно демонстрируемые агентствами, обращайтесь на сайты нескольких банков каждой интересующей Вас страны, причем желательно в один день, и полученные данные отразите в таблице, сделав ссылки на адреса источников. От этого достоверность сведений значительно возрастет.
Следует запомнить:
Не следует пренебрегать сбором фактического материала об исследуемом объекте в результате практической работы.
Для сбора информации можно и нужно использовать возможности, предоставляемые Интернет, но при использовании полученной информации следует проявлять осторожность.
ПРИМЕНЕНИЕ ИНЫХ МЕТОДОВ СБОРА НАУЧНЫХ ФАКТОВ (АНАЛИЗ СТАТИСТИЧЕСКИХ ДАННЫХ, НОРМАТИВНЫХ ДОКУМЕНТОВ, ФИНАНСОВОЙ ОТЧЕТНОСТИ, ОПРОС, ИНТЕРВЬЮИРОВАНИЕ, НАБЛЮДЕНИЕ И ИЗМЕРЕНИЕ)
Как можно исследовать и анализировать статистические данные?
Большинство исследований статистических данных можно отнести к одному из двух типов: исследование корреляций и экспериментальные исследования.
При исследовании корреляций (зависимостей, связей) Вы не влияете (или, по крайней мере, пытаетесь не влиять) на переменные, а только измеряете их и хотите найти корреляции между некоторыми измеренными переменными.
При экспериментальных исследованиях Вы варьируете некоторые переменные и измеряете воздействия этих изменений на другие переменные. К сожалению, в экономике проведение подобных экспериментов не всегда возможно.
Анализ данных в экспериментальном исследовании также приходит к вычислению «корреляций» между переменными, а именно, между переменными, на которые воздействуют, и переменными, на которые влияет это воздействие. Тем не менее, экспериментальные данные потенциально снабжают нас более качественной информацией. Только экспериментально можно убедительно доказать причинную связь между переменными. Например, если обнаружено, что всякий раз, когда изменяется переменная A, изменяется и переменная B, то можно сделать вывод – «переменная A оказывает влияние на переменную B», т. е. между переменными А и В имеется причинная зависимость. Результаты корреляционного исследования могут быть проинтерпретированы в «причинных» терминах на основе некоторой теории, но сами по себе не могут отчетливо доказать причинность.
Зачем нужно изучать нормативные документы?
Нередко серьезные научные исследования бывают посвящены влиянию нормативно-правого режима на экономику. Например, влияние изменений в законодательстве об охране интеллектуальных прав собственности на создание новых фирм, специализирующихся на научно-исследовательской деятельности.
Для чего могут использоваться данные финансовой отчетности?
Содержащиеся в финансовой отчетности сведения (данные о производстве и сбыте товара, ассортименте поставки и отгрузки, об оптовом и розничном товарообороте, себестоимости и цене, инвестициях, затратах и прибылях, материально-технической базе и т. д.) могут помочь при составлении всесторонней экономической и финансовой характеристики производственного/торгового потенциала фирмы. Как правило, такого рода данные могут быть получены только с согласия руководства фирмы.
Как и для чего производятся опросы?
Опросы потребителей, предпринимателей, специалистов обычно производятся в форме интервьюирования или анкетирования.
Опросы считаются основным методом получения маркетинговой информации о потребителях, их поведении на рынке, мнениях и предпочтениях.
Какие бывают опросы?
Существуют различные виды опроса, которые применяются в зависимости от замысла и складывающихся условий (Рис. 1).
Рис.1. Виды опросов
Как правило, в маркетинге до 90% информации получается путем устного опроса, который носит название интервью.
Как происходят интервью?
Обычно используются два типа интервью:
1. Индивидуальное интервью, схема которого показана на Рис.2.
Рис.2. Схема индивидуального интервью
Встреча происходит: на улице, в магазине, на дому у респондента, на работе. Встреча может быть случайной (случайная выборка, в соответствии с законом больших чисел), заранее оговоренной/запланированной. Беседа может длиться от нескольких минут (кратковременное интервью) до нескольких часов (долговременное интервью). В любом случае, необходимо создать атмосферу доверия и благожелательности. Вариантом индивидуального интервью следует считать беседу/опрос по телефону.
2. Групповое интервью (Рис.3):
Для интервью приглашается не индивидуум, а целая группа (часто поступают так: договариваются об интервью с одним респондентом в его квартире, а он, в свою очередь, приглашает несколько соседей, 6 – 10 человек). Заранее подготавливается вопросник по одной из проблем. Иногда за участие в групповой беседе участникам выплачивают вознаграждение. Интервьюер направляет беседу. В ходе свободного и непринужденного обмена мнениями ведущий должен выявить истинные мнения и взгляды опрашиваемых.
Рис.3. Схема группового интервью
С какими трудностями может столкнуться интервьюер?
Интервьюер обязан терпеливо и доброжелательно выслушивать высказывания респондентов (особенно при групповом интервью), должен избегать критических замечаний, не может оказывать давление на опрашиваемых или дискутировать с ними.
Интервьюеру иногда приходится преодолевать нежелание или боязнь отвечать на вопросы. Приходится сочетать убеждение с разъяснением, что ответ на вопрос не грозит респонденту никакими неприятностями и что интервью – строго конфиденциально, его результаты соединяются с множеством других и только в обобщенной форме могут быть преданы гласности.
Метод устного опроса достаточно трудоемок. Количество опрошенных одним интервьюером – ограничено. Считается, что оптимальное время индивидуального интервью 10 – 30 минут. За это время интервьюер должен представиться, кратко объяснить цель опроса, убедить опрашиваемого, что он проводится для его же блага, задать вопросы, зафиксировать ответы и сделать уточняющие замечания. Групповое интервью может длиться несколько часов и требует сложной предварительной подготовки.
На что нужно обратить внимание при подготовке к интервьюированию?
Важно заранее позаботиться о технических средствах для фиксации своей беседы с опрашиваемым. Простейшим средством служит заранее подготовленный вопросник, где интервьюер отмечает тот или иной вариант ответа. При свободной беседе используется блокнот или аудио - и видеотехника. Последние особенно важны при различных типах групповых интервью. Запись может быть в дальнейшем изучена и интерпретирована.
Место проведения устных опросов определяется в зависимости от обстоятельств и, в частности, от принадлежности респондента к определенной социальной или профессиональной группе. С потребителями можно встречаться на улице, в торговом или выставочном зале. Место, которое часто выбирается зарубежными исследователями, – жилая квартира, в современных российских условиях вряд ли широко доступна интервьюеру. Интервью с предпринимателем или чиновником может происходить в офисе.
Какими бывают виды наблюдений?
Различаются несколько форм наблюдения:
Непосредственное (прямое) наблюдение – это обычно визуальное слежение за объектом наблюдения (например, подсчет времени, затрачиваемого на покупку). Оно может быть открытым, когда объект наблюдения знает, что за ним наблюдают, в частности, при опросах покупателей, и скрытым, когда изучаемый объект не ставится в известность о том, что за ним наблюдают. Например, проводится скрытое изучение умения продавцов общаться с покупателем.
Непрямое наблюдение заключается в изучении каких-либо материалов: статистических данных, печатных работ, документов и т. д.
Как обеспечивается надежность наблюдения?
Надежность наблюдения обеспечивается различными способами:
- контролем (часто выборочным) достоверности полученных данных (коэффициент надежности); использованием двух и более наблюдателей, регистрирующих одно и то же событие (коэффициент согласия); проведением повторного наблюдения объекта (коэффициент устойчивости).
В каком виде представляется информация, полученная в ходе наблюдения?
Информация, собранная в результате наблюдения, может быть представлена в следующем виде:
- текст, излагающий факты или описывающий какое-то явление/процесс; таблицы и матрицы, обобщающие и систематизирующие потоки информации, в т. ч. числовых данных; графики и диаграммы, геометрические формы отображения состояния и развития явлений, их размеров, динамики, структуры и взаимосвязей; статистические ряды (динамические и распределения), систематизирующие во времени и в пространстве числовые характеристики изучаемых явлений и процессов.
Какие требования предъявляются к собранной информации?
Собранную информацию необходимо систематизировать и структурировать таким образом, чтобы она была пригодна для дальнейшего анализа и обработки.
К собранной информации предъявляется ряд принципиальных требований, вытекающих из основополагающих принципов теории и практики исследования. Они представлены в следующей таблице:
ПРИНЦИПЫ
ОБЕСПЕЧЕНИЕ ИХ СОБЛЮДЕНИЯ
Актуальность Представление реальных сведений в нужный момент времени
Достоверность Адекватность сведений, обеспечиваемая соблюдением научных принципов сбора и обработки информации, борьбой с любой тенденциозностью
Релевантность2 Обеспечивается получением информации в соответствии с поставленными задачами
Полнота отображения Обеспечивается составлением плана исследования, выявлением сущности явления, его иерархической структуры и связей
Целенаправленность Соответствие информации генеральной цели исследования
Информационное единство Подчинение методологии обработки данных требованиям теории информатики и статистической теории наблюдений
Следует запомнить:
Результаты корреляционного исследования могут быть интерпретированы в «причинных» терминах на основе некоторой теории, но они не могут сами по себе отчетливо доказать причинность.
Опросы считаются основным методом получения маркетинговой информации о потребителях, их поведении на рынке, мнениях и предпочтениях.
При сборе фактического материала недопустима любая тенденциозность.
СБОР ИНФОРМАЦИИ НА НТМ (КОНФЕРЕНЦИИ, СЕМИНАРЫ И Т. Д.)
Важное направление поиска информации – научные и научно-практические конференции и семинары, которые могут быть также полезны для установления партнерских отношений с потенциальными коллегами по науке. Даже если конференции проходят в других городах, это само по себе не является непреодолимым препятствием. Вы можете попробовать связаться с представителями оргкомитета и попросить выслать Вам электронные версии рабочих документов конференции.
Свежую информацию о научных конференциях и семинарах Вы можете найти на сайтах: http://www. *****/, http://www. *****/, http://www. *****/, http://www. *****/. Следите также за анонсами на сайтах ведущих вузов.
АННОТИРОВАНИЕ И РЕФЕРИРОВАНИЕ
Что такое аннотирование?
Аннотированием называется процесс составления кратких сведений о печатном произведении (книге, статье, докладе и т. д.), позволяющих судить о целесообразности его более детального изучения. При аннотировании учитывается содержание произведения, его назначение, ценность и направленность.
Аннотация – краткая характеристика текста с точки зрения содержания, формы, читательского назначения и других особенностей, дополняющих библиографическое описание.
Какой должна быть аннотация?
Аннотация должна быть написана простым языком без использования ненужных и малопонятных терминов. Она должна в сжатой форме сообщать, о чем говорится в тексте и какую пользу от его прочтения можно получить, т. е. какие теоретические и/или практические знания дает это произведение и какие требования к читательским знаниям предъявляет.
Что может служить источником при составлении аннотации?
Основными источниками при подготовке аннотации являются:
титульный лист, содержащий выходные данные;
содержание (оглавление и сама описательная часть оригинала);
выводы;
предисловие;
послесловие;
примечания автора;
графики и таблицы в тексте.
Какими бывают аннотации?
По своему содержанию аннотации бывают следующих основных типов:
описательные;
реферативные;
критические;
рекомендательные;
методические;
педагогические и другие.
Наибольший интерес для нас представляют описательные аннотации.
В чем состоят особенности описательной аннотации?
Описательная аннотация – краткое описание содержания текста с помощью безличных конструкций в форме краткой справки или описания может быть составлена на любой вид печатного произведения. Обычный объем описательной аннотации 300-500 знаков, т. е. в среднем аннотация содержит
3-4 предложения на любую печатную статью вне зависимости от ее размера.
Текст описательной аннотации должен состоять из трех частей:
Вводная часть с выходными данными – название аннотируемого материала, фамилия автора, год издания, место издания, номер, объем (количество страниц, иллюстраций, таблиц).
Описательная часть – два-три основных положения, наиболее характерных для данной статьи. Они должны содержать в себе тематику (если она не раскрыта в названии), цель данной работы и область применения, а также способы, с помощью которых достигаются поставленные автором цели.
Заключительная часть, где содержатся отдельные особенности изложения материала, а иногда выводы.
Аннотация не имеет абзацев и начинается с существа вопроса или с вводных фраз, например: «Рассматриваются, исследуются, даются, показываются, содержатся и т. д.».
Например:
Управление по центрам ответственности. SWOT-анализ, Муравьёв Степан, 2004, http://www. *****/publ/fm/006.htm
Описываются функции центров финансовой ответственности: планирование, контроль, отчетность, мотивация. Рассматривается SWOT-анализ (анализ сильных и слабых сторон объекта, возможностей и угроз) применительно к использованию центров финансовой ответственности. Рекомендуется проведение данного анализа в рамках отдельно взятого предприятия для определения необходимости и полезности подобных финансовых структур.
Какова последовательность действий в процессе аннотирования?
При аннотировании можно рекомендовать использовать следующую последовательность действий:
Прочтите заголовок текста. Определите, дает ли он представление о содержании текста.
Просмотрите, делится ли статья на разделы (есть ли подзаголовки).
Если «да», прочтите подзаголовки.
Обратите внимание, есть ли рисунки, схемы, таблицы.
Если «да», прочтите подписи под ними.
Прочтите первый и последний абзацы текста и по ключевым словам определите, о чем текст.
Каких ошибок следует избегать?
Наиболее распространенные ошибки при составлении аннотаций:
Использование шаблонных словосочетаний и отдельных слов: «Автор рассматривает…», «В статье сообщается …».
Повторение темы заглавия печатного произведения без необходимых очнений.
Употребление сложных синтаксических конструкций, придаточных предложений, причастных и деепричастных оборотов.
Частное повторение родительного падежа.
Бесконтрольное употребление местоимений «этот, тот», которое мешает правильно понять смысл.
Что такое реферирование?
Реферирование – это одна из самых широко распространенных письменных форм извлечения информации, позволяющая при современном огромном потоке информации в кратчайший срок отобрать нужную специалисту информацию. По сравнению с аннотированием реферирование является более совершенным методом обработки источников информации: если в аннотации приводится лишь краткий перечень рассматриваемых вопросов, то в реферате излагается существо вопросов и приводятся важнейшие выводы.
Что такое реферат?
Реферат (от лат. referre – сообщать, докладывать) – это сокращенное содержание печатного произведения с основными фактическими данными и выводами. Реферат представляет собой объективное, лишенное эмоций сообщение информации первоисточника на основе ее смысловой переработки. Он акцентирует внимание на новых сведениях и определяет целесообразность обращения к первоисточнику.
Существует много видов рефератов, но наиболее интересным для нас является информативный реферат, т. е. конспективное изложение существенных положений оригинала.
Как составляется реферат?
Изложение содержания статьи в реферате ведется по степени важности отобранных сведений. Сначала в концентрированной форме излагается существо вопроса, далее кратко приводятся необходимые фактические данные. План составления реферата может не совпадать с планом статьи. Реферат – это единый, логически компактный сгусток основного содержания статьи, поэтому, как правило, не имеет разделов или рубрик.
Текст реферата начинается с изложения существа реферируемой статьи. Здесь следует избегать вводных фраз, например: «Автор статьи рассматривает…», «Целью настоящей работы было…» и т. п.
В реферат не включаются исторические справки, введения (если они не составляют основного содержания статьи), описание раннее опубликованных работ и общеизвестные положения.
Текст реферата составляется по определенному плану:
Тема, предмет (объект), характер и цель работы. Здесь нужно показать особенности темы, которые необходимы для раскрытия цели и содержания работы.
Метод проведения работы (если этот метод или методы – новые, то нужно дать их описание).
Конкретные результаты работы (теоретические или экспериментальные).
Выводы, рекомендации, оценка, предложения, описанные в первоисточнике.
Область применения.
Если в статье отсутствует какая-либо из перечисленных выше частей (например, в статье ничего не говорится о применении), то ее в реферате опускают, сохраняя последовательность изложения.
В конце реферата могут даваться примечания референта (при наличии в нем противоречий или ошибок), но интерпретация или критика первоисточника в самом реферате не допускается. Текст реферата заканчивается сведениями о количестве иллюстраций, таблиц, библиографии, за которыми идут ф. и.о. референта.
Какой объем должен быть у реферата?
Объем реферата не зависит от объема реферируемой статьи, а определяется ее содержанием, количеством сведений и их научной ценностью. Средний объем для журнальных статей – 1000 печатных знаков.
Какие требования предъявляются к языку и стилю реферата?
Основным отличием языка реферата от языка аннотации является то, что в аннотации основное содержание передается своими словами, которые представляют высокую степень абстрагирования и обобщения. В реферате же формулировки и обобщения заимствуются из самого текста оригинала.
К языку реферата предъявляются следующие основные требования:
Краткое, точное и объективное изложение материала.
Применение стандартной терминологии. Следует избегать непривычных терминов и символов и разъяснять их при первом упоминании в тексте.
Термины, применяемые в реферате более трех раз и смысл которых ясен из контекста, рекомендуется после первого употребления полностью заменить аббревиатурами (сокращениями) в виде начальных заглавных букв этих терминов. При первом упоминании такая аббревиатура дается в скобках непосредственно за термином, при последующем употреблении – без скобок. В одном реферате не рекомендуется применять более трех различных аббревиатур, например: «инвестиционный проект (ИП)».
Как правило, при написании реферата сложные предложения преобразуются в простые, широко используются неопределенно-личные предложения.
Формулы в реферате приводятся в следующих случаях:
без формул невозможно построение реферата;
формулы выражают итоги работы;
формулы существенно облегчают понимание работы.
Допускается включать в реферат иллюстрации и таблицы, если они помогают раскрытию основного содержания работы.
Какие этапы можно выделить при составлении реферата?
При составлении реферата следует придерживаться следующей последовательности этапов работы:
Просмотровое чтение с целью получения общего представления о тексте в целом.
Знакомство с графиками, рисунками, схемами, таблицами для уточнения сведений, полученных при первом чтении.
Выделение и нумерация абзацев, содержащих конкретную информацию по теме статьи, с подчеркиванием в них ключевых фрагментов.
Перегруппировка ключевых фрагментов в соответствии с их тематикой и планом написания реферата.
Составление логического плана статьи.
Вторичное изучающее чтение выделенных абзацев с сокращением малосущественной информации и обобщением оставшейся основной информации.
Редактирование полученной информации и написание ее в форме реферата.
Проверка правильности приведенных цифр, сокращений и т. д.
Чем отличается оформление аннотаций и рефератов на публикации иностранных авторов?
При оформлении аннотаций и рефератов на публикации иностранных авторов необходимо указывать название материала на русском и иностранном языках, фамилию автора – на иностранном языке, а также в круглых скобках язык, на котором написана статья.
Например:
Деловая среда и затруднительное проникновение новой фирмы на рынок: доказательство из международных данных, Business Environment and Firm Entry: Evidence from International Data, Leora Klapper, Luc Laeven и Raghuram Rajan, World Bank Policy Research Working Paper No.: 3232, March 3, 2004 (англ.)
Следует запомнить:
Аннотация содержит краткие сведения о произведении, позволяющие судить о целесообразности его более детального изучения.
В аннотации основное содержание передается своими словами, которые представляют высокую степень абстрагирования и обобщения.
Реферат представляет собой объективное, лишенное эмоций сообщение информации первоисточника на основе ее смысловой переработки. В нем обращается внимание на новые сведения и определяется целесообразность обращения к первоисточнику.
Формулировки и обобщения в реферате заимствуются из самого текста оригинала.
ТЕХНИКА ХРАНЕНИЯ И СИСТЕМАТИЗАЦИИ МАТЕРИАЛА
Как следует работать с собранными материалами?
Вся получаемая информация, в т. ч. описания и ссылки, нуждается в первичном учете. В первую очередь, нужно завести рабочую тетрадь, куда будут вписываться все возникающие по ходу работы идеи, тезисы, цитаты, конспекты, ссылки с указанием даты записи, источника (если есть) и краткого комментария.
Первичные материалы: ксерокопии, распечатки, вырезки, анкеты и т. д., необходимо хранить в отдельной папке. На каждом хранимом экземпляре делаются пометки: дата начала хранения, откуда получен, с какой целью можно использовать. Примерно раз в три месяца (по окончании квартала) рабочая тетрадь и папки с документами просматриваются, все лишнее удаляется, забытые идеи и ассоциации повторно обдумываются.
Что может помочь в дальнейшей работе с литературными источниками?
Очень полезным является создание картотеки всех изучаемых литературных источников. Ее можно вести в бумажной, электронной или смешанной форме. Бумажная картотека ведется на обычных библиотечных карточках из плотной бумаги или картона, на лицевой стороне указывается источник так же, как в библиографическом перечне, и коды УДК и ББК, если они доступны. На обратной стороне карточки указывается: где хранится источник, что именно в нем интересного для исследования, на каких страницах содержатся важные тезисы или факты. Желательно делать ссылки между картотекой и рабочей тетрадью.
Электронная версия картотеки может быть заведена прямо в компьютерном файле будущей исследовательской работы в табличной форме. Одна из колонок содержит описание источников, которые удобно будет копировать при наборе рукописей предстоящих публикаций и включать в отчеты о проделанной работе. Остальные колонки содержат то же, что содержала бы обратная сторона карточки. Рекомендации по ведению картотеки может дать также научный руководитель проекта.
О работе с литературными источниками и об их систематизации Вы можете дополнительно прочитать в предыдущей статье.
Какова должна быть примерная структура библиографического перечня исследовательской работы?
Конечно, оценки можно дать лишь очень приблизительные, четких требований нет. С одной стороны, большое количество литературных источников будет свидетельствовать о глубоком изучении материалов, имеющихся по тематике работы. С другой стороны, не следует расширять список за счет работ, на которые нет ссылок в тексте работы.
Использование литературы на иностранных языках считается правилом хорошего тона. Игнорирование подобных источников говорит либо о слабой подготовке исследователя, либо о нежелании глубоко проработать тему. С другой стороны, отсутствие в библиографическом перечне отечественных изданий говорит примерно о том же. Считается, что приемлемая доля иностранных источников в библиографическом перечне – от 10 до 60%.
Одна из основных компонент библиографического перечня диссертации – статьи, опубликованные в научных журналах, бюллетенях и сборниках научных трудов, а также материалы научных конференций и съездов. Примерная доля таких источников в библиографическом перечне – 35 – 50%.
Доля описаний диссертаций и авторефератов может составлять до 10 %; ненаучных изданий, в том числе, текстов законов, положений и иной нормативной документации, а также статистических и информационных изданий – до 15%.
Примерно каждое третье описание в перечне посвящено монографиям и другим научным изданиям, доля учебной и методической литературы обычно не превышает 20%.
Допустимо цитирование деловых журналов, но информацию из газетных статей следует использовать крайне осторожно, обязательно оговаривая каждый случай с научным руководителем.
Не следует включать в перечень энциклопедии, справочники, научно-популярные издания. Если при формировании терминологии используются статьи из справочников, ссылки приводятся в тексте.
Как следует оформлять ссылки на источники?
Оформление литературных ссылок осуществляется в соответствии с требованиями ГОСТа 7.1.84. Примеры библиографических описаний литературных источников в соответствии с требованиями этого ГОСТа Вы можете посмотреть по адресу: http://*****/Documents//BCE6.asp.
Однако, в этом ГОСТе нет сведений о том, как сделать ссылку на электронный адрес, поэтому лучше создать отдельное приложение и включить в него все электронные ссылки. Можно также привести ссылку в тексте работы, в сноске. Источники, указанные в библиографическом перечне, должны быть доступны для проверки достоверности данных.
Какие еще есть рекомендации по сбору информации?
Очень важно выдержать и сохранить нужный ритм работы именно на первых этапах исследования. Из-за слишком интенсивного изучения информации начинающие исследователи часто переутомляются (порой даже испытывают депрессию) и потом надолго, если не навсегда, откладывают работу. С самого начала необходимо стимулировать постепенное нарастание интереса к проблеме и, одновременно, приобретение новых навыков работы с научной литературой, умения быстро выделить нужные факты. Каждый источник нужно начинать читать только после того, как изучено его содержание, аннотация, бегло просмотрено содержание. Найденную литературу желательно выстроить в определенной последовательности, составить примерный график изучения и стараться его придерживаться.
С некоторыми рекомендациями по написанию литературного обзора (поиск и систематизация первоисточников) Вы можете ознакомиться также на сайте: http://www. *****/library/31/124.htm.
Следует запомнить:
Вся получаемая информация нуждается в первичном учете.
Следует создать картотеку всех изучаемых литературных источников.
Оформление литературных ссылок осуществляется в соответствии с требованиями ГОСТа.
Нужно выдерживать и сохранять ритм работы особенно на первых этапах исследования.
1 Бывшая Государственная библиотека СССР им. . http://www. *****
2 От англ. relevant – уместный, относящийся к делу


