Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

В 2007 г. 54 муниципальные библиотеки имели доступ к ресурсам интернет (2006 г. – 41 библиотека). Динамика роста показателей подключения библиотек округа к сети стабильна на протяжение последних лет. И не смотря на это, ни одна библиотека Березовского района и г. Пыть-Яха не имеет доступа к интернет. Пересмотр штатных расписаний библиотек округа в сторону увеличения специалистов в области IT-технологий, достойный уровень заработной платы работников библиотек, проведение обучающих мероприятий, семинаров, круглых столов позволит сформировать новый образ мышления, менталитет библиотекарей, занять библиотекам Югры достойное место в формировании национального ЭР.

Электронные библиотеки и полнотекстовые БД в интернет

Вадим Константинович Степанов,

доцент кафедры библиотековедения

и информатики АПРИКТа,

профессор МГУКИ, к. п.н.

С точки зрения профессиональной информационной деятельности, одной из главных и наиболее ценных составляющих всего совокупного потенциала интернет являются электронные библиотеки (ЭБ). Само словосочетание «электронная библиотека» относительно новое и еще не имеет общепринятого научного толкования. Под ЭБ (цифровыми, виртуальными) разные исследователи понимают различное содержание: начиная с простого перечня файлов на любом компьютере и заканчивая всем содержательным наполнением интернет. На наш взгляд, ЭБ можно определить как упорядоченные коллекции разнородных электронных документов (ЭД), снабженные средствами навигации и поиска. Подобное толкование позволяет выделить столь важную отличительную черту ЭБ как обязательное наличие заданной структуры и навигационно-поисковых средств, обеспечивающих ориентирование в документах. Это дает возможность исключить из понятия «электронная библиотека» беспорядочные файловые массивы, не объединенные единой иерархической структурой и системой индексации. Термин «разнородные» позволяет отделить ЭБ от архивов периодических изданий, в которых представлены выпуски лишь одного издания. В таком понимании мы и будем рассматривать в дальнейшем данное словосочетание.

НЕ нашли? Не то? Что вы ищете?

Начало созданию ЭБ было положено в 1960-е годы в Соединенных Штатах Америки (США). Собрания разнообразных ЭД формировались в военных, академических и образовательных организациях, а также крупнейших промышленных корпорациях под конкретные задачи. Ситуация периода 1950–1970-х гг. характеризуется весьма распространенным в то время термином – «информационный взрыв». Суть этого явления заключалась в достижении предельного порога, ограничивающего возможности освоения информационного массива потенциальным потребителем информации. Иными словами, количество изданий, посвященных определенной отрасли знания, стало настолько велико, что превзошло физические возможности отдельного человека в освоении всего объема новых данных даже в пределах сравнительно узких отраслей знания. Неудивительно, что этот период характеризовался господством взглядов, согласно которым легче и дешевле повторить исследование, нежели найти результаты уже проведенных аналогичных разработок.

В такой ситуации именно формирование ЭБ позволило укротить казавшийся безудержным вал информации и заставило по-новому взглянуть на возможности хранения и поиска данных. Сказалось главное преимущество цифровых документов – разыскания в них могли вестись не только по сведениям титульного листа, но и по всему тексту. Эта особенность кардинально расширяла возможности информационного поиска: гигантские массивы документов, представленные в виде компьютерных файлов, могли быть просмотрены за считанные минуты с выделением релевантных источников из многих тысяч изданий. Образно говоря, нескончаемые ряды книжных стеллажей с пыльными фолиантами, пугающими своими объемами, стали «прозрачны» для читателей – появилась возможность быстро просматривать все их содержание под любым ракурсом, в любом аспекте, вычленяя необходимое и отсеивая ненужное.

Первоначальные характеристики электронных изданий (ЭИ) были более чем скромны. Простейшие текстовые ASCII-файлы не допускали даже таких примитивных полиграфических изысков, как курсив и выравнивание заголовков по центру. Однако по мере совершенствования технологий в 1990-е гг. электронные тексты стали обогащаться иллюстрациями, графиками и таблицами, обретая вид близкий, а порой и полностью идентичный своим бумажным аналогам.

Гигантский импульс развитию ЭБ был придан началом эры глобальных компьютерных сетей. Интернет в неизмеримое количество раз увеличил аудиторию потенциальных посетителей ЭБ, которыми стали фактически все пользователи Сети. Доступность расположенных в глобальных сетях документов для огромной аудитории повсеместно побудило целые корпорации и отдельных граждан серьезно заняться формированием цифровых собраний, количество которых исчисляется ныне десятками тысяч и продолжает стремительно увеличиваться.

С точки зрения возможностей применения в информационной деятельности, сетевые ЭБ логично разделить на две основные категории: бесплатные электронные коллекции текстов и коммерческие полнотекстовые БД.

Электронные коллекции текстов

Бесплатные ЭБ формируются, как правило, отдельными энтузиастами или сообществами, заинтересованными в продвижении собственных взглядов или рассматривающими сам процесс формирования коллекций в качестве своеобразного хобби. Еще одной разновидностью существования бесплатных электронных собраний является их организация и поддержка в качестве рекламной площадки. В последнем случае информационное наполнение служит своеобразной приманкой и в большинстве случаев не отличается высоким качеством.

Неформальной датой рождения открытых ЭБ считается 1971 г., отмеченный возникновением «Проекта Гуттенберг» (Project Gutenberg). В этом году сотруднику иллинойского университета Майклу Харту (Michael Hart) было поручено найти наиболее достойное применение машинному времени на мэйнфрейме Xerox Sigma 5. Стоимость предоставленного машинного времени в денежном эквиваленте составляла сумму равную 100.000.000 долларов. После некоторых размышлений Харт пришел к выводу, что наиболее эффективным применением машинного времени будет не проведение математических расчетов, а ввод, хранение и поиск обычных печатных источников в виде текстовых файлов. Самостоятельно и с помощью своих друзей он вручную ввел в компьютер наиболее важные, по его мнению, источники, к коим относились «Декларация Независимости», Конституция США, текст Библии и ряд других работ, заслуживающих, по его мнению, отнесения к разряду вечных ценностей.

В дальнейшем проект поступательно расширялся и сейчас включает несколько тысяч произведений, среди которых известнейшие художественные произведения, научные трактаты и публицистические произведения. Изначально в библиотеку включались произведения на английском языке, однако, по мере приобретения международной известности в этом цифровом своде, появились труды практически на всех европейских языках, включая русский. Отбор в библиотеку весьма строг – в ее фонд включаются лишь произведения, составляющие сокровищницу человеческой цивилизации. В настоящее время адрес официального сайта «Проекта Гуттенберг» – www. gutenberg. org.

Примеру Харта последовало множество отдельных энтузиастов и целых организаций, и ныне большие и малые бесплатные ЭБ составляют неотъемлемую часть ресурсов Сети. Владельцы подобных электронных собраний преследуют разные цели, но все эти библиотеки имеют характерные черты, позволяющие рассматривать их как единое явление.

Методы комплектования открытых ЭБ чрезвычайно просты. Тексты поступают в библиотеку одним из следующих путей:

·  копируются с других сайтов;

·  присылаются добровольными дарителями;

·  производится их специальное сканирование и распознавание;

·  тексты получаются непосредственно из издательства или от авторов.

Все эти способы используются в комплексе в зависимости от изначально поставленных задач. Например, в случае формирования фонда электронных документов заданной тематики, основным источником поступлений является собственноручное сканирование и распознавание текстов, существующих в печатной форме. Таковы, например, «Военная литература» (militera. *****) или Библиотека ImWerden (imwerden. de). В ситуации, когда область отбираемых произведений ничем не ограничена главным методом комплектования, на начальном этапе выступает копирование текстов с других сайтов. При благоприятном развитии проекта, возрастании его известности и авторитета, главным источником пополнения фонда становятся тексты, присланные дарителями. Среди жертвователей преобладают лица, страстно увлекающиеся произведениями определенного автора или направления. Увлечение это, среди прочего, выражается в сканировании и распознавании максимально большого количества любимых произведений. Однако размещение готовых текстов на личном сервере не гарантирует ознакомления с ним большого числа посетителей и наоборот включение в уже существующее электронное собрание с хорошей посещаемостью обеспечивает произведению широкую известность. По этой причине поклонники самых различных авторов, направлений и жанров стремятся дополнить ЭБ собственноручно созданными электронными текстами. Именно таким образом формировалась и продолжает формироваться Библиотека Максима Мошкова (www. *****), являющаяся на сегодня крупнейшей бесплатной ЭБ российского сегмента интернет. В ее составе представлены произведения самого различного художественного и научного уровня, отражающие средний вкус пользователей российской части Всемирной паутины.

Получение текстов непосредственно из издательств – явление крайне редкое в практике комплектования бесплатных электронных библиотек. Передача оригинал-макета выходящего издания для размещения в электронном собрании чревата для издателя сокращением числа потенциальных покупателей печатных экземпляров. Исключение составляют авторитетные электронные собрания, имеющие ярко выраженную просветительскую направленность. Ярким примером является Сетевая образовательная библиотека «Vivos Voco!» (vivovoco. *****), в которой регулярно размещаются статьи из свежих номеров авторитетных российских периодических изданий.

В ряде случаев тексты произведений поступают в бесплатные ЭБ непосредственно от авторов. Это относится лишь к наиболее авторитетным собраниям, включение в которые может способствовать повышению популярности писателя.

Качество текста большинства источников, размещаемых в бесплатных ЭБ, весьма невысоко. С самого начала существования электронных коллекций текст в них был представлен в виде простейших ASCII-файлов. Файлы в формате TXT, как известно, не содержат таких излишеств форматирования, как выделение фрагментов курсивом, жирным шрифтом или подчеркиванием. Естественно, в txt-документах отсутствуют и все другие элементы в виде таблиц, графиков или иллюстраций, которые в значительной мере обогащают содержание произведения. Любое повышение качества текста, например, простейшая его разметка с применением HTML, связано с возрастанием стоимости производства документа, что чаще всего неприемлемо для проектов, положивших в основу своей деятельности бесплатность. Поэтому большинство ЭБ, включая «Проект Гутенберг» и Библиотеку Мошкова, до сего времени принимают тексты в виде простейших ASCII-файлов. Исключения делаются лишь для изданий, которые не могут быть представлены в виде обычного текста, например, для изданий Библии на церковно-славянском языке.

Не менее важной проблемой является идентичность текста оригиналу, в качестве которого в большинстве случаев выступает традиционное печатное издание. В процессе распознавания сканированного текста или ручного ввода неминуемо возникает большое количество ошибок, которые невозможно исправить с помощью автоматизированной проверки текста. Программы проверки грамотности не в состоянии вычленить и исправить неправильно распознанные слова со схожим написанием. В результате в тексте вполне возможно появление «нанялся» вместо «занялся», «гноить» вместо «строить», «запятая» вместо «занятая» и подобные им ошибки. Помимо изменения слов, насчитывается огромное количество более мелких ошибок как, например, употребление двоеточия вместо точки с запятой. От этого не свободны даже стремящиеся к максимальной академичности открытые цифровые собрания. Таким образом, надо быть готовыми к тому, что канонические, выверенные редакторами и корректорами тексты, в бесплатных ЭБ обнаружить крайне сложно.

Сервисные функции ЭБ включают возможность поиска текста и его сохранения. Ныне в большинстве цифровых собраний реализованы иерархические меню, отдаленно напоминающие рубрики библиотечных классификаций. С их помощью осуществляется примитивная навигация в ресурсах. В большинстве случаев имеется и простейший поисковый механизм, позволяющий вести разыскание по ключевым словам в пределах всего собрания. Для этого весь массив электронной библиотеки предварительно индексируется.

Таким образом, для бесплатных ЭБ зачастую характерны неполнота и случайность представленных изданий, невысокая эффективность системы навигации и поиска, грамматические ошибки в текстах. Цифровые собрания в большинстве своем подготовлены их создателями в свободное от основной деятельности время, чем и объясняются указанные недостатки. Однако любые негативные моменты компенсируются двумя главными достоинствами цифровых библиотек – их колоссальными объемами и бесплатностью пользования. Эти факторы обеспечивают открытым электронным коллекциям текстов широкую популярность у пользователей Сети во всем мире. В них можно найти все что угодно – от детских сказок до армейских уставов, от классических философских трактатов до лирических произведений современных начинающих авторов и кулинарных рецептов.

В настоящее время в Сети представлено огромное количество бесплатных ЭБ. Их пространный перечень содержится в разделе «Электронные библиотеки» справочника «Апорт» (catalog. *****/rus/themes. asp? id=2107&r=0). Среди наиболее крупных и авторитетных собраний можно отметить Библиотеку Максима Мошкова (www. *****), включающую многие десятки тысяч самых разнообразных произведений от серьезных романов до детективов, технической документации и работ литературных дилетантов. Широкую известность имеют ЭБ, размещенные на сайтах с характерными доменными именами: «Классика. ру» (www. *****), «Проза. ру» (www. *****), «*****» (www. *****). Внушительные подборки профильной литературы можно найти на сайтах «Военная литература» (militera. *****), Библиотека православного христианина (www. *****/biblio), Библиотека древнерусской литературы (old-rus. *****). Особое место занимают проекты «Vivos Voco!» – «Зову живых!» (vivovoco. *****), Библиотека CEPAHH (www. *****), ЭБ ImWerden (imwerden. de), содержащие избранные произведения, обладающие, по мнению их создателей, значительной научной или художественной ценностью. Некоторые ЭБ как, например, Библиотека OCR «Альдебаран» (lib. *****), содержат тексты для воспроизведения на КПК и других мобильных устройствах.

Среди зарубежных бесплатных ЭБ выделяются «Проект Гутенберг» (www. gutenberg. org) и Публичная интернет-библиотека – Internet Public Library (www. ipl. org). «Проект Гутенберг», содержащий лучшие произведения человеческого разума, формируется на добровольных началах и путем добровольных же пожертвований текстов. IPL является проектом, который целенаправленно поддерживается ведущими библиотечно-информационными школами США – вначале Школой информатики Мичиганского университета, а ныне Колледжем информатики и технологий университета Дрексель. За счет этого Публичную интернет-библиотеку отличает высокий качественный уровень. В ней отражены бесплатные англоязычные издания, расположенные на серверах по всему миру. Реализована возможность многоаспектного поиска: в иерархии отраслей знания в строгом соответствии с Десятичной Классификацией Дьюи или непосредственно по автору, заглавию или индексу DDC.

В настоящее время традиционные библиотеки не играют значимой роли в формировании в Сети открытых цифровых коллекций. Профессиональные библиотекари пока лишь примериваются к новым реалиям, формируя пробные электронные собрания. И за рубежом, и в России оцифровке и размещению в Интернет подвергаются небольшие фрагменты фондов, как правило, уникальные коллекции конкретной библиотеки. Так, например, Национальная библиотека Новой Зеландии разместила в Сети коллекцию местных газет XIX–начала XX вв. (paperspast. natlib. govt. nz), Библиотека Калифорнийского университета – свод статистических данных штата Калифорния (countingcalifornia. cdlib. org), Библиотека университета Чикаго – нотную коллекцию ранних редакций сочинений Шопена (chopin. lib. uchicago. edu). В России в числе опытных цифровых собраний представлены Краеведческая электронная библиотека, созданная Челябинской ОУНБ (unilib. chel. su:6005/wns/elektronbiblioteka. htm), Коллекция Югра (www. *****/collection/ugra. htm) ЦГБ г. Сургута, ЭБ «Труды ученых ИГУ», сформированная научной библиотекой Иркутского государственного университета (ellib. library. *****).

Правовые вопросы создания сетевых библиотек

При создании открытых электронных коллекций ключевое значение приобретают вопросы соблюдения прав использования интеллектуальной собственности. Технически поместить текст в Сеть совсем несложно, однако размещение в Интернет любых произведений равнозначно публикации работ, многие из которых находятся в чьей-то собственности.

В отношении соблюдения соответствующих законов российская и зарубежная практики разительно отличаются. В этой разнице наглядно проявляется неодинаковая степень уважения к закону в большинстве стран западной цивилизации и в России. Составители зарубежных коллекций электронных текстов практически никогда не вступают в конфликт с законом, тщательно следя за тем, чтобы в состав их собраний включались исключительно произведения, на которые срок действия имущественного права уже истек. Создатели же российских открытых ЭБ до недавнего времени совершенно не заботились о соблюдении интересов правообладателей: в отечественных цифровых собраниях находили и продолжают широко находить отражение большинство литературных новинок, прежде всего в сфере художественной литературы, в том числе и переводные издания. Свою лояльность к закону создатели бесплатных цифровых собраний обычно декларировали обязательством убирать тексты из доступа по первому требованию законных правообладателей.

Ситуация в России начала меняться с весны 2004 г. В этот период компания КМ-онлайн, формирующая собственную ЭБ в составе платного ресурса VIP. KM, инициировала судебные иски против создателя самой обширной ЭБ Максима Машкова и владельцев сетевых библиотек на портале «ВСЕВОБУЧ» (www. *****) и «Альдебаран» (www. *****). Суть исков сводилась к требованию убрать из доступа произведения, размещенные там без ведома и согласия правообладателей и выплатить денежную компенсацию за контрафактное использование объектов интеллектуальной собственности. Первый судебный процесс писателя Эдуарда Геворкяна против портала ВСЕВОБУЧ был без труда выигран юристами специально созданного некоммерческого партнерства НОЦИТ 29 сентября 2004 г., в результате чего в России был создан первый серьезный прецедент по защите имущественных прав на электронные тексты, расположенные в интернет. Дальнейшие процессы, которые со временем превратились в повседневную составляющую быта создателей текстовых интернет-собраний, также продемонстрировали юридическую уязвимость сетевых библиотек, выразившуюся в выплате ими штрафов законным правообладателям или, как минимум, удалением спорных произведений из доступа.

Судопроизводство по указанным искам по времени совпало со вступлением в силу 8 августа 2004 г. Федерального закона РФ «О внесении изменений в Закон РФ «Об авторском праве и смежных правах»» (www. *****/avp/law/5351-1SN. HTM). С этого времени Закон РФ «Об авторском праве и смежных правах» включает специальные разделы, непосредственно относящиеся к объектам авторского права, представленным в цифровой форме. В частности, указывается, что «экземпляры произведений, выраженные в цифровой форме, в том числе экземпляры произведений, предоставляемые в порядке взаимного использования библиотечных ресурсов, могут предоставляться во временное безвозмездное пользование только в помещениях библиотек при условии исключения возможности создать копии этих произведений в цифровой форме».

Помимо специальной регламентации порядка использования объектов интеллектуальной собственности в цифровой форме, новой редакцией закона до 70-ти лет со дня смерти автора был увеличен срок действия имущественного права на авторские произведения. На произведения, выполненные по служебному заданию, включая сборники трудов, энциклопедические и периодические издания, срок действия увеличился, соответственно, до 70-ти лет со дня опубликования произведения. В этот период любое публичное использование объектов интеллектуальной собственности должно быть согласовано с владельцами прав на его использование. Лишь по истечении 70 лет любой объект интеллектуальной собственности автоматически переходит в общественное достояние и может быть распространяем кем и как угодно, в том числе и через интернет.

В 2008 г. Закон РФ «Об авторском праве и смежных правах» утрачивает силу, а его положения входят в раздел 7, главу 4 Гражданского кодекса РФ «Права на результаты интеллектуальной деятельности и средства индивидуализации». Это само по себе свидетельствует о постепенном приближении российского законодательства в части соблюдения авторских прав на интеллектуальную собственность в цифровом виде к международным стандартам.

Совершенно очевидно, что пора «дикого» наполнения ЭБ постепенно уходит в прошлое. Основная причина этого лежит в повышении значения, в том числе и стоимостного, источников информации, находящихся в Сети. Менее чем за десятилетие они прошли путь от экзотических артефактов до ресурсов первостепенной важности, без использования которых сегодня уже сложно представить бизнес, науку, образование или досуг. Стремительный рост числа пользователей Интернет прямо соответствует росту потенциального рынка для розничных продаж или организации подписки на пользование произведениями печати в электронной форме. И, несомненно, в интернет будет появляться все больше компаний, стремящихся наладить торговлю литературой на законных основаниях, т. е. предварительно урегулировав все вопросы с правообладателями. Естественно, что такие компании будут пристально следить за тем, чтобы приобретенные ими произведения параллельно не распространялись бесплатно.

Именно поэтому в перспективе из открытых сетевых библиотек будут постепенно, но все более настойчиво исключаться источники, размещенные в них в нарушение закона. Фонды бесплатных ЭБ будут составлять произведения, находящиеся в общественном достоянии. Таким образом, классические труды прошлого, прошедшие самую надежную проверку временем, будут постоянно находиться в распоряжении всех пользователей Всемирной паутины.

Коммерческие полнотекстовые БД

Сформированная интернет цифровая «вселенная», обеспечивающая мгновенный доступ к ресурсам из любой точки планеты, явилась благоприятной средой для развития многообразных форм электронного бизнеса. Одними из первых оценили преимущества интернет компании, специализирующиеся на производстве и продаже различного рода БД. Созданием электронных, в том числе и онлайновых, баз еще с начала 1970-х гг. прошлого века занимались несколько зарубежных корпораций. Существовали фактографические БД, содержащие фактические сведения (прежде всего, биржевые котировки и статистику), библиографические (сведения о документах) и полнотекстовые (полные тексты книг и статей из газет, журналов и сборников). В числе наиболее известных поставщиков доступа к БД в «доинтернетовский» период значились Dialog, LEXIS/NEXIS, EBSCO Information Services, STN International, H. W.Wilson, UMI. Информационные продукты доставлялись пользователям посредством модемной связи, на магнитных лентах, а со второй половины 1980-х гг. и на CD.

С распространением интернет информационный бизнес приобрел невиданный до того времени размах. К уже существовавшим гигантам информационной индустрии добавились сотни молодых компаний, стремящихся предложить постоянно увеличивающейся армии пользователей Сети все новые и новые информационные продукты. Для поставщиков информационных продуктов Сеть явилась идеальной средой ведения бизнеса: информационные корпорации обрели возможность вести круглосуточное обслуживание клиентов вне зависимости от их местонахождения, а потенциальный рынок одномоментно расширился до пределов всего земного шара. При этом появилась возможность оказывать информационные услуги клиентам напрямую, обходясь в целом ряде случаев без привлечения посредников, в роли которых прежде выступали библиотеки.

Из всего перечня размещенных в Сети коммерческих информационных продуктов для профессиональной информационной деятельности наибольший интерес представляют полнотекстовые БД. В них содержатся тексты книг, статей из журналов, газет и сборников, сообщения информационных агентств, транскрипты теле - и радиопередач, аналитические отчеты различных учреждений и другие документы. Количество и отраслевой спектр коммерческих полнотекстовых электронных собраний постоянно расширяется. Если на заре этого вида бизнеса на рубеже гг. их создание начиналось с правовой и экономической областей, в гг. распространилось на естественнонаучные, точные и наиболее динамично развивающиеся гуманитарные дисциплины, то в настоящее время очередь дошла до коллекций редких и старопечатных книг, полных собраний сочинений античных и средневековых авторов, поэтических антологий, краеведческих коллекций и тому подобных материалов.

Формирование цифровых коммерческих полнотекстовых БД – сложный организационно-технологический процесс. Центральное место в нем занимают компании-агрегаторы. Термин «агрегация» в самом общем понимании обозначает суммирование некоторых отдельных разрозненных частей в единое целое. Применительно к цифровым собраниям агрегация заключается в приобретении и интегрировании в единую программную среду информационных источников, полученных от различных производителей. В своем большинстве компании-агрегаторы образуются как самостоятельные бизнес-проекты, однако иногда они возникают и в качестве дочерних подразделений крупных издательств и информационных агентств, которые в соответствии с веяниями времени стремятся расширить свой традиционный бизнес за счет использования преимуществ цифровых технологий.

На практике фазы формирования полнотекстовых БД выглядят примерно следующим образом. Компания-агрегатор обращается к производителям или держателям информационных массивов с предложением совместной деятельности. В роли последних выступают издательства, новостные информационные агентства или крупные библиотеки, располагающие собственными уникальными документальными коллекциями. Суть предложения сводится к организации для имеющихся у создателей ИР альтернативного канала сбыта. Книги, журналы, газеты, новостные ленты, фотоархивы, аналитические отчеты, коллекции рукописей и другие виды документов, наряду со своим печатным бытием, начинают параллельную жизнь. У всех них появляются цифровые аналоги, порой представляющие их точные копии, к которым начинает предоставляться доступ через Всемирную компьютерную сеть.

Как правило, владельцы информационных массивов с интересом воспринимают предложения агрегаторов. Организация продажи доступа к цифровым копиям выпускаемой ими продукции или хранящимся в их фондах коллекций требует значительных интеллектуальных, организационных и финансовых затрат, которые агрегаторы полностью берут на себя. Прямые затраты владельцев контента (информационного наполнения) минимальны, а обязанности ограничиваются, как правило, своевременной передачей компании-агрегатору цифровых копий выходящих в свет бумажных изданий. В случаях, когда речь идет о сканировании большого объема документов, не имеющих электронного аналога (например, коллекция из фондов библиотеки), сканирование осуществляется за счет средств и на оборудовании агрегатора. Таким образом, при минимальных затратах, создателям или владельцам контентного наполнения удается получить от своей деятельности дополнительную прибыль. Соглашение между производителем информации и компанией-агрегатором закрепляется договором, в котором детально оговаривается технология передачи информационного массива от владельца компании, юридические аспекты использования цифровых копий и, естественно, система взаиморасчетов.

Получение информационного массива – лишь первый этап формирования полнотекстовых БД. Главным условием их создания является наличие мощного программного обеспечения, с помощью которого осуществляются все операции с документами базы. Создание такого программного инструмента – одна из главных задач агрегаторов. Такая программа должна оперативно обеспечивать текущий импорт многих тысяч документов, их индексирование, поиск по запросам пользователей, выдачу результатов и множество других сервисных функций. Каждый агрегатор разрабатывает и постоянно совершенствует собственный программный продукт, который обладает специфическими качествами, отличающими возможности одной полнотекстовой БД от другой.

Полученные от различных владельцев документальные массивы загружаются в единую программную оболочку агрегатора. При этом осуществляется их унификация – для пользователей документы от различных производителей предстают в единообразном виде, а процессы поиска и сохранения результатов осуществляются за счет одних и тех же функций интерфейса.

Составляющие полнотекстовую БД программная оболочка и загруженный в нее документальный массив функционируют на мощнейших серверах, связанных с интернет широкополосными каналами связи. Высокопроизводительные компьютеры в состоянии выполнять запросы и доставлять документы одновременно нескольким тысячам клиентов. Нередкой является практика «зеркалирования» серверов в различных регионах мира, дабы приблизить ресурс к конечным пользователям, а также подстраховаться на случай непредвиденных технических проблем с каналами связи и т. п.

Обладая всем необходимым для предоставления цифровых информационных услуг, компании-агрегаторы начинают предлагать доступ к БД конечным пользователям. Основной рынок составляют традиционные, университетские библиотеки и библиотеки корпораций (информационные центры, центры по управлению знаниями), для которых приобретение доступа к удаленным БД открывает качественно иной этап развития. Пользование ресурсами в большинстве случаев осуществляется по предварительной подписке. На оговоренное время, как правило, на один год, БД открываются для доступа со всех компьютеров, расположенных в библиотеке или во всем учреждении, например, университете или корпорации. Чаще всего читателям нет необходимости знать условное имя пользователя и пароль для входа в информационный массив – доступ открывается на основе сообщаемых агрегатору IP-адресов компьютеров, выделенных для пользования конкретным цифровым хранилищем. Доступ со всех других компьютеров автоматически блокируется.

С начала нынешнего тысячелетия наиболее прогрессивные информационные учреждения практикуют предоставление доступа к внешним полнотекстовым БД для своих читателей, находящихся вне стен библиотеки, например, дома или на рабочем месте. В этом случае читатель переадресовывается к полнотекстовой БД после прохождения авторизации на сайте библиотеки. Работа с информационным массивом в этом случае осуществляется так же, как и при работе с библиотечного терминала.

Как правило, компании-агрегаторы имеют в арсенале несколько десятков, а порою даже сотен БД от разных производителей. Они могут предлагаться клиентам как в комплексе, так и по отдельности. Число ресурсов нестабильно – в зависимости от имеющегося спроса и, следовательно, экономической целесообразности, БД появляются или удаляются из доступа. Нередко одну и ту же популярную БД можно встретить у различных поставщиков. При этом агрегаторы конкурируют друг с другом по уровню комфортности и стоимости доступа, что, безусловно, выгодно конечным пользователям.

В отличие от бесплатных сетевых библиотек, при использовании полнотекстовых БД не возникает никаких конфликтов в сфере прав на используемую интеллектуальную собственность. Все права на документы принадлежат их создателям, которые передают информационные массивы компаниям-агрегаторам исключительно на законной основе.

Схема извлечения прибыли при пользовании коммерческими полнотекстовыми ресурсами довольно проста. Первичные доходы обеспечиваются стоимостью подписки. Из полученных сумм агрегаторы выплачивают оговоренный процент создателям ИР или владельцам прав на используемую интеллектуальную собственность. Те, в свою очередь, рассчитываются непосредственно с авторами, если это предусмотрено авторскими договорами.

Иногда практикуется и иная схема оплаты, предназначенная для индивидуальных пользователей, не являющихся читателями библиотек, оформивших подписку. Подобные клиенты, обращающиеся к БД фрагментарно, имеют возможность оплатить доступ самостоятельно по схеме Pay Per View (оплата по количеству просмотров документов) с помощью международных платежных систем.

Стоимость доступа к коммерческим БД весьма высока, но в большинстве случаев она оправдывается высоким качеством информационного продукта. Поскольку документальный массив поступает от непосредственных производителей, в нем практически исключены грамматические ошибки и ошибки форматирования – все материалы проходят редактуру, корректуру и профессионально верстаются. При отсутствии в базе каких-либо документов (например, статей из определенного номера периодического издания) подписчик вправе предъявить претензии и получить компенсацию.

Документы в полнотекстовых БД имеют, как правило, максимально возможный репрезентативный (от фр. внешний вид. Лишь на заре своего существования коммерческие базы включали в основном тексты в простейшем формате TXT, не допускающем сохранения изначального (аналогичного печатному) вида документа, включения таблиц и иллюстраций. В 1990-х гг. большинство коммерческих БД перешли на использование текстов в формате HTML, который обладает большими репрезентативными возможностями. С 2000-го г. практически все агрегаторы предлагают своим клиентам документы в формате PDF, который способен до мельчайших деталей воспроизводить внешний вид печатного аналога и вместе с тем предоставляет богатые возможности при работе с документом. Современные PDF-документы допускают полнотекстовый поиск по ключевым словам, копирование фрагментов текста, включение в документ иллюстраций и таблиц, возможность увеличения выбранных пользователем фрагментов текста, подчеркивание строк и даже написание заметок на полях. Для оцифровки ретроспективных коллекций используют, как правило, «имиджевый» PDF-формат, который сохраняет в точности вид документа, но не обладает возможностями полнотекстового поиска и прочими факультативными характеристиками (фактически это изображение реальной страницы источника, которое можно увеличивать или уменьшать).

Воспроизводятся PDF-документы при помощи бесплатно распространяемой программы Acrobat Reader, последние версии которой легко выгружаются из интернет с сайта ее производителя компании Adobe www. /products/acrobat/readstep2.html).

Большое значение придается оперативности включения источников в БД. В некоторых случаях (главным образом при работе с документами, поступающими из агентств новостей) актуализация производится в текущем режиме. Новые документы появляются в составе информационного массива по мере их появления, фактически, каждые несколько минут. Отставание появления новостного сообщения в базе от его опубликования в СМИ на несколько часов уже считается критическим. Высокая оперативность обновления полнотекстовых БД также ярко иллюстрируется их работой с периодическими изданиями. Полные тексты журналов, главным образом, академической направленности, появляются в составе цифровых БД за несколько месяцев до выхода в свет их печатных аналогов.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6