Iнструментальнi засоби пошуку iнформацii в Iнтернет
ЗМІСТ
Сьогодні щодня безліч людей несподівано відкриває для себе існування глобальних комп'ютерних мереж, об'єднуючих комп'ютери у всьому світі в єдиному інформаційному просторі, ім'я якому - Інтернет. Інтернет багатогранний і не можна чітко визначити, що це таке. З технічної точки зору, Інтернет - об'єднання транснаціональних комп'ютерних мереж, що працюють з найрізноманітніших протоколами, зв'язують всілякі типи комп'ютерів, фізично передають дані по телефонним проводам і оптоволокну, через супутники і радіомодеми. Сьогодні практично будь-яка людина, що володіє доступом до комп'ютера з найпростішим модемом, може використовувати у своїй діяльності величезні інформаційні ресурси, що надаються Інтернет.
Отже, Інтернет - мережа мереж, всесвітня комп'ютерна мережа. Інтернет можна розглядати з багатьох позицій, ось дві крайні з них. Найбільш вузьке розгляд - об'єднання мереж, пов'язаних між собою так, що в будь-який момент кожен комп'ютер в Інтернет "бачить" кожен інший (тобто може передати йому пакет даних і отримати відповідь за частки секунди). Найбільш широке - кіберпростір, що народжує кіберкультуру зі своїм образом думки, своєю мовою, своєю етикою.
Інтернет чудовий тим, що мережа і її сервіси стали широко поширені у житті суспільства, що вони виявилися досить гарні, щоб ріка інформації потекла руслом Інтернет. Інтернет не вирішив проблему зберігання та впорядкування інформації, але вирішив проблему її передачі - дав можливість отримати будь-яку інформацію де завгодно, коли завгодно.
Ця чудова здатність передачі інформації призвела до грандіозних темпами зростання Інтернет. Внаслідок децентрализованности, не можна точно сказати, які його розміри сьогодні, але за оцінками "Network Wizards", кількість комп'ютерів, підключених повноцінно в Інтернет, останні два роки щорічно подвоюється, складаючи 6600 тисяч комп'ютерів в липні 1995 року. За іншими оцінками, кількість комп'ютерів, що мають доступ до будь-яких сервісів Інтернет, навесні 1995 року становило до 30 мільйонів. Це означає, що якщо швидкість росту Інтернет залишиться на тому ж рівні, то протягом найближчих років Інтернет і його сервіси стануть настільки ж загальновживаними, як телефон і телебачення сьогодні. Дуже багато компаній розуміють це, і, прагнучи першими прийти на цей ринок (а Інтернет являє собою, крім усього іншого, ще і величезний ринок мільйонів потенційних клієнтів), вкладають гроші в розвиток мережі і сервісів, їй надаються. Якщо в 1994 році в компанії, що працюють з Інтернет, було вкладено 42 мільйони доларів США, то вже за перший квартал 1995 року ця цифра становила 47 мільйонів (New York Times, 26 June 1995, p. D5). А гроші, як відомо, роблять гроші, і це є ще одним фактором, який пришвидшує розвиток мережі. Комерціалізація Інтернет - це, можливо, найважливіший аспект його розвитку сьогодні. Довгий час, до весни 1995 року, основні канали зв'язку і адміністративні структури Інтернет фінансувалися Національним науковим фондом США, але тепер фінансування припинено і розвиток мережі відбувається на комерційній основі. Щоб жити в місті, потрібно вміти користуватися транспортом. Для кожної поїздки обирають свій вид транспорту. За місто їздять на електричках, в аеропорт можна поїхати на маршрутному таксі, до метро можна доїхати на тролейбусі. Інтернет у цьому плані дуже схожий на місто. Щоб успішно працювати з ним, потрібно знати правила поведінки в мережі і вміти орієнтуватися в безлічі доступних Вам інформаційних сервісів. На жаль, зважаючи на децентрализованности і молодості Інтернет, не існує єдиної його карти або путівника по всіх його сервісів. Ефективність роботи в мережі визначається знанням існуючих сервісів, умінням працювати з конкретними сервісами і здатністю вибрати правильний спосіб вирішення конкретної задачі. Цим визначається не тільки те, як скоро можна знайти потрібну інформацію, а й те, чи можна її знайти взагалі.
1. ТЕХНОЛОГІЯ ПОШУКУ ІНФОРМАЦІЇ В ІНТЕРНЕТ
Сьогодні Інтернет об'єднує безліч різних мереж, мільйони комп'ютерів, близько 300 мільйонів користувачів (дані від Robert Orenstein) усіх континентів і, за різними оцінками, кількість таких користувачів збільшується на 15-80% щорічно. Можна виділити два основних напрямки у використанні Інтернет у бізнесі. Це оперативний доступ до воістину безмежним джерелом інформації з будь-якої тематики (на сотнях тисяч інформаційних серверів), пошук і інтерактивне спілкування з партнерами, практично в будь-якої спеціалізації та географічному розташуванні. Як зорієнтуватися у такому масштабному інформаційному просторі? Для цього існують спеціалізовані пошукові сервери. Їх можна розділити на тематичні каталоги, роботи індексів (пошукові машини), системи мета-пошуку. Також, для пошуку необхідної інформації в Інтернет вельми корисні системи пошуку в конференціях Usenet та служби пошуку людей.
Стандартна технологія пошуку інформації, реалізована, наприклад, в протоколі Gopher, грунтується на "деревах". Прикладом реалізації цієї технології можуть бути також індексні файли систем управління базами даних - "бінарні дерева". У тих випадках, коли пошук здійснюється автоматично на основі суворого алгоритму вибору подальшого шляху пошуку, технологія, заснована на "деревах" забезпечує найкращі результати. Але в тих випадках, коли вибір здійснює людина, не зовсім ясно представляє що він шукає, такий спосіб пошуку часто буде приводити в тупики тобто до інформації не повною або взагалі в даний момент не потрібною. У таких випадках пошук доводиться починати спочатку.
Основна ідея, реалізована в технології WWW (World Wide Web), полягає в тому, щоб кожний об'єкт пошуку мав посилання на асоціативно пов'язані з ним об'єкти. Причому в мережі Internet такі посилання може визначати будь-який користувач мережі. У цьому випадку пошук не може закінчитися глухим кутом і потрібна інформація може бути знайдена при русі по різних шляхах. Така система пошуку більше нагадує павутину, ніж дерево і саме ця асоціація лежить в основі назви технології WWW - "всесвітня павутина". Технологія WWW була розроблена в Європейському центрі ядерних досліджень (CERN) і грунтується на архітектурі клієнт / сервер. Програма броузер виконує роль клієнта, з її допомогою можна з'єднатися з програмою-сервером (Web-сторінкою), що знаходиться в будь-якому місці мережі Internet. При знаходженні необхідної інформації, вона передається програмі-клієнту. При відсутності потрібної інформації програмі-клієнту передаються посилання на інші сервери і так до тих пір, поки шукані відомості не будуть знайдені. Web містить мільйони документів, однак прямий доступ можливий лише до тих небагатьох джерел, на які є посилання на відкритої в даний момент сторінці. При цьому переважна кількість документів Web залишається поза полем зору. Щоб виправити таку ситуацію, завбачливі програмісти розробили цілий ряд служб, у які закладено той чи інший метод пошуку документів, що не має прямих посилань.
інтернет глобальний пошук інформація
Загальним підходом для всіх служб є пошук за заданим користувачем ключовими словами. Наявність заданих ключових слів перевіряється в тілі документа, його заголовку або посиланнях. У ході пошуку формується Web-сторінка результатів, що містить адреси URL, назви та короткі описи знайдених джерел. Загальна послідовність роботи з усіма службами однакова.
1. Відкрийте початкову сторінку служби.
2. Введіть ключові слова для пошуку та натисніть. Програма повертає Web-сторінку з першою групою знайдених джерел, які відповідають умовам пошуку.
3. Виявивши в списку потрібне джерело, клацніть на посиланні. Броузер відкриє відповідну Web-сторінку.
За способом пошуку та організації результатів всі програми пошуку можна розбити на дві групи. Системи індексування (search index) проводять пошук за заданим користувачем ключовими словами. Укладачі каталогів (search directory) організують Web-сторінки в систему ієрархічно пов'язаних розділів. Способів пошуку в такій системі багато, включаючи переміщення по посиланнях від розділів вищої до розділів нижчих рівнів. І ті, і інші виводять результати, використовуючи базу даних, яку складають, періодично роблячи рейди по мережі.
1.2 Що таке пошукові індекси і каталоги
Індекс використовується для пошуку Web-сторінок за ключовими словами, каталог - по розділах, систематизованим за ієрархічним рубриками.
Агенти мають вбудовані засоби пошуку документів І NetScape Navigator, і Microsoft Internet Explorer мають вбудовані засоби, що дозволяють швидко знаходити потрібні сторінки.
Пошукова система - потужний інструмент, що дозволяє дізнаватися про все на світі: від результатів останніх спортивних матчів до щоденних подій. Завдяки правильно організованому засобу пошуку Web стає невід'ємною частиною повсякденного життя користувача.
PointCast Client - одна з кращих пошукових систем, яка дозволяє отримувати останні новини безпосередньо на робочий стіл комп'ютера. А головне, вона абсолютно безкоштовна!
Можливості потужних систем пошуку виходять далеко за межі простого вміння знаходити Web-сторінки. Багато з них мають вбудовані засоби пошуку адрес електронної пошти, телефонних номерів і повідомлень груп новин. Деякі дозволяють знаходити географічні карти, наприклад, детальні плани міст.
Поява індексу є результатом роботи трьох елементів програми індексування. Власне пошук за ключовими словами виконує Пошукова система (search engine). Саме до цієї частини програми індексування звертається користувач, задаючи умова пошуку в рядку для ключових слів. Пошук проходить в організованій програмою базі даних. Сукупність знайдених посилань і адрес URL оформляється у вигляді Web-сторінки результатів. Системи різняться своїми можливостями. Деякі з них підтримують використання ключових виразах булевих операторів, дозволяючи істотно звузити область пошуку. Інші, навпаки, збирають усе, що містить принаймні одне із заданих ключових слів.
"Павук" (spider) (іноді називають "хробаком" (worm) або "гусеницею" (crawler)) повинен виявити як можна більше Web-сторінок. Для цього він "запам'ятовує" всі посилання на відкриті їм документи. У виявлених таким чином нових сторінках знову відшукуються і запам'ятовуються посилання. Ця процедура повторюється до тих пір, поки не будуть вичерпані всі джерела посилань. Однак очевидно, що подібний метод не може гарантувати всеосяжних результатів: чи потрапить той чи інший джерело в число зібраний "павуком" сторінок, цілком залежить від наявності посилань на нього в інших документах Web.
Кожного разу, коли "павук" знаходить чергову Web-сторінку, упорядник індексу (indexer) вивчає вміст, заносячи слова, знайдені в посиланнях і тексті сторінок, в гігантську базу даних, ущільнити базу і очистити її від повторюваних елементів можна за допомогою високоефективних алгоритмів будови баз даних, закладених в упорядник індексу. Це нескладно, адже в людської мови поки що не використовуються унікальні слова. Укладач індексу має в результаті створити базу, в якій URL адреси були б співвіднесені з наборами зустрічаються у них слів.
Якщо яку-небудь Web-сторінку не вдається знайти, це ще не означає, що такої сторінки не існує. Багато пошукових систем генерують списки, в яких споріднені теми зібрані у розділи, організовані за принципом каталогів (такий принцип закладено, наприклад, в Yahoo!). Якщо вам не вдається знайти потрібні матеріали - скажімо, про догляд за йоркширським тер'єром (grooming Yorkshire Terrier), спробуйте відшукати їх за індексом. Цілком можливо, шукана тема виявиться серед його посилань.
Щоб підвищити ефективність пошуку за індексом, зробіть умова пошуку більш загальним і додайте ключове слово "index". Так, умова Grooming AND (Yorkie OR "Yorkshire Terrier") слід змінити на Index AND (Yorkie OR Yorkshire). He виключено, що менш конкретна умова Index AND Terrier дасть ще кращі результати. Якщо умова вибране вдало, пошукова система поверне один або кілька індексів, що посилаються на сторінки про йоркширської породі і тер'єрів.
На перший погляд відрізнити програми індексування від укладачів каталогів важко. Матерія для пошуку для обох інструментів служить вміст Web-сторінок. Однак, на відміну від програм індексування, укладачі каталогів не розшукують усі Web - сторінки Internet. Об'єктом пошуку для них є адреси URL, які включаються до систематизований каталог. Пошук по каталогу можна проводити як за допомогою броузера, так і вручну, клацаючи на назвах розділів і знайомлячись з їх вмістом.
Тим не менш, незважаючи на принципові відмінності у механізмах роботи, грань між грамами індексування та складання каталогів поступово стирається. Все частіше можна зустріти індекс, забезпечений засобами побудови каталогу. Нерідко самі Web-сторінки у верхній частині мають якусь подобу змісту з посиланнями на окремі розділи.
Правильний вибір інструменту пошуку - ключовий момент пошукової стратегії. Якщо не допомагає одна служба, можна спробувати інші
Параметри браузера можна змінити так, щоб деяка Web-сторінка відображалася щоразу, коли відбувається запуск Internet (стала початковою сторінкою за замовчуванням). Зробивши початкової Web-сторінку будь-якої пошукової служби, ви отримаєте негайний доступ до всього набору засобів пошуку, якими володіє дана служба. Excite, InfoSeek і Yahoo! є для цього кращими кандидатами.
Найбільш популярним у всьому світі визнано тематичний каталог Yahoo! (http://www.yahoo.com/). Він являє собою величезну базу даних URL-адрес сайтів самої різної тематики. Yahoo! пропонує вам скористатися ієрархічним деревом при пошуку інформації. Тобто ви обираєте спочатку загальну тематику, що задовольняє вашому запиту інформації, і далі конкретизуєте, слідуючи підказкам каталогу. У звісно результаті ви отримуєте список сайтів, що містять інформацію, відповідну вашому запиту. На Yahoo! ви також можете піти й іншим шляхом. Проаналізуйте передбачуване зміст запитуваної інформації та виберіть ключові слова, які обов'язково зустрінуться в цікавлять вас матеріалах або їх заголовках. Набираєте ці слова через пробіл в рядку введення на головній сторінці Yahoo! і натискаєте Enter. Система спробує сама підібрати цікаву для вас інформацію. Так як Yahoo! система англомовна, то досить зручно використовувати Інтернет-перекладач, такий як "Сократ Інтернет" (http://www.arsenal.ru/).
Якщо ж ви шукайте інформацію завідомо російськомовну, то має сенс використовувати російські каталоги. Принцип роботи з ними ідентичний, тому що ми розглянули на прикладі з Yahoo!. Тут варто відзначити перший російський каталог Russia on the Net (http://www.ru/), один з найбільших російськомовних каталогів List.RU (http://www.list.ru/), російський варіант Yahoo! (http:/ / www.yahoo.ru/). Має місце, також, каталог "Сузір'я Інтернет", який містить лише обрані (заявлено як найцікавіші) ресурси. Говорячи про бази даних, не можна не згадати чудовий російський проект "Жовті сторінки Інтернет" (http://www.piter-press.ru/yp), де як і в однойменній книзі представлена детальна інформація про самих різних ресурсах Інтернет. У бізнесі також знадобляться каталоги підприємств і каталоги товарів і послуг. Мабуть, самий великий каталог підприємств СНД Партнер (http://trifle.net/cis).
2.2 Роботи індексів або пошукові машини
Пошукові машини влаштовані дещо інакше. По суті це сервер з величезною базою даних URL-адрес, який автоматично звертається до сторінок WWW по всіх цих адресах, вивчає вміст цих сторінок, формує і прописує ключові слова зі сторінок у свою базу даних (індексує сторінки). Більше того, цей сервер звертається по всіх зустрічається на сторінках посиланнями і переходячи до нових сторінок, робить із ними теж саме. Тому що майже будь-яка сторінка WWW має безліч посилань на інші сторінки, то при такій роботі пошукова машина в кінцевому результаті теоретично може обійти всі сайти в Інтернет. Найпопулярніша пошукова машина AltaVista (http://www.altavista.com/) містить 11 млрд слів, витягнутих з 30 мільйонів WWW-сторінок. Як користуватися цим сервісом? Необхідно продумати рядок запиту інформації (не більше ніж 5 слів), як у випадку з Yahoo! і також набрати її в полі введення. Над кнопкою Search (Пошук) знаходиться спадаюче меню з вибором мови. Перед натисненням Enter або кнопки Search необхідно вибрати мову подання інформації. Крім того, до запиту інформації можна включати спеціальний символ *, що розширює діапазон пошуку. Скажімо, що б Altavista могла знайти не тільки всі входження слова "легка", але слова "легку", "легкої" і т. д., у запиті треба писати "легк **". Тобто змінюються літери закінчення замінюємо на символ *.
Як і попередньому випадку, для пошуку в російськомовному Інтернет Altavista не дуже підходить. Якщо на запит "Light industry" Altavista формує список з 2917 URL-адрес, то за запитом "Легка промисловість" з'являється список посилань на всього 9 сайтів. Найбільш розвинений сервіс пошуку російськомовної інформації надає сервер Яndex (http://www.yandex.ru/). У Яndex можна просто написати по-російськи фразу, яка описує те, що ви хочете знайти. Система самостійно проаналізує та розпізнає ваш запит, а потім постарається знайти все, що відноситься до заданої теми. Ну а в тому випадку, якщо потрібних документів не виявиться, можна продовжити пошук через AltaVista, куди автоматично передається вже оброблений системою запит. Але до передачі запиту AltaVista навряд чи дійде, тому що база Яndex містить порядку 2 млн документів і постійно оновлюється. Проблема більше полягає в тому, що пошукова машина в результаті вашого запиту генерує гігантський список адрес URL з короткими описами. Яndex дозволяє конкретизувати ваш запит для скорочення цього списку до розумних меж. Ви можете на запит або набрати фразу за аналогією з попередніми системами, або, використовуючи, спеціальні оператори, скласти рядок, яка пояснює Яndex, яким вашим вимогам повинна відповідати, що цікавить вас.
Варто згадати про ще однієї популярної російської пошукової машині Rambler (http://www.rambler.ru/). У цього сервера ще більш повна база даних адрес URL, ніж у Яndex. Відмінною рисою Rambler є те, що цей сервер веде статистику відвідуваності посилань з власної бази даних. Ви завжди можете зайти в розділ "Рейтинг" на головній сторінці Rambler і побачити вміст тематичного каталогу, відсортовані за спаданням кількості відвідувань сайтів і отже їх популярності. Тим самим відсікаються явні аутсайдери і ви не витрачаєте на них свій час. Rambler також як і Yandex, дозволяє, крім простого запиту, запит з мовою запитів. Підтримуються ті ж логічні оператори І, АБО, НЕ, метасимвол * (аналогічно розширює діапазон запиту символу * в AltaVista), коефіцієнтний символи + і -, щоб збільшити або зменшити значущості вводяться в запит слів.
Варто також відзначити інші російськомовні пошукові машини Апорт (http://www.aport.ru/) і АУ (http://www.au.ru/).
Пошукові машини та тематичні каталоги сьогодні мають багато спільного. У каталогів присутня можливість пошуку інформації по рядку запиту з використанням логічних операторів, а пошукові машини містять свої власні тематичні каталоги. І тим не менш найкраще ці пошукові сервіси проявляють себе у своїй первісній категорії.
Читаючи про всі перераховані пошукових службах, по неволі задумаєшся: "а якщо для пошуку необхідної інформації не достатньо однієї пошукової служби, то невже доведеться входити на всі тут перераховані сервера і кожен раз повторювати один і той самий запит?!". Найбільш якісний результат якраз буде саме за такого підходу. Але можна, виходячи з економії часу і грошей, скористатися системами мета-пошуку. Найбільш популярна в світі система такого класу Search.com (http://www.search.com/), але якщо ми працюємо переважно з російськомовними документами, то можна використовувати Savvy Search (http://guaraldi.cs.colostate.edu: 2000/form? lang = russian). Це досить потужна система відсилає ваш запит на 13 найбільших пошукових машин (в тому числі і російських) і повертає вам їх звіти. Інша російська система мета пошуку "Слідопит" (http://www.medialingua.ru/www/Wwwsearc.htm) працює лише з п'ятьма англомовними пошуковими машинами і однієї російськомовної, але цікава тим, що переводить ваш російськомовний запит на англійську мову для англомовних пошукових машин.
Також існують так звані мультипошукові сторінки:
"Все в одному" (http://www.tpi.ac.ru/ ~ mike / search / index.htm);
Search (http://www.informika.ru/windows/intern/poisk/main.html);
БКФ Пошук (http:/bforum.virtualave.net/index09.htm) та інші.
Ці сервера не вміють посилати запити та отримувати звіти від пошукових служб як системи мета-пошуку. Мультіпоісковие сторінки завантажують у безлічі вікон пошукові служби та передають їм ваш запит. До того ж такі системи працюють не стабільно.
2.4 Системи пошуку в конференціях Usenet
У всьому світі вважається найкращим сервісом для пошуку інформації у конференціях Usenet сервер DejaNews (http://www.dejanews.com/). Серед російськомовних виділяється сервер RusNews (http://news.corvis.ru/), що є також новинним сервером, що містить більше 2000 новинних груп. Точно також як і в інших пошукових службах ми набираємо рядок запиту, а сервер нам формує список конференцій, що містять наші ключові слова. Далі треба підписатися на відібрані нами конференції в нашій програмі роботи з новинами. Також має місце аналогічний російський сервер ТІЛА-пошук (http://tela.dux.ru/news.html).
Мережеві новини Usenet, або, як їх прийнято називати в російських мережах, телеконференції - це, мабуть, другий за поширеністю сервіс Інтернет. Якщо електронна пошта передає повідомлення за принципом "від одного - одному", то мережні новини передають повідомлення "від одного - багатьом". Механізм передачі кожного повідомлення схожий на передачу чуток: кожен вузол мережі, що довідався щось нове (тобто отримав нове повідомлення), передає новину всім знайомим вузлам, тобто всім тим вузлам, з ким він обмінюється новинами. Таким чином, послане Вами повідомлення поширюється, багаторазово дублюючи, по мережі, досягаючи за досить короткі терміни всіх учасників телеконференцій Usenet в усьому світі. При цьому в обговоренні цікавить Вас теми може брати участь безліч людей, незалежно від того, де вони знаходяться фізично, і Ви можете знайти співрозмовників для обговорення найбільш незвичайних тем. Кількість користувачів Usenet досить велика - за оцінками UUNET technologies, кількість нових повідомлень, що надходять у телеконференції щодня, складає близько мільйона.
Новини розподілені за ієрархічно організованими тематичними групами, й ім'я кожної групи складається з імен підрівнів ієрархії, розділених крапками, причому більш загальний рівень пишеться першим. Розглянемо, наприклад, ім'я групи новин comp.sys.sun.admin. Ця група відноситься до ієрархії верхнього рівня comp, призначеної для обговорення всього, пов'язаного з комп'ютерами. В ієрархії comp є підрівень sys, призначений для обговорення різних комп'ютерних систем. Далі, sun означає комп'ютерні системи фірми Sun Microsystems, а admin позначає групу, призначену для обговорення питань адміністрування таких комп'ютерних систем. Отже, група comp.sys.sun.admin призначена для обговорення питань адміністрування комп'ютерних систем фірми Sun Microsystems. Таким чином, зазвичай, маючи мінімальні знання англійської мови, можна по імені групи легко зрозуміти, що в ній обговорюється. Наприклад, в alt.games.vgaplanets пишуть любителі гри Vga Planets, а jet.testing призначена для посилки тестових повідомлень в групу, локальну для компанії Jet Infosystems.
Існують глобальні ієрархії, як-то comp, та ієрархії, локальні для якої-небудь організації, країни чи мережі. Взагалі кажучи, набір груп, які отримує Ваш локальний сервер Usenet, визначається адміністратором цього сервера і наявністю цих груп на інших серверах, з якими обмінюється новинами Ваш сервер. Однак, звичайною є ситуація, коли сервер отримує, по-перше, всі глобальні ієрархії, по-друге, групи, локальні для вашої країни і мережі, і, по-третє, групи, локальні для Вашої організації. Наприклад, до першої групи належать ієрархії comp, news, misc, alt, rec, до другої - ієрархії relcom і fido7 в Росії та ієрархія de у Німеччині, до третьої - ієрархії jet для Jet Infosystems і cern в CERN.
До різних ієрархій застосовуються різні норми і правила роботи з ними. У першу чергу, це стосується мови повідомлень - у групи російської ієрархії relcom найкраще писати російською, в той час як у групи глобальної ієрархії comp можна писати лише англійською. Не завжди в Usenet можна посилати інформацію рекламного характеру - наприклад, ви можете вільно посилати рекламні повідомлення в групи ієрархії relcom.commerce, спеціально для того і створені, а от у групи fido7 некомерційною мережі FIDO посилати рекламу суворо заборонено. Менш суворими є обмеження на можливі обсяги цитування попередніх авторів у Вашому листі, розмір підпису Вашого листа і т.д.
Починаючи працювати з якою-небудь групою або ієрархією груп, в першу чергу потрібно прочитати правила роботи з ними, які регулярно поміщаються в ці групи людиною, добровільно взяли на себе обов'язки координатора групи (модератора). Насправді, групи новин бувають двох типів - модеровані та звичайні. Повідомлення, що з'являються в модерованих групах, перш ніж бути розісланими у мережі, проглядаються модератором. Це, звичайно, є свого роду цензурою, але в такому величезному співтоваристві, як Usenet, неможливо підтримувати порядок без таких суворих заходів. Сьогодні будь-який комп'ютер, повноцінно підключений до Інтернет, має доступ до новин Usenet, але новини Usenet поширюються і в інших мережах, застосовуючи настільки ж широко, як і електронна пошта. Способи й зручність роботи з новинами сильно залежать від того, яким чином Ви отримуєте їх. В Інтернет Ваша програма-клієнт напряму отримує новини із сервера Usenet, і між переглядом списку повідомлень, що містяться в групі, і читанням цих повідомлень немає затримки. Якщо Ви користуєтеся новинами через електронну пошту, то Ви спочатку одержуєте список статей, а вже потім приймаєте електронною поштою статті зі списку, окремо Вами замовлені. Такий спосіб роботи з новинами Usenet є сьогодні найбільш поширеним в Росії, але насправді це досить незручний і застарілий метод.
2.5 Служби пошуку людей
У вас з'явилася можливість працювати з електронною поштою, але ви не знаєте адрес електронної пошти партнерів вашої організації. Завдяки, так званим, службам пошуку людей в Інтернет, вказавши ПІБ вашого опонента теоретично ви можете отримати його адресу електронної пошти та URL-адресу. Чому теоретично? Справа в тому, що системи пошуку людей, в основному беруть інформацію про електронні адреси з відкритих джерел, таких як конференції Usenet. Де гарантія, що ваші партнери беруть участь у цих конференціях? І тим не менш розглянемо деякі служби пошуку людей. У першу чергу, традиційно, про саму популярну англомовної системі Four 11 (http://www.four11.com/). Це дійсно великий сервер - його база даних містить майже 6 000 000 адрес. Серед російськомовних служб можна виділити Е-Рос (http://www.dubna.ru/eros).
Різні методики пошуку, приводять до різних результатів. Останні, приміром, залежать від того, який логічний оператор використаний у ключовому вираженні. Нижче наведено кілька основних правил підбору ключових слів.
• Чим конкретніше поняття, що позначається ключовим словом, тим краще. Це звужує область пошуку і робить його більш предметним. Наприклад, не слід вводити слово "dog" (собака), якщо не можна пошукати відомості про Карликовий пудель.
• Уникайте загальновживаних слів. В якості ключових марно використовувати такі слова, як "that", "the", "program", "internet". Вони настільки поширені, що пошук по них дасть багато тисяч сторінок.
• Пробуйте різні форми одного години того ж ключового слова. Наприклад, якщо шукані сторінки повинні містити відомості про біг (running), пробуйте пошук по всіх трьох форм: "run", "runs", "running".
• Не забувайте про синоніми. Так, крім "running" (біг), можна використовувати також "jog" (біг підтюпцем). У висловлюваннях з булевими операторами не забувайте розділяти синоніми оператором OR.
• Пробуйте різні варіанти. Якщо знайдених сторінок виявилося занадто багато, спробуйте звузити умови пошуку. Навпаки, якщо результат занадто мізерний, що використовується ключове слово слід замінити більш загальним поняттям. Перший вибір далеко не завжди оптимальний.
• Не забувайте додавати лапки. Вони обов'язкові, якщо ключове слово або вираз являє собою назву. Наприклад, щоб знайти в Internet згадка про цю книгу, в рядку для ключових слів потрібно ввести: "Special Edition Using the Internet". He забудьте поставити лапки.
• Враховуйте регістр символів. Результат пошуку нерідко залежить від того, в якому регістрі записано ключове слово. Так, якщо воно записано малими буквами, програма повертає сторінки, де цей вираз записано як малими, так і великими. Однак якщо в рядок для пошуку ввести прописні символи, регістр буде суворо дотриманий: програма знайде тільки ті сторінки, де цей вираз цілком записано прописними.
• Звертайте увагу на специфіку використовуваного інструменту. Деякі пошукові служби мають властивості, які значно полегшують пошук потрібних документів. У цьому розділі буде розказано про найпопулярніші засобах; додаткові відомості можна знайти, клацнувши на посилання в нижній частині початкових сторінок цих служб.
Якщо початкова сторінка служби пошуку містить перелік розділів (topic map), їх рекомендується використовувати, оскільки вони допомагають у виборі ключових слів. Перелік розділів містить список додаткових ключових слів (заснований на словах, що вводяться користувачем), які програма рекомендує використовувати в пошуку, і перелік знайдених джерел.
Використання в ключових виразах булевих операторів (AND, OR, NOT) в ключових виразах допомагає уточнити область і предмет пошуку. Хоча наявність заданих ключових слів пошукова служба перевіряє у всіх без винятку документах Internet, умови пошуку можна змінювати, задаючи спосіб комбінації декількох ключових слів. Наприклад, умовою пошуку може бути "golf (гольф) у поєднанні з" equipment "(спорядження)," clubs "(клуби)," bags "(сумки)," balls "(м'ячі) - з одним з цих слів чи з усіма одночасно в будь-яких комбінаціях.
Булеві оператори, які можна використовувати для складання ключових виразів. Оператор AND між двома ключовими словами задає пошук сторінок, що містять одночасно обидва слова. За оператору OR буде знайдено всі сторінки, що містять принаймні одне з двох ключових слів. Якщо перед ключовим словом стоїть оператор NOT, служба пошуку знайде сторінки, в яких це ключове слово відсутнє.
Булевими операторами можна об'єднувати кілька слів чи вираженні, взятих у лапки. Нижче наводиться кілька прикладів.
• Music AND Celtic
Пошук сторінок, що містять обидва слова - "Music" і "Celtic".
• Honeycutt AND Book AND NOT "Using the Internet"
Пошук сторінок, що містять слова "Honeycutt" і "Book", але не містять висловлювання "Using Internet".
• Honeycutt OR Que AND Book AND "Using the Internet"
Ця умова задає пошук сторінок, кожна з яких містить хоча б одне з двох ключових слів - "Honeycutt" або "Que", а також слово "Book" і вираз "Using the Internet".
• Grooming AND "Yorkshire Terrier"
Пошук сторінок, в кожній з яких міститься слово "Grooming" і вираз "Yorkshire Terrier" Межі пошуку можна звузити, уклавши частина умови з оператором у дужки.
• "Using the Internet" AND (Second OR Third)
Пошук всіх сторінок, кожна з яких містить одне з двох слів ("Second" або "Third") і вираз "Using the Internet".
• (Grooming OR Care) AND (Yorkie OR Westie)
Пошук сторінок, в яких міститься хоча б одне слово з кожної пари: "Yorkie" - "Westie '" Grooming "-" Care ".
• Search AND (Tool OR Index OR Directory)
Пошук сторінок, що містять слово "Search" у поєднанні з одним із слів "Tool", "Index" або "Director
Деякі засоби пошуку дозволяють однозначно вказувати системі, чи повинні шукані сторінки містити те чи інше ключове слово. Для цього служать знаки "+" і "-", наприклад + word,-word. 3i "+" показує, що шукані сторінки повинні містити це ключове слово, знак "-" задає noi сторінок, в яких таке слово відсутнє. Нижче наводяться приклади використання включають і який виключає символів у ключових виразах.
• + Honeycutt-Gerald + Jerry
За такої умови будуть знайдені сторінки, що містять слова "Honeycutt" і "Jerry", але не тримають слова "Gerald".
• + Book-Plus
Ця умова визначає пошук сторінок, що містять слово "Book" і не містять слова "Pli Це вираз еквівалентно умові" Book AND NOT Plus ".
3.1 Практичні аспекти використання пошукових сервісів Інтернет
Найцікавішою рисою Інтернету є його корисність. На відміну від інших перспективних технологій, використовувати глобальну мережу можна вже зараз. Умовно кажучи, обсяг інформації, доступної Вам таким чином, набагато більше доступною традиційними шляхами. Представлення і зручність її сприйняття поки не можуть зрівнятися з книгами чи телебаченням, але кількість і доступність інформації в мережі незрівнянно вище. Далі в цій главі розглядаються ситуації, в яких наводяться приклади використання Інтернет в повсякденній діяльності. Вони покликані показати, що вже сьогодні можна користуватися інформацією, доступною з мережі, так само легко й буденно, як, скажімо, телефоном. Справа тут тільки відносно до інструментів, які знаходяться у Вашому розпорядженні. До сервісів Інтернет (в першу чергу це стосується World Wide Web) потрібно просто звикнути і відчувати, що вони є під рукою. Якщо Вам потрібна деяка інформація, то, перш, ніж шукати довідник або телефонувати колезі, оцініть, чи не можна отримати ту ж інформацію в Інтернет. Це може виявитися самим швидким способом, та й імовірність знайти потрібну інформацію більше. З іншого боку, сьогоднішній світ стрімко змінюється, знання і дані накопичуються так швидко, що книги просто не можуть встигнути за ними. Інтернет - джерело найсвіжішої інформації. Готувати і публікувати її в електронному вигляді незрівнянно швидше і дешевше, ніж традиційними шляхами. Подальші висновки зробити неважко. Якщо вже сьогодні Ваше вміння і звичка працювати з інформацією on-line впливають на швидкість і ефективність Вашої роботи, то завтра вони можуть стати визначальними чинниками.
Некоректним було б промовчати про слабкі сторони Інтернет як джерела інформації. У першу чергу, треба мати на увазі, що Інтернет міжнародна мережа. Це означає, що 99 відсотків її документів написані англійською мовою. Це не означає, що в Інтернет нічого робити, не знаючи його. Ця стаття, наприклад, буде доступна в Інтернет. Але хоча й існує певна кількість російськомовних серверів, їх все ж таки недостатньо, щоб створити російськомовну інформаційне середовище. Звичайно, знання англійської мови сьогодні стає критерієм загальної грамотності, але ми ведемо розмову про інформацію, її отриманні і засвоєнні. Документ на рідній мові читається і сприймається набагато швидше. Так чи інакше, тотальна англомовність Інтернет має не тільки плюси, а й мінуси.
По-друге, Інтернет - комп'ютерна мережа, і інформація в ній частіше комп'ютерного плану. Якщо Вас цікавлять комп'ютери, Ви напевно знайдете те, що шукаєте. Якщо Ви шукаєте кулінарні рецепти, то ймовірність їх виявлення в мережі набагато нижче. Іншими словами, насиченість Інтернет інформацією нерівномірна для різних галузей людської діяльності. Хоча реально не проводилося ніяких досліджень такого роду, але можна припустити, що приблизно дві третини Інтернет відносяться до комп'ютерів, близько третини - до розваг (включаючи новини, спорт, магазини і т.д.), і лише мала частка до всього іншого. Така спрямованість обмежує сьогоднішню застосовність мережі, і це треба мати на увазі.
У більшості нижчеописаних прикладів будуть використовуватися посилання та документи WWW. Це пояснюється тим, що World Wide Web - інтегруюча система, що дозволяє звертатися через себе до більшості сервісів Інтернет.
3.2 Складання посилання з імені організації
Припустимо, ви хочете дізнатися щось про деяку американської компанії, відомої Вам тільки по імені, наприклад Applix. Неважливо, що саме Вас цікавить - телефони, новини, продукти компанії - перше, що потрібно зробити в такій ситуації - спробувати звернутися за посиланням http://www.applix.com. Ви помітили відповідність? Звернувшись за посиланням http://www.імя_компаніі.com, Ви з великою ймовірністю потрапите на WWW-сервер шуканої компанії. Це відноситься не тільки до комп'ютерних компаніям. Так, адреса WWW-сервера компанії Walt Disney - http://www.disney.com/, а сервера хімічної компанії Dow - www.dow.com. У такому імені закінчення com значить, що це сервер комерційної компанії, розташованої в США. Сервери урядових організацій США мають закінчення gov (наприклад, www.whitehouse.gov), а сервери некомерційних організацій - org, як-то www.greenpeace.org. Якщо Вас цікавить не американська організація, спробуйте додати в якості закінчення абревіатуру країни - at для Австрії, de для Німеччини, ru для Росії. Цей дуже простий метод пошуку організацій може виявитися досить корисним.
3.3 Знаходження інформації із застосуванням серверів глобального пошуку
Мабуть, найкориснішою рисою Інтернет є наявність в ньому пошукових серверів. Це виділені комп'ютери, які автоматично переглядають усі ресурси Інтернет, які можуть знайти, і індексують їхній зміст. Потім Ви можете передати цьому серверу фразу чи набір ключових слів, що описують Ваше питання, і сервер поверне Вам список ресурсів, що відповідають Вашому запиту. Сьогоднішні пошукові системи підтримують індекси, що включають досить значну частину ресурсів Інтернет. Таких серверів існує досить-таки багато, більше десятка, і вкупі вони охоплюють практично всі доступні ресурси. До найпопулярніших я відніс би InfoSeek (http://www.infoseek.com/), Lycos (www.lycos.com), WebCrawler (www.webcrawler.com). Якщо в Інтернет є інформація, яка Вас цікавить, то її напевно можна знайти за допомогою пошукових серверів. Це найпотужніший засіб знаходження ресурсів в мережі (список найбільш популярних дивіться на сторінці "Глобальні пошукові системи").
3.4 Знаходження інформаційних ресурсів у каталогах
У каталогах Інтернет зберігаються тематично систематизовані колекції посилань на різні мережеві ресурси, в першу чергу на документи World Wide Web. Посилання в такі каталоги заносяться не автоматично, але їх адміністраторами. Більш того, займаються цим люди намагаються зробити свої колекції найбільш повними, включають всі доступні ресурси на кожну тему. У результаті користувачеві не потрібно самому збирати всі посилання по його питанню, але досить знайти це питання в каталозі - робота з пошуку та систематизації посилань вже зроблена за нього.
Каталоги зазвичай мають деревоподібну структуру і схожі на дуже великий список закладок, які напевно є у Вашому WWW-навігаторі, взагалі кажучи, і станься від останніх. Коли World Wide Web тільки починала розвиватися, і її сервери ще можна було перерахувати, деякі користувачі вели їх списки. З часом WWW-серверів ставало все більше, щодня з'являлися нові, і механізму закладок стало недостатньо для того, щоб зберігати цю інформацію. Деякі користувачі WWW стали створювати спеціальні програми для підтримки бази даних по посиланнях на ресурси Інтернет, її автоматичної синхронізації та управління нею. Саме так і народилися глобальні каталоги мережі, як, наприклад, найбільш відомий і великий - YAHOO. (Список найбільш популярних дивіться на сторінці "Глобальні пошукові системи").
Як правило, хороші каталоги Інтернет забезпечують різноманітний додатковий сервіс: пошук за ключовими словами в своїй базі даних, списки останніх надходжень, списки найбільш цікавих з них, видачу випадкової посилання, автоматичне сповіщення по електронній пошті про свіжі надходження. Все це робить використання таких колекцій вельми зручним.
3.5 Зіставлення пошукових серверів і каталогів
Пошукові системи індексують документи автоматично, не оцінюючи його завершеності та корисності. Тому вони можуть знаходити інформацію в самих "глухих" кутах Інтернет. З іншого боку, якщо Ви невдало сформулюєте Ваш запит, сервер може і не повернути посилання на потрібний документ. У цьому випадку, якщо Ви безумовно знаєте, що з себе представляє шуканий ресурс, і він напевно добре відомий, розумно звернутися до каталогів Інтернет. Це рішення також є адекватним у випадку, коли Вам потрібно найбільш повний список ресурсів по деякому питання. Якщо ж Вам потрібна хоча б одне посилання, то використовувати пошуковий сервер набагато швидше. Останній розумно також застосовувати у випадку, коли ви не знаєте точно, що із себе представляє шуканий предмет. Це звучить трохи дико, тому я наведу приклад. Припустимо, Ви прочитали в газеті, що акції компанії XYZ виросли в три рази за день. Але що з себе представляє компанія XYZ? Сервера www.xyz.com не виявилося, а шукати компанію в каталозі, не знаючи, чим вона займається, нерозумно. Тут якраз і приходить на допомогу пошуковий сервіс, який якщо і не знайде сервера самої компанії (якого може і не існувати), то знайде місця, де вона згадується в інших документах.
Коли ж Вас зацікавить, які видані книги з мови постскріпт, то нічого не треба шукати - достатньо звернутися до одного з каталогів. Тобто умовно можна сказати, що вони - засіб сфокусованого пошуку інформації, а пошукові сервери - розсіяного.
Попрацювавши трохи з різними каталогами, Ви напевно виберіть з них один, найбільш зручний і симпатичний Вам. Ви навчитеся швидко шукати в ньому інформацію, та інші колекції посилань Вам вже будуть здаватися непотрібними. З іншого боку, ніколи не буває достатньо одного пошукового сервера. По-перше, різні сервери охоплюють різні галузі інформації в Інтернет, частково перекриваються. Вони використовують розрізняються методи індексування документів і способи оцінки значущості слів у них. Якщо Ви не знайшли потрібну інформацію за допомогою одного з серверів, то досить великі шанси знайти за допомогою іншого. По-друге, існують спеціалізовані сервери пошуку по окремих типах ресурсів Інтернет (як, наприклад, система пошуку в мережевих новинах DejaNews), а існують універсальні, що охоплюють усі види сервісів.
Каталоги та пошукові сервери - дві сторони пошуку інформації в Інтернет. Вони різні за методами, але єдині в меті. Навчившись швидко використовувати один, найбільш відповідний для Вас, каталог та кілька хороших пошукових серверів, Ви отримаєте засіб швидкого і ефективного знаходження інформації у глобальній мережі.
Отже, якщо Ви займаєтеся комп'ютерами і читаєте по-англійськи, Інтернет може служити зручним і ефективним джерелом інформації у Вашій повсякденній діяльності. Якщо Ви почнете користуватися його ресурсами, то напевно скоро виробить свої звички і методи роботи в електронному світі.
Підводячи підсумок, можна сказати, що єдиної оптимальної схеми пошуку в Інтернет не існує. У залежності від специфіки необхідної вам інформації, для її пошуку ви повинні використовувати відповідні пошукові служби. У принципі, звичайно, можна завжди користуватися якою-небудь однією пошуковою системою, наприклад Rambler, але чим грамотніше підібрані пошукові служби та складено запит на пошук інформації, тим якісніше будуть результати пошуку. А в бізнесі якість інформації відіграє далеко не останню роль.
"Глобальні мережі: КВАЛІФІКАЦІЙНА і сpедства доступу" (пеpевод EARN "Guide to Network Resource Tools"), ПДТУ, Пеpмь, 1994 р.
Бpежнев А.Ф., Смілянський P.Л., Чумаков Н.Є. Протоколів TCP / IP / / В зб. "Технології електронним комунікацій", т. 3, 1999, с. 71-129. URL ftp://ftp.elvis.ru/pub/doc/tcpip/tcp-russ.arj або через WWW: http://www.mark-itt.ru/FWO/tcpip/index.html
Іванніков А.Д., Іжванов Ю.Л., Кулагін В.П. Перспективи використання WWW-технології у вищій школі Росії / / Інформаційні технології, 1996. № 2. С. 24-29.
Інформатика: підручник / під. ред. проф. Н.В. Макарової. - М.: Фінанси і статистика, 1997.
Використання Інтернет: Пер. з англ. / Дж. Хонікат, М.Р. Браун, Т. Фронцковяк та ін - 4-е вид. - К.; М.; СПб: Издат. дім "Вільямс", 1998. - 592с.: Іл.
Левін Д., Барода К. Секрети Internet: Пер. з англ. К.: "Діалектика", 1996. 544 з.
Норенков І.П. За WWW-сторінок навчальних серверів. Комп'ютерне навчальний посібник "Телекомунікаційні технології та обчислювальні мережі" на сервері Центру дистанційного навчання МГТУ ім. Н.Е. Баумана / / Інформаційні технології, 1997. № 3. С. 44-45.
Семенов Ю.А. Протоколи і ресурси Internet. М.: Радіо і зв'язок, 1996. 320 с.
Спейнаур С., Куерсіа В. Довідник Web-майстра: Пер. з англ. К.: BHV, 1997. 368 с.
Храмцов П.Б. Лабіринт Internet. Практичне керівництво. М.: "Електроінформ", 1996. 256 с.
Нравится материал? Поддержи автора!
Ещё документы из категории информатика:
Чтобы скачать документ, порекомендуйте, пожалуйста, его своим друзьям в любой соц. сети.
После чего кнопка «СКАЧАТЬ» станет доступной!
Кнопочки находятся чуть ниже. Спасибо!
Кнопки:
Скачать документ