Використання фреймів та семантичних мереж для обробки природньої мови


Національний Університет “Києво-Могилянська Академія”










Реферат

на тему


Використання фреймів та семантичних мереж для обробки природньої мови”




Студента 5 курсу

Департаменту Комп. Технологій

Рабочого Володимира
















Київ, 2000









Зміст











Забезпечення взаємодії з ЕОМ на природній мові (ПМ) є найважливішою метою досліджень зі штучного інтелекту (ШІ). Бази даних, пакети прикладних програм та експертні системи, засновані на ШІ, потребують оснащення гнучким інтерфейсом для численних користувачів, що не бажають спілкуватися із комп'ютером на штучній мові. У той час як багато фундаментальних проблем у області опрацювання ПМ (Natural Language Processing, NLP) ще не вирішені, прикладні системи можуть мати інтерфейс, що розуміє ПМ за певних обмежень.

Існують два види і, отже, дві концепції опрацювання природної мови:

  • для окремих речень;

  • для ведення інтерактивного діалогу.

Обробка природньої мови


Обробка природної мови - це формулювання та дослідження комп'ютерно-ефективних механізмів для забезпечення комунікації з ЕОМ на ПМ. Об'єктами досліджень є:

  1. власне природні мови;

  2. використання ПМ як для комунікації між людьми, так і для комунікації людини з ЕОМ.


Мета досліджень - створення комп'ютерних-ефективних моделей комунікації на ПМ. Саме така постановка задачі відрізняє NLP від задач традиційної лінгвістики та інших дисциплін, що вивчають ПМ, і дозволяє віднести її до області ШІ. Проблемою NLP займаються дві дисципліни: лінгвістика та когнітивна психологія.


Традиційно лінгвісти займалися створенням формальних, загальних, структурних моделей ПМ, і тому віддавали перевагу таким моделям, що дозволяли виявляти якнайбільше мовних закономірностей і робити узагальнення. Практично жодної уваги не приділялося придатності моделей з точки зору комп'ютерної ефективності їх застосування. Таким чином, виявилося, що лінгвістичні моделі, характеризуючи власне мову, не розглядали механізми його породження і розпізнавання. У цьому випадку, гарним прикладом постає породжуяча граматика Хомського, що виявилася абсолютно негожою на практиці у якості бази для комп'ютерного розпізнання ПМ.


Для когнітивної психології метою є не моделювання структури мови, а її використання. Спеціалісти цієї галузі також не приділяли великого значення проблемі комп'ютерної ефективності


Виділяють загальну і прикладну NLP. Метою.загальної NLP є розробка моделей використання мови людиною, які б за цієї умови залишалися комп'ютерно-ефективними. Базовим для цього є загальне розуміння текстів, як це визначається у роботах Чарняка, Шенка, Карбонелла та ін. Без сумніву, загальна NLP потребує величезних знань про реальний світ, і більша частина робіт зосереджена на представлені таких знань і їх застосування із метою розпізнаванні повідомлення, що надходить на ПМ. На сьогоднішній день, ШІ ще не досяг такого рівня розвитку, коли для вирішення подібних задач у великому обсязі використовувалися б знання про реальний світ, а відтоді існуючі системи можна називати лише експериментальними, оскільки вони працюють з обмеженою кількістю старанно відібраних шаблонів на ПМ.


Прикладна NLP займається звичайно не моделюванням, а безпосередньо можливістю комунікації людини з ЕОМ на ПМ. У цьому випадку вже не так важливо, як введений вираз буде зрозумілим з точки зору знань про реальний світ, а важливим є одержання інформації про те, чим і як може бути корисною для користувача ЕОМ (прикладом може бути інтерфейс експертних систем). Крім розуміння ПМ, у таких системах важлим є також розпізнання помилок та їх корекції.


Семантичні мережі.


Семантична мережа – це структура для уявлення знань у виді вузлів, сполучених дугами. Найперші семантичні мережі були розроблені в якості мови-посередника для систем машинного перекладу, а багато сучасних версій навіть зараз подібні по своїх характеристиках до природньої мови. Проте, останні версії семантичних мереж стали більш потужними і гнучкими та складають конкуренцію фреймовым системам, логічному програмуванню й іншим мовам представлення.


Починаючи з кінця 50-ых років, на практиці були створені і застосовані десятки варіантів семантичних мереж. Незважаючи на те, що їх термінологія та структура відрізняються, проте існують збіжності, що притаманні практично всім семантичним мережам:


1. вузли семантичних мереж являють собою концепти предметів, подій, станів;

2. різноманітні вузли одного концепту відносяться до різних значень, якщо вони не пізначені як такі, що вони відносяться до одного концепту;

3. дуги семантичних мереж утворюють відношення між вузлами-концептами (позначки над дугами вказують на тип відношення);

4. деякі відношення між концептами являють собою лінгвістичні відмінки, такі, як: агент, об'єкт, реципієнт та інструмент (інші означають тимчасові, просторові, логічні відношення та відношення між окремими реченнями;

5. концепти організовані по рівнях у відповідності зі ступенем узагальненості. Наприклад, сутність, жива істота, тварина, хижак;


Проте, існують і відміності: розуміння значення з точки зору філософії; методи представлення кванторов спільності й існування та логічних операторів; засоби маніпулювання мережами та правила виводу, термінологія. Все це змінюється від автора до автора. Недивлячись не деякі відмінності, мережі зручно читаються та обробляються комп'ютером, а також є досить потужними для того, щоб уявити семантику природної мови.


Історична нотатка


Фрег уявив логічні формули у вигляді дерев, які, проте, слабо нагадують сучасні семантичні мережі. Ще одним піонером став Чарльз Сандерз Прис, що використовував графічні записи в органічній хімії. Він сформулював правила виводу із використанням екзістенційних графів.


У психології Сальтисон використовував графи для подання спадкоємності деяких характеристик у ієрархії концептів. Наукові дослідження Сальтисону мали величезний вплив на вивчення тактики шахів. Він, у свою чергу, вплинув на таких теоретиків, як Саймон і Ньюэлл.


Що стосується лінгвістики, то першим вченим, який займався розробкою графічних описів, став Теньер. Він використовував графічний запис для власної граматики залежностей. Теньер зробив величезний вплив на розвиток лінгвістики в Європі.

Вперше семантичні мережі були використані у системах машинного перекладу наприкінці 50-х - початку 60-х років. Перша така система, яку створила Мастерман, містила біля 100 примітивних концептів таких, як, наприклад, НАРОД, РІЧ, РОБИТИ, БУТИ. За допомогою цих концептів вона зробила опис словнику обсягом 15000 одиниць, у якому також існував механізм для переносу характеристик з гіпертипу на підтип. Деякі системи машинного перекладу базувалися на кореляційних мережах Цеккато, що являли собою набір із 56 різноманітних відношень, деякі з який - відмінкові відношення, відношення підтипу, часток, частини та цілого. Він використовував мережі, що складалися з концептів та відношень, для управління діями парсера та вирішення неоднозначностей.


У системах штучного інтелекту семантичні мережі використовуються для отримання відповедей на різноманітні запитання, вивчення процесів навчання, запам'ятовування та міркувань. Наприкінці 70-х мережі стали широко поширеними. У 80-х роках межа між мережами, фреймовыми структурами і лінійними формами запису поступово зникали. Сила виразності більше не є вирішальним аргументом на користь вибору мереж або лінійних форм запису, оскільки ідеї записані за допомогою однієї форми запису можуть бути легко переведені в іншу. І навпаки, особо важливе значення отримали другорядні чинники такі, як: читаність, ефективність, нештучність та теоретична елегантність. До уаги також береться легкість введення в комп'ютер, редагування та роздрук.


Реляційні графи.


Найпростіші мережі, які використовуються в системах штучного інтелекту – це реляційні графи. Вони складаються з вузлів, що сполучені дугами. Кожний вузол являє собою поняття, а кожна дуга - відношення між різноманітними поняттями. На малюнку 1 подане речення “Собака жадібно гризе кістку”. Чотири прямокутники подають поняття собаки, процесу гризіння, кістки і такої характеристики, як жадібність. Надписи над дугами означають, що собака є агентом грізіння, кістка є об'єктом гризіння, а жадібність - це манера гризіння.


Термінологія, що використовується в цій області різноманітна. Для того, щоб отримати деяку однорідність, вузли, сполучені дугами, слід називати графами, а структуру, де є ціле гніздо з вузлів або де існують відношення різноманітного порядку між графами, зветься мережею. Окрім термінології, що використовується для пояснення, також різняться засоби зображення. Інколи використовуються кружечки замість прямокутників; іноді пишуться типи відношень одразу понад дугами, не розміщуючи їх в овали; іноді використовуються абревіатури, наприклад О чи А для позначення агента або об'єкта; іноді використовуються різноманітні типи стрілок. На малюнку 2 зображений граф концептуальних залежностей Шенка. <=> означає агента. INGEST (поглинати) - один із примітивів Шенка: ЇСТИ - ПОГЛИНАТИ твердий об'єкт; ПИТИ - ПОГЛИНАТИ рідкий об'єкт; ДИХАТИ - ПОГЛИНАТИ газоподібний об'єкт. Додаткова скла зліва означає, що кістка передається із невказаного місця до собаки.


Оскільки досить складно ввести у комп'ютер деякі діаграми, то багато вчених записують свої графи у більш компактному вигляді. Наприклад, те саме речення Сова запропонував записати в лінійному вигляді із використанням деяких елементів із малюнка 1:


[ЇСТИ]-

(AGNT) -> [СОБАКА]

(OBJ) -> [КІСТКА]

(MANR) -> [ЖАДІБНІСТЬ]


У цьому варіанті запису квадратні дужки позначають поняття, а круглі дужки містять назви відношень. Всі лінійні форми запису дуже подібні до фреймових структур.


Графи із центром на дієслові.


Дієслова з'єднуються із групою іменника з використанням відмінкових відношень. Наприклад, іу речені “Mary gave a book to Fred”, Mary агент даванія, book об'єкт цього процесу, а Fred реципієнт дієслова “давати”. Окрім відмінкових відношень у речені поданого природньою мовою також є засоби для зв'язку окремих речень. Такі відношення необхідні у таких випадках:


Союзи. Самий простий спосіб з'єднати речення - це поставити між ними союз. Деякі ссоюзи, як наприклад “і”, “або”, “якщо” позначають логічний зв'язок; деякі, такі як “після того, як”, “коли”, “поки”, “з того часу, як” і “тому що”, висловлюють тимчасові відношення і причину.


Дієслова, які потребують підпрядне речення. Відмінкові фреймы багатьох дієслів потребують підрядні реченя, яке, як правило, є звичайно прямим додатком. До такого типу відносяться дієсловаговорити”, “вважати”, “міркувати”, “знати”, “бути переконаним”, “загрожувати”, “намагатися” та ін.


Визначники, що відносяться до усього речення. Багато прислівників та пропозициійних фраз відносяться тише до дієслова, але деякі визначають повне речення. Такі прислівники, як “звичайно”, “мабуть”, у більшості випадків ставляться на початку речення. Хоча, наприклад, слово “одного разу” визначає усю розповідь, що йде після нього.


Модальні дієслова та часові форми. Такі дієслова, як “may”, “can”, “must”, “should”, “would” і “could” мають модальне значення і відносяться до усього речення, у якому вони зустрічаються. Тимчасове відношення може бути виражено як формою минулого часу дієслів, так і обставинами “зараз”, “завтра” або “якось” та іншими.


Пов'язаний дискурс. Окрім відношень, поданих у одному речені, існують також відношення більш високого порядку між окремими реченнями доповіді або розповіді якогось іншого виду. Більшість з них не виражені експліцитно: часові відношення та порядок аргументів може бути, наприклад, імпліцитно подано порядком слідування речень у тексті.


Саме тому, що дієслову приділяється така важлива роль у речені, багато теорій роблять його своїм центральним з’єднувальною ланкою. Цей підхід бере започатковано із Індо-Європейской мовної родини, для якої модальність та часові відношення подаються зміною дієслівної форми. Розглянемо такий приклад: “While a dog was eating a bone, a cat passed by unnoticed”. У цьому речені повідомляється, що, коли речення “While a dog was eating a bone” справджувалось, інше речення “A cat passed unnoticed” також справджувалось. На малюнку 3 зображено граф із центром на дієслові. Союз “while” (WHL) з'єднує вузол PASS-BY із вузлом EAT. На малюнку 3 показано, що собака є агентом не-помічання (not noticing).


Графи із центром у дієслові - це реляційні графи, для яких дієслово вважається центральною ланкою будь-якого речення. Маркери часу та відношення записуються безпосередньо поруч із концептами, які представляють дієслова. Графи концептуальних залежностей Роджера Шенка також використовують цей підхід.

Незважаючи на те, що графи із центром на дієслові досить гнучкі за своєю структурою, вони мають деякі обмеження. Одне з яких полягає в тому, що вони не проводять розмежування між визначниками, що відносяться тлише до дієслова, і визначниками, що відносяться до речення вцілому. Роздивимося такі приклади:


The dog greedily ate the bone.

Greedily, the dog ate the bone.


Ці графи також погано працюють з реченнями, що знаходяться усередині інших речень.


При роботі з реляційними графами виникають проблеми із передачею усього різноманіття часових відношень та відношень модальності. Незважаючи на те, що багато вчених використовують ці графи для вирішення складних проблем, вони так ще й досі не розробили загального методу їх розв’язку. У вище приведеному прикладі позначка PAST повинна відноситися до усього речення, якеньповідомляє про те, що собака їсть кістку, а не лише до дієслова EAT, оскільки видно, що кістка пізніше була з'їдена собакою цілком. Також повинно бути зазначено, що процес проходу кішки і процес не зваження її собакою відбувалися одночасно.


Пропозиційні мережі


У пропозиційних мережах вузли ппредставляють цілі речення Ці вузли є точками дотику для відношень між окремими реченнями зв'язаного тексту. З іншого боку вони визначають час і модальність для всього контексту. Подані нижче приклади ілюструють відношення, для запису яких необхідне використання пропозиційних вузлів:


Sue thinks that Bob believes that a dog is eating a bone.

If a dog is eating a bone, it is unwise to try to take it away from him.


У першому реченні для дієслів “think” і “believe” ціле реченя є доповненням: Боб вважає, щоА dog is eating a bone”, те, що думає Сью являє собою більш складне речення-“Bob believes that a dog is eating a bone”. Таке гніздування речень поміж інших речень може повторюватися як умога велику кількість разів. Щоб зобразити таке речення, необхідно використовувати пропозиційні вузли, що містять гніздящіся графи. На малюнку 4 зображено пропозиційну мережу для цього речення. Відзначимо, що (EXP) - experiencer, тобто той хто відчуває, з'єднує THINK із Сью, а BELIEVE із Бобом, проте EAT і DOG сполучені між собою агентивним відношенням (AGNT). Такі різні типи відношень спричиняє той факт, що думати та вважати-це стани, у яких знаходяться люди, а поїдання-це дія, яка здійснюється агентом.


В другому прикладі наводяться два речення, що знаходяться у відношенні умови. Антецедентом є реченняА dog is eating a bone”, а консеквентом речення “It is unwise to try to take it away from him”. Інфінітиви “to try” і “to take” вказують на інші речення, що гніздяться. На речення, що гніздяться, також вказує оборот “it is unwise”. Для цього речення також необхідно визначити відповідність між “it”, “him” та “bone” і “dog”. Зв'язки відповідності позначені пунктиром. Для формального запису цього речення також використовуються квантори спільності та існування і деякі елементи логіки.


Усі реляційні графи із центром у дієслові мають багато спільного. Проте серед них існують також і відмінності:

1. Вмикання контексту або його лише умовне позначення із посиланням на схемі.

2. Суворе гніздування: той самий концепт може або не може зустрічатися в двох різних контекстах, жодний із який не гніздитися в іншому.

3. Вказання зв'язків відповідності. При перехресному контексті, тобто коли той самий концепт зустрічається в двох різних контекстах, ці зв'язки не вказуються.

Проте це усього лише стилістичні розбіжності, що не впливають істотно на логіку побудови.


Ієрархія типів


Ієрархія типів і підтипів є стандартною характеристикою семантичних мереж. Ієрархія може містити сутності: ТАКСА<СОБАКА<ХИЖАК<ТВАРИНА<ЖИВА ІСТОТА<ФІЗИЧНИЙ ОБ'ЄКТ<СУТНІСТЬ. Вони також можуть містити події: ЖЕРТВУВАТИ<ДАВАТИ<ДІЯ<ПОДІЯ або стани: ЕКСТАЗ<ЩАСТЯ<ЕМОЦІЙНИЙ СТАН<СТАН. Ієрархія Аристотеля містила 10 базових категорій: субстанція, кількість, якість, відношення, місце, час, стан, активність і пасивність..


Символ < між більш загальним і більш частинним символом читається як: “Х-тип/підтип У”.

Термін “ієрархія” позначає часткове упорядкування, у якому одні типи є більш загальними, ніж інші. Упорядкування є частковим, тому, що багато типів просто не підлягають порівнянню між собою. Порівняння HOUSEбезглузді, якщо їх порівнювати, проте слово DOGHOUSE є підтипом HOUSE, але не DOG. Розглянемо деякі види графів:


Ациклічний граф. Будь-яке часткове упорядкування може бути зображено, як граф без циклів. Такий граф має гілки, що розбігаються та збігаються знову, що дозволяє деяким вузлам мати декілька вузлів-батьків. Іноді такий тип графа називають плутаним.


Дерева. Найпоширенішим видом ієрархії є граф з однією вершиною. У таких графах накладються обмеження на ациклічні графи: вершина графа являє собою один загальний тип, і кожний інший тип Х має лише одного батька У.


Ришітка. На відміну від дерев, вузли ришітки можуть мати декілька вузлів батьків. Проте в данному випадку накладаються інші обмеження: будь-яка пара типів Х и У як мінімум повинна мати загальний гипертип ХіУ і підтип ХчиУ. Внаслідок цього обмеження ришітка виглядає, як дерево, що має головну вершину з кожного боку. Замість усього однієї вершини ришітка має одну вершину, що є гіпертипом усіх категорій, та іншу вершину, що є підтипом усіх типів.


Спадкування.


Основною властивістю ієрархії є можливість спадкування підтипами якостей гіпертипів: усі характеристики, що властиві ТВАРИНІ, також властиві ССАВЦЯМ, РИБІ і ПТИЦІ. У основі теорії спадкування лежить теорія силогізмів Аристотеля: Якщо А - характеристика У, а У - х-ка С, то А хар-ка усіх С.

Переваги ієрархії і спадкування:

Ієрархія типів є відмінною структурою для індексування бази знань та її ефективної організації.

Проходження по будь-якої гілки здійснюється набагато швидше за допомогою ієрархії.


Синтаксичний аналіз мови та його породження.


Семантичні мережі можуть допомогти парсеру розв'язати семантичну невизначенність. Без такого типу представлення уся вага аналізу мови падає на синтаксичні правила і семантичні тести. Структура ж семантичної мережі ясно показує, як окремі концепти сполучені між собою. Коли парсер зустрічає деяку невизначеність, він може використовувати семантичну мережу для того, щоб вибрати той або інший варіант. При роботі із семантичними мережами використовується декілька технік парсингу.


Парсинг, в основі якого лежить синтаксис. Робота парсера контролюється граматикою безпосередніх складових і операторами побудови структур та їх тестування. У той час, як дані на вході аналізуються, оператори побудови структур створюють семантичну мережу, а оператори тестування перевіряють обмеження на частково побудованій мережі. Якщо незнайдено жодних обмежень, то правило, що при цьому використовувалось, відхиляється і парсер перевіряє іншу можливість. Це найпоширеніший підхід.


Синтаксичний аналізатор із використанням семантики. Синтаксичний аналізатор із використанням семантики оперує також як і парсер, в основі якого лежить синтаксис. Проте він оперує не з синтаксичними категоріями типу група підмету і група присудку, а з концептами високого рівня типу КОРАБЕЛЬ і ПЕРЕВОЗИТИ.


Концептуальний парсинг. Семантична мережа прогнозує можливі обмеження, що можуть зустрітися у відношеннях між словами, а також прогнозувати слова, що пізніше можуть зустрітися у речені. Наприклад, дієслово давати потребує одухотвореного агента й а також прогнозує можливість реципієнту та об'єкту, що буде дан. Шенк був одним із самих активних прихильників концептуального парсингу.


Парсинг, заснований на експертизі слів. Внаслідок існування великої кількості невірних утворень у природній мові, багато людей замість того, щоб звертатися до деяких універсальних узагальнень, використовують спеціальні словники, що являють собою сукупність деяких незалежних процедур, що називаються експертами слів. Аналіз речення розглядається як процес, що здійснюється спільно різноманітними словниковими експертами. Головним прихильником цього підходу був Смол.


Аргументи за і проти різноманітних технік парсингу часто засновувався не на конкретніих дані, а здебільшого на стійкій думці. І лише один проект на практиці порівняв декілька видів парсингу - це Мова Семантичних Репрезентацій, проект розроблений в Університеті Берліна. Протягом декількох років вони створили чотири різних види парсеров для аналізу німецької мови і його запису на Мові Семантичних Репрезентацій, що являє собою мережу.


Першим парсером був парсер, створений подібно до концептуального парсера Шенка. Було відзначено, що хоча додавання нових слів в його лексикон було досить легким процесом, проте аналіз міг проводитися тільки на простих реченнях і тільки відносних підрядних. Розширити область синтаксичного опрацювання цього парсера виявилося складною задачею.

Інший парсер був семантично орієнтований на розширені мережі переходу. У ньому було легше узагальнити синтаксис, проте апарат синтаксису працював повільніше, ніж у першого розглянутого парсера.


Потім робота проводилася з парсером словникових експертів. Тут легко проводилося опрацювання особливих випадків, проте розкиданість грамматики між окремими складовими робила практично неможливим її загальне розуміння, підтримку і модифікування.


Парсер, що був створений порівняно нещодавно, - це синтаксично-орієнтований парсер, заснований на загальній граматиці фразової структури. Він найбільше систематичен і узагальнений та відносо швидкий.


Ці результати в принципі відповідають думці інших лінгвістів: синтаксично-орієнтовані парсери є найбільш цілісними, проте для них необхідний визначений набір мережевих операторів для плавної взаємодії між граматикою і семантичними мережами.


Породження мови за семантичною мережею являє собою зворотній парсинг. Замість синтаксичного аналізу деякого ланцюга з метою породження мережі, генератор мови робить парсинг мережі для одержання деякого ланцюжка. Існує два варіанти породження мови із семантичної мережі.

1. Генератор мови просто проходить по мережі, перетворюючи концепти в слова, а відношення, зазначені поруч із дугами, у відношення природної мови. Цей метод має багато обмежень.

2. Підходи, орієнтовані на синтаксис, контролюють породження мови за допомогою граматичних правил, що використовують мережу для того, щоб визначити, яке таке правило потрібно застосувати.


Проте на практиці обидва методи мають багато збіжностей: наприклад, перший спосіб являє собою послідовність вузлів, що обробляються генератором мови, орієнтованим на синтаксис.


Машина реалізація.


Графи і мережі являють собою прості поняття для програм, що вивчають нові структури. Їх перевага при навчанні полягає в легкості додання і видалення, а також порівняння дуг і вузлів. Нижче подані програми, які використовували семантичні мережі для навчання.


Вінстон використовував реляційні графи для опису таких структур, як арки і вежі. Машині пропонувалися приклади вірного і невірного опису цих структур, а програма створювала графи, що вказували на усі необхідні умови для того, щоб ця структура була саме аркою або вежею.



Салветер використовував графи з центром на дієслові для представлення відмінкових відношень, що потребують різні дієслова. Його програма MORAN для кожного дієслова виводила відмінковий фрейм, порівнюючи ті самі ситуації до і після їх опису із використанням цього дієслова.


Шенк розробив теорію Memory-Organization Packets для пояснення того, як люди дізнаються про нову інформацію з конкретних життєвих ситуацій. При цьому MOP-це це узагальнена абстрактна структура, що окремо не має відношення ні до жодної ситуації.


Практичні використання.


Семантичні мережі можуть бути записані практично на будь-якій мові програмування на будь-якій машині. Найбільш популярні в цьому відношенні мови - це LISP і PROLOG. Проте, багато версій були створені і на FORTRANі, PASCALі, C та інших мовах програмування. Для збереження усіх вузлів і дуг необхідно мати значний обсяг пам'яті, хоча перші системи були реалізовані у 60-х роках на машинах, що були набагато менше і повільніше сучасних комп'ютерів.


Одна із найпоширеніших мов, розроблених для запису природної мови у вигляді мереж, - це PLNLP (Programming Language for Natural Language Processing) Мова Програмування для Обробки Природної Мови, створена Хайдерном. Ця мова використовується для роботи з великими грамматиками, що мають велике покриття. PLNLP працює із двома видами правил:

1. за допомогою правил декодування проводиться синтаксичний аналіз лінійного мовного ланцюга і будується мережа.

2. за допомогою правил кодування сканується мережа та породжується мовний ланцюжок або інша трансформована мережа.


Окрім спеціальних мов для семантичних мереж було також розроблено спеціальне апаратне забезпечення. На звичайних комп'ютерах можуть бути успішно виконані операції з мовами синтаксичного аналізу й операції сканування мереж. Однак для великих баз знань час пошуку потрібних правил або доступу до предзнань може бути значним. Для того, щоб дозволити різноманітним процесам пошуку виконуватися одночасно Фальман розробив систему NETL, що являє собою семантичну мережу, що може використовуватися з паралельним апаратним забезпеченням. У такий спосіб він хотів створити модель людського мозку, у якому сигнали можуть рухатися по різноманітних каналах одночасно. Інші вчені розробили паралельне програмне забезпечення для пошуку найбільше ймовірної інтепретації двозначних фраз природної мови.

Теорія фреймів

- це парадигма для представлення знань із метою використання цих знань комп'ютером . Вперше була представлена Мінським як спроба побудувати фреймовую мережу , або парадигму з метою досягнення більшого ефекту розуміння . З одного боку Мінський намагався сконструювати базу даних , що містить енциклопедичні знання , але з іншого боку, він хотів створити найбільш описову базу , що зберігає інформацію в структурованій і впорядкованій формі . Ця структура дозволила б комп'ютеру вводити інформацію в більш гнучкій формі , маючи доступ до того розділу, який потрібний в даний момент . Мінський розробив таку схему , у якій інформація утримується в спеціальних осередках , називаних фреймами , об'єднаними в мережу , названу системою фреймов . Новий фрейм активізується з винекненням нової ситуації . Його відмінною рисою є те , що він одночасно містить великий обсяг знань і в той же час є достатньо гнучким для того, щоб бути використаним як окремий елемент БД . Термін «фрейм» був найбільше популярний у середині сімдесятих років , коли існувало багато його тлумачень , відмінних від інтепретації Мінського .

Щоб краще зрозуміти цю теорію , розглянемо один із прикладів Мінського , оснований на зв'язку між чеканням , відчуттям і почуттям людини , коли він відчиняє двері і входить у кімнату . Припустимо , що ви збираєтеся відчинити двері і зайти в кімнату незнайомого вам дома . Знаходячись у будинку , перед тим як відчинити двері , у вас є певні уявлення про те, що ви побачите , увійшовши в кімнату . Наприклад , якщо ви побачите деякий пейзаж чи морський берег , то спочатку ви майже не впізнаєте їх . Потім ви будете здивовані , і зрештою дезорієнтовані , оскільки ви не зможете пояснити інформацію, що надійшла, і зв'язати її з тими уявленнями , що у вас були до того . Також у вас виникнуть ускладнення з тим , щоб предбачити подальший хід подій. З аналітичної точки зору це можна пояснити як активізацію фрейма кімнати в момент відчинення дверей і його головної ролі в інтепретації інформації, що надходить . Якби ви побачили за дверми ліжко , то фрейм кімнати придбав би більш вузьку форму і перетворився б у фрейм ліжка . Іншими словами , ви б мали доступ до найбільш специфичного фрейму з усіх доступних . Можливо, б що ви використовуєте інформацію , що міститься у вашому фреймі кімнати для того щоб розпізнати меблі , що називається процесом зверху-униз , або в контексті теорії фреймов фреймодвижущім розпізнанням . Якби ви побачили пожежний гідрант , то ваші відчуття були б аналогічні першому випадку. Психологи помітили , що розпізнавання об'єктів легше проходить у звичайному контексті, ніж у нестандартній обстановці . З цього прикладу ми бачимо , що фрейм - це модель знань , що активізується у визначеній ситуації і служить для її пояснення і придбачення . У Мінського були достатньо розпливчасті ідеї про саму структуру БД, що могла б виконувати подібні речі . Він запропонував систему , що складається з пов'язаних між собою фреймів , багато з яких складаються з однакових підкомпонентів , об'єднаних у мережу . Таким чином, у випадку , коли будь-хто входить у будинок , його чекання контролюються операціями , що входять у мережу системи фреймов . У розглянутому вище випадку ми маємо справу з фреймовою системою для будинку , і з підсистемами для дверей і кімнати . Активізовані фрейми з додатковою інформацією в БД про те, що ви відчиняєте двері , будуть служити переходом від активізованого фрейма дверей до фрейму кімнати . При цьому фрейми дверей і кімнати будуть мати однакову підструктуру . назвав це явище поділом терміналів і вважав його важливою частиною теорії фреймів .

Мінський також впровадив термінологію , що могла б використовуватися при вивченні цієї теорії ( фрейми , слоти , термінали і т.д.). Хоча приклади цієї теорії були розподілені на мовні і перцептуальні , і Мінський розглядав їх як так, що мають загальну природу , у мові є більш широка сфера її застосування . Як правило більшість досліджень було зроблено в контексті загальновживаної лексики і літературної мови .

Як найбільше доступну ілюстрацію розпізнанню , інтепретації і припущенню можна розглянути дві послідовності речень, взятих із Шранка й Абельсона . На глобальному рівні послідовність А явно відрізняється від В.

A John went to a restaurant

He asked the waitress for a hamburger

He paid the tip & left

B John went to a park

He asked the midget for a mouse

He picked up the box & left

Хоча всі ці речення мають однакову синтаксичну структуру і тип семантичної інформації , розуміння їх кардинально відрізняється. Послідовність А має доступ до деякого виду структури знань вищого рівня , а В не має . Якби А не мало такого доступу, то її розуміння зводилося б до рівня В і характеризувалося б як дезорієнтоване. Цей контраст є наочним прикладом миттєвої роботи вищого рівня структури знань .

Була запропонована програма за назвою SAM , що відповідає на питання і видає утримання таких розповідей . Наприклад , SAM може відповісти на такі питання , відповіді на який не дані в тексті , за допомогою доступу до запису згаданих подій , що передують обіду в ресторані .

Did John sit down in the restaurant ?

Did John eat the hamburger ?

Таким чином, SAM може розпізнати описану ситуацію як обід у ресторані і потім предбачити оптимальний розвиток подій. У нашому випадку розпізнання не було тяжким, але в більшості випадків воно досить непросте і є самою важливою частиною теорії .

Розглянемо інший приклад :

C He plunked down $5 at the window .

She tried to give him $ 2.50 , but he wouldn't take it .

So when they got inside , she bought him a large bag of popcorn .

Він цікавий тим , що в більшості людей він викликає цикл повторюваних неправильних або незакінчених розпізнавань і реінтерпретацій .

У випадках із багатозначними словами, багатозначність розв’язується за допомогою активізованого раніше фрейму. Для цих цілей необхідно створити лексикон до кожному фрейму . Коли фрейм активізується, відповіднному лексикону віддається превага при пошуку відповідного значення слова . У контексті ТФ - це розпізнавання процесів , контрольованих фреймами , які , у свою чергу , контролюють розпізнавання вхідної інформації . Іноді це називається процесом зверху-вниз фреймодвижущого розпізнавання.



Застосування цих процесів знайшло відбиття у програмі FRAMP , що може сумувати газетні зведення і класифікувати їх у відповідність із класом подій , наприклад тероризм або землетруси . Ця програма зберыгає набір об'єктів , що повинні бути описані в кожному різновиді текстів , і цей набір допомагає процесу розпізнання подій, що описуються.

Розпізнання


У літературі є багато міркувань із приводу процесів , що стосуються розпізнання фреймов і доступу до структури знань вищого рівня . Незважаючи на те , що люди можуть розпізнати фрейм без особливих зусиль , для комп'ютера, в більшості випадків, це досить складна задача . Тому питання розпізнавання фреймов залишаються відкритими і важкими для вирішення за допомогою ШІ .

Розмір фрейму


Розмір фрейму набагато більш тісно пов'язаний з організацією пам'яті , ніж це здається на перший погляд . Це відбувається тому , що в розумінні людини розмір фрейма визначається не стільки семантичним контекстом , але і багатьма іншими чинниками. Розглянемо фрейм візиту до доктора, що складається з підфреймів , одним із яких є кімната чекання. У такий спосіб ми можемо сказати , що розмір фрейму не залежить від семантичного значеня поданого фрейма / такого , як , наприклад , візит до лікаря / , але залежить від того , які компоненти описової інформації у фреймі / такому , як кімната чекання / використовуються в пам'яті. Це означає , що коли певний набір знань використовується пам'яттю більш ніж в одній ситуації, система пам'яті визначає це, потім модифікує цю інформацію у фрейм, і реструктруює вихідний фрейм так , щоб новий фрейм використовувався як його підкомпонента.

Перераховані вище операції також залишаються відкритими питаннями в ТФ .

Ініціалізаційні категорії


Рош запропонував три рівні категорій представлення знань: базову , субординатну і суперординаційну. Наприклад у сфері меблювання концепція крісла являє приклад категорії основного рівня, а концепція меблів - це приклад суперординаційної категорії. Мова представлення знань схильний до впливу цієї таксономії і включає їх як різноманітні типи даних. У сфері людського спілкування категорії основного рівня є найпершими категоріями , що дізнається людина , інші ж категорії випливають із них. Тобто суперординаційна категорія - це узагальнення базової , а субординатна - це підрозділ базової категорії .

приклад суперординатної ідеї події

базова події дії

субординатна дії прогулянка



Кожний фрейм має свій визначений так називаний слот . Так , для фрейма дія слот може бути заповнений тільки деяким виконавцем цієї дії , а сусідні фрейми можуть успадковувати цей слот .



Деякі дослідники припускають, що випадки граматики відмінків збігаються зі слотами в ТФ , і ця теорія була названа теорією ідентичності слота і відмінку . Була запропонована кількість таких відмінків , від 8 до 20 , але точне число не визначене . Однак, якщо агентив цілком збігається зі своїм слотом , то інші відмінки викликали суперечки . І дотепер точно не встановлено , скільки усього існує відмінків.

Також встворював ускладнення той факт , що слоти не завжди можуть бути перехідними. Наприклад , у відповідністю із ТФ можна сказати , що фрейм одухотворений предмет може мати слот живий , фрейм людина може мати слот чесний, а фрейм блоха не може мати такий слот , і він до нього ніколи не перейде .

Іншими словами , зв'язки між слотами в ТФ не є досліджуваними до кінця. Слоты можуть передаватися, можуть бути багатофункціональними , але в той же час не розглядаються як функції . Гібридні системи СФ іноді адаптуються для побудови описів або визначень . Була створена змішана мова , названа KRYPTON , що складається з фреймових компонентів і компонентів предикатних числень , що допомагають робити певні висновки за допомогою термінів і предикатів. Коли активізується фрейм , факти стають доступними користувачу . Також існує мова Loops , що об'єднує об'єкти , логічне програмування і процедури .

Існують також фреймоподібні мови , що за вихідну позицію приймають один тип даних у пам'яті , певну концепцію , а не дві / наприклад фрейм та слот / , і уявлення цієї концепції в пам'яті повинно бути суцільним .

Об'єктно - орієнтовані мови


Паралельно з мовами фреймів існують об’єктно - орієнтовані програмні мови , що використовуються для упорядкування програм , але мають деякі властивості мов фреймів , такі , як використання слотів для детальної , прискіпливої класифікації об'єктів. Відмінність їх від мов фреймів полягає у тому , що фреймові мови спрямовані на більш узагальнене уявлення інформації про об'єкт .

Однією з тяжких сторін уявлення знань і мови фреймів є відсутність формальної семантики . Це ускладнює порівняння властивостей представлення знань різноманітних мов фреймів , а також повне логічне пояснення мови фреймів .

Основні проблеми обробки природньої мови


Основною проблемою NLP є мовна неоднозначність. Існують різні види неоднозначності:

  1. Синтаксична (структурна) неоднозначність: у фразі Time flies like an arrow для ЕОМ не зрозуміло, чи йде мова про час, що летить, або про мух, тобто чи є слово flies дієсловом чи іменником.

  2. Значеннева неоднозначність: у фразі The man went to the bank to get some money and jumped in слово bank може означати як банк, так і берег.

  3. Відмінкова неоднозначність: предлог in у реченнях He ran the mile in four minutes/He ran the mile in the Olympics позначає або час, або місце, тобто подані цілком різноманітні відношення.

  4. Референційна неоднозначність: для системи, що не володіє знаннями про реальний світ, буде важко визначити, із яким словом - table або cake - співвідноситься займенник it у фразі I took the cake from the table and ate it.

  5. Літерація (Literalness): у діалозі Can you open the door? - I feel cold ні прохання, ані відповідь не виражені стандартним засобом. У інших обставинах на питання може бути отримана пряма відповідь yes/no, але в даному випадку в питанні імпліцитно виражене прохання відчинити двері.


Центральна проблема як для загальної, так і для прикладної NLP - дозвіл такого роду неоднозначностей - вирішується за допомогою перекладу зовнішнього представлення на ПМ в якусь внутрішню структуру. Для загальної NLP таке перетворення потребує набору знань про реальний світ. Так, для аналізу фрази Jack took the bread from the supermarket shelf, paid for it, and left і для коректної відповіді на такі питання, як What did Jack pay for?, What did Jack leave? та Did Jack have the bread with him when he left? необхідно знання про супермаркети, процеси покупки та продажу і деякі інші.


Прикладні системи NLP мають перевагу перед загальними, тому що працюють у вузьких предметних областях. Наприклад, системі, яка використовується продавцями в магазинах по продажу комп'ютерів, не потрібно ”роздумувати” над неоднозначністю слова terminals при запиті How many terminals are there in the order? .

Проте, створення систем, що мають можливість спілкування на ПМ в широких областях, можливо, хоча поки результати далекі від задовільних.

Технології аналізу природньої мови


Під технологією аналізу ПМ розуміється переклад деякого виразу ПМ у внутрішнє представлення. Фактично всі системи аналізу ПМ можуть бути розподілені на такі категорії: підбір шаблону (Pattern Matching), синтаксичний аналіз, семантичні граматики, аналіз за допомогою відмінкових фреймів, “чекай і дивися” (Wait And See), словниковий експертний (Word Expert), конекціониський, “ковзний” (Skimming) аналіз. Нижче піде мова про деякі найбільш поширені методи, описані у статті.


Підбір шаблону. Сутність даного підходу полягає в інтепретації вводу в цілому, а не в інтепретації змісту і структури його окремих складових на більш низькому рівні. При використанні цього методу відбувається порівняння вже наявних у системі шаблонів-зразків із текстом, що надійшов на вхід. Звичайно шаблони подані у вигляді простого списку відповідностей між класами висловлень і інтепретаціями. Іноді вони доповнені семантичними елементами або іншими компонентами більш високого рівня. За таким принципом працює система Эліза, що імітує діалог із психотерапевтом. У дійсності система нічого не розуміє, а лише підтримує діалог, порівнюючи репліки пацієнта із шаблонами і привласненими їм відповідними відповідними репліками, такими, як:

X завжди Y:

Ви можете привести який-небудь приклад?


Коли?


Дійсно, завжди?

X Ви Y мене:

Чому Ви думаєте, що я Y Вас?


Вам поддобається думати, что я Y Вас, чи не так?


Уявіть, що я Y Вас. Що Ви про це думаєте?

У результаті Эліза спроможна вести такий діалог:

Пац. :

Люди завжди пильно дивляться на мене.

Підбір за 1-м шаблоном з врахуванням завжди

Эл.:

Ви можете привести який-небудь приклад?

Перша відповідь за 1-м шаблоном

Пац. :

Наприклад, зараз ти дивишся на мене.

Підбір за 2-м шаблоном, Y=дивитись

Эл.:

Чому Ви думаєте, що я дивлюся на Вас?

Перша відповідь за 2-м шаблоном

Пац. :

Тому що ти ненавидиш мене.

Підбір за 2-м шаблоном, Y=ненавидіти

Эл.:

Вам подобається думати, що я ненавиджу Вас, чи не так? і т.д.

друга відповідь за 2-м шаблоном

Синтаксичний аналіз. При використанні синтаксичного аналізу відбувається інтепретація окремих частин висловлення, а не усього висловлення в цілому. Звичайно спочатку проводиться повний синтаксичний аналіз, а потім будується внутрішнє уявлення введеного тексту, або проводиться інтепретація.


Дерева аналізу і вільно-контекстні граматики. Більшість засобів синтаксичного аналізу реалізовано у виді дерев. Одним із найпростіших різновидів є вільно-контекстна граматика, що складається з правил типу S=NP+VP або VP=V+NP і вважається, що ліва частина правила може бути замінена на праву без урахування контексту. Вільно-контекстна граматика широко використовується в машинних мовах, і з її допомогою створено високоефективні методи аналізу. Хиба цього методу - відсутність заборони на граматично невірні фрази, де, наприклад, існує неузгодженність із присудком у числі. Для вирішення цієї проблеми необхідна наявність двох окремих граматик, що паралельно працюють: однієї - для числа однини, іншої - для числа множини. Крім того, необхідна власна граматика для пасивних речень і т.д. Семантично невірне речення може породити величезну кількість варіантів розбору, із яких один буде перетворений у семантичний запис. Все це робить кількість правил величезним і, у свою чергу, вільно-контекстні граматики негожими для NLP.


Трансформаційна граматика. Трансформаційна граматика була створена з урахуванням згаданих вище хиб і більш раціонального використання правил ПМ, але виявилася негожою для NLP. Трансформаційна граматика створювалася Хомским як породжуюча, що, відповідно, ускладнювало обернену дію, тобто аналіз.


Розширена мережа переходів. Розширена мережа переходів була розроблена Бобровим (Bobrow), Фрейзером (Fraser) і багато в чому Вудсом (Woods) як продовження ідей синтаксичного аналізу і вільно-контекстних граматик зокрема. Вона являє собою вузли і спрямовані стрілки, що “розширені” (тобто доповнені) низкою тестів (правил), на підставі яких вибирається шлях для подальшого аналізу. Проміжні результати записуються в комірки(регістри). Нижче приводиться приклад такої мережі, що дозволяє аналізувати прості речення всіх типів (включаючи пасив), що складаються з підмета, присудка і прямого доповнення, таких, як The rabbit nibbles the carrot (Кролик гризе моркву). Позначення біля стрілок означають номер тесту, а також чито ознаки, аналогічні застосовуваним у вільно-контекстних граматиках (NP), чито конкретне слово (by). Тести написані на мові LISP і являють собою правила типу якщо умова=істина, то привласнити аналізованому слову ознака Х и записати його у відповідну комірку.

Розберемо алгоритм роботи мережі на вищенаведеному прикладі. Аналіз починається зліва, тобто з першого слова в речені. Словосполучення the rabbit проходить тест, що з'ясовує, що воно не є допоміжним дієсловом (Aux, стрілка 1), але є іменною групою (NP, стрілка 2). Тому the rabbit кладеться в комірку Subj, і реченя отримує ознаку TypeDeclarative, тобто оповідальне, і система переходить до другого вузла. Тут додатковий тест не потрібен, оскільки він відсутній у списку тестів, записаних на LISP. Отже, слово, що стоїть після the rabbit - тобто nibbles – це дієслово-присудок (позначення V над стрілкою), і nibbles записується в комірку з ім'ям V. Перекреслений вузол означає, що в ньому аналіз реченя може в принципі закінчитися. Але в нашому випадку є ще і доповнення the carrot, так що аналіз продовжується по стрілці 6 (вибір між стрілками 5 і 6 здійснюється знову за допомогою спеціального тесту), і словосполучення the carrot кладеться в комірку з ім'ям Obj. На цьому аналіз закінчується (останній вузол був би використаний у випадку аналізу такого пасивного речення, як The carrot was nibbled by the rabbit). Таким чином, у результаті заповнені регістри (комірки) Subj, Type, V та Obj, використовуючи які, можна одержати деяке уявлення (наприклад, дерево).


  1. Розширена мережа переходів має власні хиби: немодульность;

  2. складність при модифікації, що викликає непередбачені побічні ефекти;

  3. тендітність (коли єдина неграматичность у пропозиції унеможливлює подальший правильний аналіз);

  4. неефективність при переборі з поверненнями, тому що помилки на проміжних стадіях аналізу не зберігаються;

  5. неефективність з точки зору змісту, коли за допомогою отриманого синтаксичного представлення виявляється неможливим створити правильне семантичне уявлення.

Семантичні граматики. Аналіз ПМ, заснований на використанні семантичних граматик, дуже схожий на синтаксичний, із тієї різницею, що замість синтаксичних категорій використовуються семантичні. Природньо, семантичні граматики працюють у вузьких предметних областях. Прикладом може постати система Ladder, яка вмонтована в базу даних американських судів. Її граматика містить записи типу:

S ? the of

? what is|[can you] tell me

? the | class ship

Така граматика дозволяє аналізувати такі запити, як Can you tell me the class of the Enterprise? (Enterprise - назва корабля). У даній системі аналізатор складає на основі запиту користувача запит на мові бази даних.

Хиби семантичних граматик виявляються в тому, що, по-перше, необхідна розробка окремої граматики для кожної предметної області, а по-друге, вони дуже швидко збільшуються в розмірах. Засоби виправлення цих хиб - використання синтаксичного аналізу перед семантичним, застосування семантичних граматик тільки в рамках реляційних баз даних з абстрагуванням від загальномовних проблем і комбінація декількох методів (включаючи власне семантичну граматику).


Аналіз за допомогою відмінкових фреймів. Із створенням відмінкових фреймів пов'язаний великий стрибок у розвитку NLP. Вони набули популярності після роботи ФиллмораСправа про відмінок”. На сьогоднішній день відмінкові фрейми - один з найбільш часто використовуваних методів NLP, тому що він є найбільше комп'ютерним-ефективним при аналізі як знизу-нагору (від складових до цілого), так і зверху- униз (від цілого до складових).


Відмінковий фрейм складається з заголовка і набору ролей (відмінків), пов'язаних певним чином із заголовком. Фрейм для комп'ютерного аналізу відрізняється від звичайного фрейма тим, що відношення між заголовком і ролями визначається семантично, а не синтаксично, тому що в принципі одному і тому слову можуть приписуватися різні ролі, наприклад, іменник може бути як інструментом дії, так і його об'єктом.


Загальна структура фрейму наступна:

[Заголовне дієслово

[відмінковий фрейм агент: <активний агент, що чинить дію> об'єкт: <об'єкт, над яким відбувається дія>

інструмент: <інструмент, використовуваний при вчиненні дії>

реціпієнт: <одержувач дії - часто непряме доповнення>

напрямок: <ціль (звичайно фізичного) дії>

місце: <місце, де відбувається дія>

бенефіціант: <сутність, в інтересах якої відбувається дія>

коагент: <другий агент, що допомагає чинити дію>

]]

Наприклад, для фрази Іван дав м'яч Каті відмінковий фрейм виглядає так:

[Давати

[відмінковий фрейм агент: Іван об'єкт: м'яч

реціпиієнт: Катаючи]

[грам

час: минулий

застава: акт]

]

Існують обов'язкові, необов'язкові і заборонені відмінки. Так, для дієслова розбити обов'язковим буде відмінок об'єкт - без нього висловлення буде незакінченим. Місце і коагент будуть у даному випадку необов'язковими відмінками, а напрямок і реціпієнт - забороненими.


Часто в NLP буває корисним використовувати семантичне уявлення у як можна більш канонічній формі. Найбільш відомим засобом такої репрезентації є метод концептуальних залежностей, розроблений Шенком для дієслів дії. Він полягає в тому, що кожна дія подана у вигляді однієї або більш простіших дій.


Наприклад, для речення Іван дав м'яч Каті (1) і Катя взяла м'яч в Івана (2), що різняться синтаксично, але обидва, що означають акт передачі, можуть бути побудовані такі репрезентації з використанням найпростішої дії Atrans, що застосовується в граматиці концептуальних залежностей:


(1)

(2)

[Atrans

[Atrans

Відн: володіння

Відн: володіння

Агент: Іван

Агент: Катя

об'єкт: м'яч

об'єкт: м'яч

Джерело: Іван

Джерело: Іван

реціпієнт: Катя]

Реціпієнт: Катя]

За допомогою такого уявлення легко виявляються подібності і розбіжності фраз.

Для полегшення аналізу також використовується розподіл ролі на лексичний маркер і заповнювач. Так, для ролі об'єкт може бути встановлений маркер пряме доповнення, для ролі джерело - маркер виду <маркер-із>=із|від|...


Загалом аналіз тексту за допомогою відмінкових фреймів складається з таких кроків:

  1. Використовуючи існуючі фрейми, підібрати сумісний із заголовком. Якщо такого немає, текст не може бути проаналізований.

  2. Повернути в систему потрібний фрейм із відповідним заголовком-дієсловом.

  3. Спробувати провести аналіз по всіх обов'язкових відмінках. Якщо один або більш обов'язкових заповнювачів відмінків не знайдені, то повернути в систему код помилки. Такий випадок може означати наявність еліпсиса, зрадливий вибір фрейма, невірно введений текст або хиба граматики. Такі кроки використовуються вже для аналізу і виправлення таких ситуацій.

  4. Провести аналіз по всіх необов'язкових відмінках.

  5. Якщо після цього у введеному тексті залишилися непроаналізовані елементи, видати повідомлення про помилку, пов'язану з невірним вводом, недостатністю даного аналізу або необхідністю провести інший, більш гнучкий аналіз.

  6. Переваги використання відмінкових фреймов такі: суміщення двох стратегій аналізу (поверх униз і знизу нагору); комбінування синтаксису і семантики;

  7. зручність при використанні модульних програм.

Стійкість аналізу


Певну складність при аналізі являє варіативність того самого запиту. Наприклад, на вхід системи, що управляє зарахуванням і перерозподілом учнівських на курсах різних фахів, може надійти запит типу Перевідіть Петрова, якщо це можливо, із математики на, скажімо, економіку.


Найбільш легко такі складності долаються при використанні відмінкових фреймів. Правило, сформульоване Карбонеллом і Хейзом, говорить: “Варто пропускати невідомі введені елементи доти, поки не буде знайдений відмінковий маркер; пропущені елементи варто аналізувати з урахуванням незаповнених відмінків, використовуючи тільки семантику”.

Діалог

Поряд із проблемою розпізнавання тексту існує і проблема підтримки інтерактивного діалогу. При цьому виникають додаткові особливості, характерні для діалогів, як-от:

  1. анафора (тобто використання займенників замість їхній анафоричних антецедентів - самостійних частин мови);

  2. еліпсис;

  3. екстраграматичні речення (пропускання артиклів, помилки, вживання окликів і т.п.);

  4. металінгвістичні речення (тобто спроба виправлення введеного раніше).


Окрім того, користувачі систем із природно-мовним інтерфейсом намагаються вмсловлюватися як умога коротше, що в деяких випадках також ускладнює аналіз.

Використання відмінкових фреймів, як у разі злиття поточного фрейму з попереднім, забезпечує відновлення еліпсиса.


Експертні системи та їх архітектура.


Експертна система - це комп'ютерна програма, що моделює міркування людини-експерта у визначеній області, використовуючи для цього БЗ, що містить факти і правила про цю область і деяку процедуру логічного висновку.

Розробка ЕС - порівняно новий напрямок у системах ШІ; друга назва - інженерія знань (термін введено у 1977 Фегенбаум), сформувалася в середині 70 р.

Раніш існував ланцюг: аналітик - програміст - оператор - користувач; тепер користувач може звертатися безпосередньо до ЕОМ (або тільки через інженера по знаннях).


Структура ЕС:


раніш: вхідні дані

програм

тепер:

вхідні дані

інтерпретатор БЗ

БЗ


Звичайні програми мають фіксовану послідовність кроків, строго визначену програмістом, ЕС користуються знаходженням задовільного рішення методом спроб і помилок.

ЕС вирішують важко формализуємі задачі, які не мають алгоритмічного вирішення () медицина, геологія, керування, юридичні науки).


Що зумовило появу ЕС:

орієнтованість на вирішення задач у неформалызованих областях

призначеність для користувачів, що не мають спецыаальних навичок програмування

ЕС вирішують задачы краще, ніж людина.


ЕС повинна мати спроможність одержувати знання. Існує 2 джерела придбання знань:

1) від експерта

2) із текстів


ЕС вирішують практичні задачі, а не експериментальні; рішення ЕС можуть бути пояснені користувачу, тобто мають властивість прозорості, для цього існує спеціальний компонент - пояснювальний.


Формальна основа ЕС: базове поняття - правило продукції або формальні процедури системи: правила виду умова -> дія якщо -> те (якщо було розлито пальне - то викликайте пожежних).

Архітектура ЕС


Користувач ЕС


Спілкування на ПМ



Лігвітсичний компонент аналізу із синтезу вхідних повідомлень


робоча пам'ять

поточний стан проведення експертизи


пояснювальний компонент















інтерпретатор















компонент придбання знань














БЗ



БЗ має динамічний характер, містить факти і правила у формі продукцій

інтерпретатор має справу з процедурами логічного висновка, на основі наявних даних вирішує задачу

лінгвістичний процесор здійснює діалог із користувачем

робоча пам'ять зберігає дані

компонент придбання знань - із його допомогою знання отримуються від експерта або тексту і заносяться до БЗ

пояснювальний компонент відповідає на запитання, чому прийняті nfrs рішення і чим мотивовано вибір.


Гіпертекстові системи


Гіпертекст - це текст, значимі елементи якого можуть читатися в різній послідовності.


Послідовність читання - довільна. Між текстовими фрагментами визначено дозволені переходи. Як правило, від одного фрагмента можна перейти до декількох інших. Читати можна з будь-якого елемента у різних напрямках. Комп'ютери дозволяють миттєво переходити від одного фрагмента тексту до іншого, що дозволяє читати нелінійні так само легко, як лінійні.

Гіпертексткомп’юторізований нелінійний текст. Нельсон і Энгельбарт вперше реалізували ГТ наприкінці 60 р.

Особливості ГТ у порівнянні з традиційними нелінійними текстами (текст із коментарями, посиланнями, енциклопедія):

1. явна виразність мережної структури: вузли (текстові фрагменти) і зв'язку (можливість переходу від одного ТФ до іншого -> навігація). Зв'язок може бути однонаправлений від фрагмента до коментарю або двонаправлений між двома фрагментами. Зв'язок може носити ієрархічний характер - від загального до цілого.


Інтерфейс користувача:

перехід - не більш двох клавіш

користувач повинен мати засоби орієнтації: При кожному вузлі дається зміст - локальна орієнтація. Глобальна орієнтація - наочне зображення структури гіпертекстової мережі, у якій позначається шлях, пройдений користувачем

багатовікона система дозволяє бачити одночасно декілька ФТ на екрані.

2. відкритість гіпертекстау (для вмикання нових ФТ, читач може виступати співавтором)


Приклад ГТ: образотворча і звукова система Гіпермедіа (комплексне використання інформації різної природи, синтез різних мистецтв)

Динамічний ГТ постійно доповнюється новими текстовими фрагментами (необхідно знаходити зв'язки для отриманих ззовні ФТ)


ГТ - сама форма організації матеріалу і технологія, без якої неможлива його організація. ГТ - накопичення інформації в БД, доступ до даних - через запити. Зв'язок важливий для користувача, тому в БД ГТ системи немає заздалегідь визначених зв'язків. Подача інформації - відтворення фрагментів мереж, сформованих до цього моменту в БД. Видаються окремі вузли і ділянки мережі в графічній формі разом із маршрутами прямування. У ГТ мережі можна легко відбивати ідеї учасників проекту, для подальшого вивчення їх в інтерактивному режимі відразу декількома учасниками.



4 Види ГТС:

1. бібліотечні макросистеми: (ширше, ніж пошук літератури) XANADU, Нельсон система збереження й актуализации інформації), TEXTNET (принцип динамічного упорядкування, перелік вузлів)

2. засоби дослідження проблем: IBIS, Риштель (аспекти, позиції, аргументи);JOG (вивчення довідкової енциклопедичної літератури, виведення сторінок)

3. системи для перегляду БД:(подібні до бібліотечних. але менше, служать для одержання довідкових даних) Browsing Systems, WE середовище потрібна для опису системи перегляду, легкість доступу, додання нової інформації не дозволяється

4. системи широкого призначення (експериментування в різних напрямках): INTERMEDIA фірми XEROX



Висновок


Таким чином, процес розробки систем, що забезпечують розуміння ПМ, потребує створення механізмів, відмінних від традиційних засобів уявлень ПМ, а системи з природно-мовними інтерфейсами застосовуються тільки у вузьких предметних областях.


Нравится материал? Поддержи автора!

Ещё документы из категории информатика:

X Код для использования на сайте:
Ширина блока px

Скопируйте этот код и вставьте себе на сайт

X

Чтобы скачать документ, порекомендуйте, пожалуйста, его своим друзьям в любой соц. сети.

После чего кнопка «СКАЧАТЬ» станет доступной!

Кнопочки находятся чуть ниже. Спасибо!

Кнопки:

Скачать документ