Комп’ютерна лінгвістика (КЛ) – новий етап розвитку теоретичної та прикладної лінгвістики

Теоритична лінгвістика

Теоретична лінгвістика є розділом, ядром загального мовознавства. Вона досліджує мовні закони і формулює їх як теорії.

Нормативна лінгвістика вказує правильність вимови і написання слів

Нормативна

Комп’ютерна лінгвістика (КЛ)

Явище, причини виникнення
якого слід шукати в стані розвитку як сучасного суспільства, так і самої мови та науки, що її вивчає, – лінгвістик

Об’єкт дослідження КЛ

Мовна система

Прикладна́ лінгві́стика

Розділ мовознавства, пов'язаний із практичним розв'язанням питань, які пов'язані з вивченням мови.

Емпірична

Емпірична лінгвістика описує реальну мову

Мовлення

Мовна діяльність

Сукупність певних одиниць з властивими їм
формальними, змістовими та функціональними властивостями;

Різноманітні продукти реалізації мовної системи в
певних умовах та ситуаціях комунікації;

Процес використання мовної системи й створення продуктів такого застосування мови в тих чи інших умовах комунікації

Самостійна лінгвістична дисципліна, яка розв`язує теоритичні й прикладні завдання мовознавства за допомогою комп'ютера.

Предмет дослідження КЛ

Ознаки будови, змісту та функціону- вання одиниць мовної системи, продуктів мовлення та мовної діяльно- сті – звукових або письмових текстів, які могли б служити для їхнього моделювання й використання в процесах комп’ютерного опрацювання мовної інформації

Поява комп'ютера

Інформатика

Наука про типи інформації, способи, засоби її ство-
рення, процеси обміну інформацією у природі, техніці й суспільстві

Забезпечення роботи комп’ютера

Сукупність технічних при- строїв, засобів, алгоритмічних та програмних процедур, баз даних або знань для виконання поставлених завдань

Інструментальне (=апаратне, hardware) – сукупність тех- нічних пристроїв та засобів

Алгоритмічне та програмне (=software) – сукупність алго- ритмічних та програмних процедур

Лінгвістичне (=lingware) – сукупність баз даних або знань та спеціальних лінгвістичних процесорів для опрацювання інформації природною мовою

Типи моделей у КЛ

Перший тип

Декларативні, або статичні

Другий тип

Процедурні, або динамічні

Морфемну будову сучасного українського слова

Відомості про типи і класи морфем у складі слів окремих частин мови та лексико-граматичних розрядів, їхню буквену (графічну) та фонетичну (звукову) структуру, загальну кількість морфем у слові та кількість морфем окремих типів або класів, їхній розподіл у слові за позиціями відносно стрижневої морфеми українського слова – кореня, а також про схеми комбінування морфем у словах.

Відомості про вживання слів з тими чи іншими морфемами в різних типах текстів, їхній розподіл за частинами мови або лексико-граматичними розряда- ми, за тематичними групами чи функціональними стилями мови, пев- ними сферами життя суспільства й діяльності людини (спеціалізовані, термінологічні різновиди мови, її підмови).

RSF
(корінь+суфікс+флексія),

Модель комбінування класів мор- фем втілена майже у чверті всіх простих іменників, засвідчених сучас- ними українськими словниками з найпоказовішими за обсягом та складом реєстрами (у 7548 словах з 32075)5 .

ГП (голосний+приголосний)

є декларативним знанням про цей суфікс, адже вони нічого нам не повідомляють про правила вживання цієї афіксальної морфеми або її розміщення в слові, комбінування з іншими складниками слова (суфіксами, флексіями чи коренями), закономірності пристосування до них.

суфікс -іт- у слові без-роб-іт-н(ий)

Інформація

це сукупність символів, або образів, що несуть змістове навантаження

Типи інформації за класифікацією А.О.Білецького

антропогенна – фізіогенна

кодована (системна) – некодована (одинична)

ситуаційна – екстраситуаційна

мовна (вербальна) – немовна (екстравербальна)

побутова (узуальна) – спеціальна

логічна – естетична

Функції інформаційної системи А.О.Білецький

Трансформаційна (від лат. transformo “перетворюю, змінюю фо-
рму”) – перетворення інформації;

Консервативна (від лат. cōnservo “зберігаю”) – зберігання інфо-
рмації;

Транслятивна (від лат. trānslātio ”перенос, переміщення”) – пе-
редавання інформації;

Дименсійна (від лат. dīmēnsio “вимірювання, розмір”) – вимірю-
вання інформації;

Утилітарна (від лат. ūtilitās “користь, придатність”) – викорис-
тання інформації;

Естетична (від грецьк. αỉσθητικός ”чуттєво сприйманий”) – вибір для оформлення та передавання інформації засобів, оптимальних для її сприйняття;

Метасемантична (від грецьк. μετα ”зверх, понад” та σημαντι- κός ”означальний”) – відображення в оформленні інформації дода- ткового змісту, який впливає на відчуття людини, стимулює в неї певні реакції на інформацію (пор., наприклад, різні способи офор- млення прохання: наказ, уклінне прохання, дружнє спонукання до дії, нейтральний заклик, побажання тощо).

Види формалізації в КЛ

Внутрішня, або формалізація системи мови, створення моделей мовних об’єктів

Зовнішню, або формалізація моделей мовних об’єктів, створення моделей моделей,

Внутрішня формалізація полягає у структуруванні інформації, вираженої різними одиницями мови або їхніми сукупностями, виділенні визначальних ознак її будови та правил функціонування. Результатом цього різнови- ду формалізації мови і стають моделі певних мовних об’єктів або про- цесів, що з ними відбуваються.

Зовнішня формалізація становить завдання прикладної і, зокрема, комп’ютерної лінгвістики, оскільки зорієнтована на представлення комп’ютеру чи іншому технічному засобу опрацювання інформації уже таких мовних моделей, побудованих за допомогою формально-логічних або математичних методів. Її результат становлять такі моделі мовних об’єктів, які придатні для використання комп’ютера або іншого технічного засобу.