О компьютерной лингвистике
КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА - направление в прикладной лингвистике, ориентированное на использование компьютерных инструментов – программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также вся сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах. Собственно, только в последнем случае и идет речь о прикладной лингвистике в строгом смысле, поскольку компьютерное моделирование языка может рассматриваться и как сфера приложения информатики и теории программирования к решению задач науки о языке. На практике, однако, к компьютерной лингвистике относят практически все, что связано с использованием компьютеров в языкознании.
К компьютерной лингвистике относят следующие области:
- создание общих языков для представления информации;
- усовершенствование языков для представления информации;
- создание естественного языкового интерфейса для общения человека с машиной (одна из основных проблем Искусственного Интеллекта);
- создание и моделирование информационных систем.
Сюда можно добавить наиболее важную область анализа текстовой информации, извлечения знаний, так как без этого невозможно спроектировать естественно-языковой интерфейс или создать универсальный способ представления информации.
В зависимости от решаемых задач используются различные методы анализа текста:
1. Статистические.
Статистические методы анализа текста могут быть использованы для решения различных задач компьютерной лингвистики: определение языка сообщения, установления авторства и классификации текстов, построения поисковых систем и т.д.
2. Лингвистические.
Лингвистические методы анализа текста опираются на этапы анализа текста, принятые в компьютерной лингвистике и сложившиеся на основе методов традиционной лингвистики, языкознания, герменевтики и других наук, занимающихся анализом текста и изучением законов человеческого мышления.
3. Комбинированные.
В некоторых системах более развиты лингвистические методы анализа текста, в других чаще применяются статистические методы. Бывают ситуации, когда использование обоих методов является целесообразным, т.к. с помощью лишь одного метода невозможно полностью выполнить поставленные задачи.