Сервисы портала


Сервис классификации текстов

Подраздел «Сервис классификации текстов» содержит две активные кнопки в рабочей зоне (рис. 10):

  • Классифицировать текст;
  • Пополнить библиотеку.

Рис. 10. Раздел «Инструменты анализа текста» - «Сервис классификации текстов»

По нажатию на кнопку «Классифицировать текст» отображается форма, содержащая следующие элементы (рис. 11):

  • Поле обзора и загрузки текста для выполнения процедуры классификации;
  • Поле выбора ранее загруженного в библиотеку документа для анализа;
  • Переключатель «Вывести результат кратко»/«Вывести результат подробно»;
  • Кнопка «Классифицировать».

Рис. 11. Классифицировать текст

Для классификации текста необходимо загрузить файл на портал для его последующей обработки в соответствии со следующим алгоритмом. По нажатию на кнопку «Выберите файл» отображается форма с выбором необходимого документа для загрузки на портал для обработки (рис. 12).

Рис. 12.Форма выбора файла для загрузки

По нажатию на кнопку «Открыть» на портале отображается файл для загрузки и необходимо нажать на кнопку «Загрузить». В результате загрузки файл необходимый для загрузки можно найти в поле выбора текста для его последующей обработки .

Существует два варианта вывода результатов классификации текста:

  • Краткий вариант – выводится только область, к которой был отнесен текст (рис. 13);
  • Подробный вариант – выводит список областей с их полной иерархией и процентом отнесения текста к каждой области (рис. 14).

Рис. 13. Пример краткого вариант вывода результатов классификации

Рис. 14. Пример подробного вариант вывода результатов классификации

По нажатию на кнопку «Пополнить библиотеку» отображается форма, содержащая следующие элементы (рис. 15):

  • Выбор предметной области (тематики), к которой будет добавлять текст,
  • Форма добавления текста,
  • Поле добавления новой предметной области, выбора родительской области в иерархическом классификаторе и поле указания УДК.

Рис. 15. Форма пополнения библиотеки

Пополнение библиотеки доступно в соответствии со следующим алгоритмом:

  • Выбор тематики путем нажатия на из существующего списка или задав новое имя в соответствующее поле , а также выбора общей области тематики нажатия на из существующего списка и заданием номера УДК в соответствующем поле .
  • При создании новой тематики необходимо нажать на кнопку «Создать». Затем необходимо перейти к загрузке текста.
  • При выборе тематики из существующего списка необходимо перейти к загрузке текста.
  • Добавление текста осуществляется путем выбора файла по нажатию на кнопку с последующим отображением выбранного текста на форме и временно загрузкой по нажатию на кнопку «Загрузить».
  • После выполнения нажатия на кнопку «Загрузить» необходимо выполнить добавление текста в библиотеку .

После пополнения библиотеки классификация текста будет осуществляться более подробнее и анализировать загружаемый текст в соответствии со всеми существующими тематиками и областями.

Сервис статистического анализа

Подраздел «Сервисы анализа теста» позволяет анализировать текст путем статистической обработки.

На форме «Сервисы анализа теста» отображаются следующие элементы (рис. 16):

Рис. 16. Сервисы анализа текста

  • Форма загрузки файла для обработки статистическим способом,
  • Инструменты статистической обработки теста (рис.17):

Рис. 17. Инструменты статистической обработки теста

Загрузка файла для последующей обработки осуществляется путем нажатия на кнопку и выбора текста для загрузки. После выбора текста для загрузки и нажатия на кнопку «Открыть» файл для загрузки отображается на форме и доступна кнопка «Загрузить». По нажатию на кнопку «Загрузить» файл отображается в поле загруженных и доступен к обработке из формы .

В зависимости от выбранного метода обработки производится анализ и результат отображается в соответствующем поле (рис. 18):

Рис. 18. Пример анализа текста одним из инструментов: «Частотное распределение букв»

Сервис получения ключевых слов

Подраздел «Сервис получения ключевых слов» позволяет получить ключевые слова текста на основе анализа наиболее часто встречающихся слов в тексте.

На форме «Сервис получения ключевых слов» отображаются следующие элементы (рис. 19):

  • Форма загрузки файла для обработки,
  • Кнопка

Рис. 19. Сервис получения ключевых слов

Загрузка файла для последующей обработки осуществляется путем нажатия на кнопку и выбора текста для загрузки. После выбора текста для загрузки и нажатия на кнопку «Открыть» файл для загрузки отображается на форме и доступна кнопка «Загрузить». По нажатию на кнопку «Загрузить» файл отображается в поле загруженных и доступен к обработке из формы .

Результат отображается после нажатия на кнопку «Получить ключевые слова» (рис. 20):

Рис. 20. Пример результата получения ключевых слов

Сервис получения ключевых слов на основе ИнТеМа

Подраздел «Сервис получения ключевых слов на основе ИнТеМа» позволяет получить в результате анализа наиболее часто повторяющиеся слова в тексте в соответствии с весовой категорией каждого слова по их длине, алгоритм основан на использовании индекса тематической маркированности (ИнТеМ), предложенного профессором ВГУ Кретовым А.А.

На форме «Сервис получения ключевых слов на основе ИнТеМа» отображаются следующие элементы (рис. 21):

  • Форма загрузки файла для обработки,
  • Кнопка

Рис. 21. Сервис получения ключевых слов на основе ИнТеМа

Загрузка файла для последующей обработки осуществляется путем нажатия на кнопку и выбора текста для загрузки. После выбора текста для загрузки и нажатия на кнопку «Открыть» файл для загрузки отображается на форме и доступна кнопка «Загрузить». По нажатию на кнопку «Загрузить» файл отображается в поле загруженных и доступен к обработке из формы .

Результат отображается после нажатия на кнопку «Получить ключевые слова» (рис. 22):

Рис. 22. Пример результата получения ключевых слов на основе ИнТеМа