Печать

TAWT

Фреймворк TAWT

Особенности фреймворка

  • Реализация трех этапов анализа текста: графематического, морфологического и семантико-синтаксического, - и инструмент, связывающий этапы друг с другом.
  • API инструментов анализа текста, который не требует глубокого «погружения» в основы и особенности обработки естественного языка.
  • Готовые структуры данных разобранного текста после каждого этапа анализа.
  • Минимальная зависимость от разработчиков инструмента:oткрытая разработка, не веб-API
  • Возможность добавлять и заменять отдельные инструменты фреймворка без изменения исходного кода остальных инструментов.
  • Автономность, т.е. функционирование не в составе другой крупной системы.
  • Кроссплатформенность.
  • Поддержка русского языка.

Инструменты фреймворка:

https://github.com/jalexpr/graphematic-parser

https://github.com/jalexpr/JMorfSdk

https://github.com/jalexpr/Gama

https://github.com/jalexpr/SPN

Примеры подключения и использования доступны в GitHub

Подключение зависимостей в Maven - TAWT целиком:

<dependencies>
    <dependency>
        <groupId>com.github.jalexpr</groupId>
        <artifactId>tawt</artifactId>
        <version>master-SNAPSHOT</version>
    </dependency>
</dependencies>

Подключение репозитория:

<repositories>
    <repository>
        <id>jitpack.io</id>
        <url>https://jitpack.io</url>
    </repository>
</repositories>

Подключение зависимостей в Maven - jMorfSdk:

<dependencies>
    <dependency>
        <groupId>ru.textanalysis.jalexpr</groupId>
        <artifactId>jmorfsdk</artifactId>
        <version>2.10.10</version>
    </dependency>
</dependencies>

Обновился словарь от 08.03.2023!

Всем добрый день! Обновился словарь, версия tawt 206f5eba5 пример подключения: ссылка на GitHub

Появились собранные артефакты версии от 1.06.2022

Выложили сюда
Travel Turne Tranzito