TAWT
Фреймворк TAWT
Особенности фреймворка
- Реализация трех этапов анализа текста: графематического, морфологического и семантико-синтаксического, - и инструмент, связывающий этапы друг с другом.
- API инструментов анализа текста, который не требует глубокого «погружения» в основы и особенности обработки естественного языка.
- Готовые структуры данных разобранного текста после каждого этапа анализа.
- Минимальная зависимость от разработчиков инструмента:oткрытая разработка, не веб-API
- Возможность добавлять и заменять отдельные инструменты фреймворка без изменения исходного кода остальных инструментов.
- Автономность, т.е. функционирование не в составе другой крупной системы.
- Кроссплатформенность.
- Поддержка русского языка.
Инструменты фреймворка:
https://github.com/jalexpr/graphematic-parser
https://github.com/jalexpr/JMorfSdk
https://github.com/jalexpr/Gama
https://github.com/jalexpr/SPN
Примеры подключения и использования доступны в GitHub
Подключение зависимостей в Maven - TAWT целиком:
<dependencies>
<dependency>
<groupId>com.github.jalexpr</groupId>
<artifactId>tawt</artifactId>
<version>master-SNAPSHOT</version>
</dependency>
</dependencies>
Подключение репозитория:
<repositories>
<repository>
<id>jitpack.io</id>
<url>https://jitpack.io</url>
</repository>
</repositories>
Подключение зависимостей в Maven - jMorfSdk:
<dependencies>
<dependency>
<groupId>ru.textanalysis.jalexpr</groupId>
<artifactId>jmorfsdk</artifactId>
<version>2.10.10</version>
</dependency>
</dependencies>