Metadata-Version: 2.4
Name: ramonak
Version: 0.5.0
Summary: Універсальная бібліятэка па працы з тэкстам на беларускай мове для Python
Project-URL: Documentation, https://github.com/alex-rusakevich/ramonak#readme
Project-URL: Issues, https://github.com/alex-rusakevich/ramonak/issues
Project-URL: Source, https://github.com/alex-rusakevich/ramonak
Author-email: Alexander Rusakevich <mr.alexander.rusakevich@gmail.com>
License-Expression: LGPL-3.0
License-File: LICENSE
Classifier: Development Status :: 4 - Beta
Classifier: Programming Language :: Python
Classifier: Programming Language :: Python :: 3.11
Classifier: Programming Language :: Python :: 3.12
Classifier: Programming Language :: Python :: 3.13
Classifier: Programming Language :: Python :: Implementation :: CPython
Requires-Python: >=3.11
Requires-Dist: lxml>=5.3.0
Requires-Dist: python-dotenv>=1.0.1
Requires-Dist: requests>=2.32.3
Requires-Dist: tqdm>=4.67.1
Description-Content-Type: text/markdown

# Ramonak

[![CI](https://github.com/alex-rusakevich/ramonak/actions/workflows/ci.yml/badge.svg)](https://github.com/alex-rusakevich/ramonak/actions/workflows/ci.yml)
[![PyPI - Version](https://img.shields.io/pypi/v/ramonak.svg)](https://pypi.org/project/ramonak)
[![PyPI - Python Version](https://img.shields.io/pypi/pyversions/ramonak.svg)](https://pypi.org/project/ramonak)

Універсальная бібліятэка па працы з тэкстам на беларускай мове для Python.

## Як усталяваць?

Напішыце ў вашым тэрмінале:

```sh
pip install ramonak
```

Або ў Google Colab:

```sh
!pip install ramonak
```

## Як карыстацца?

```python
!pip install ramonak -U

import ramonak
from ramonak.tokenizer import word_tokenize
from ramonak.stemmer import FlexionStatStemmer
from ramonak.stopwords import clean_stop_words
from ramonak.punct import remove_punct


text = "Яны iшлi ўдвух выкатанаю нячутна-пругкiмi веласiпедамi сцежкаю ля шэрых нямогла нахiленых да вулiцы платоў...".lower()
tokens = remove_punct(word_tokenize(text))
tokens = clean_stop_words(tokens)

stemmer = FlexionStatStemmer()
print(
      stemmer.stem_words(tokens)
    )
```

Больш падрабязную дакументацыю вы можаце знайсці на сайце https://alex-rusakevich.github.io/ramonak/.

## Дарожная карта

 - [x] Такенізацыя па словам
 - [x] Такенізацыя сказаў
 - [x] Спісак стоп-слоў
 - [x] Просты стэмер, заснаваны на статыстыцы флексій
 - [x] Менеджар пакетаў з дадзенымі
 - [ ] Стэмер Портэра
 - [ ] Леммацізатар
 - [ ] Марфалагічны аналізатар
