Metadata-Version: 2.3
Name: mdata-flow
Version: 0.0.3rc3
Summary: 
Author: Ilia Novikov
Author-email: nov.ilucha@yandex.ru
Requires-Python: >=3.11,<3.13
Classifier: Programming Language :: Python :: 3
Classifier: Programming Language :: Python :: 3.11
Classifier: Programming Language :: Python :: 3.12
Provides-Extra: graphics
Provides-Extra: reports
Requires-Dist: evidently (>=0.6.5,<0.7.0) ; extra == "reports"
Requires-Dist: matplotlib (>=3.10.1,<4.0.0) ; extra == "graphics"
Requires-Dist: mlflow[databricks] (>=2.20.0,<3.0.0)
Requires-Dist: plotly (>=5.10.0,<6) ; extra == "graphics"
Requires-Dist: plotly (>=5.10.0,<6) ; extra == "reports"
Requires-Dist: pydantic (>=2.10.6,<3.0.0)
Requires-Dist: pydantic-settings (>=2.8.1,<3.0.0)
Requires-Dist: seaborn (>=0.13.2,<0.14.0) ; extra == "graphics"
Requires-Dist: xxhash (>=3.5.0,<4.0.0)
Description-Content-Type: text/markdown

# MLFlow Dataset Caching

## 📌 Описание

Этот проект предоставляет удобный способ загрузки датасетов
в **MLflow** с поддержкой локального кэширования.
Также он позволяет определять собственные классы-посетители (visitor classes)
для генерации графиков и отчетов, что упрощает анализ данных.

## 🚀 Возможности

- 📂 **Локальное кэширование**: снижение нагрузки на сеть и ускорение работы с данными.
- 🔄 **Автоматическая загрузка в MLflow**: хранение данных в
  удобном формате для воспроизводимости экспериментов.
- 📊 **Гибкость в анализе**: возможность использования пользовательских
  классов для создания визуализаций и отчетов.

## 🛠 Установка

```bash
pip install mdata_flow
```

## 🔧 Использование

### 1️⃣ Загрузка датасета с кэшированием

IN DEV

### 2️⃣ Сохранение датасета в MLflow

IN DEV

### 3️⃣ Определение собственного класса-посетителя

IN DEV

## 📌 Как работает кэширование?

При загрузке датасета **DatasetLoader** проверяет, существует ли локальная копия.
Если файл уже загружен ранее, он берется из кэша,
иначе загружается заново и сохраняется для последующего использования.

## 🔗 Полезные ссылки

- [Документация MLflow](https://mlflow.org/docs/latest/index.html)

## 🤝 Вклад

Если у вас есть идеи или улучшения,
создавайте Pull Request'ы! Будем рады вашим предложениям. 🚀

