Metadata-Version: 2.4
Name: jl-vector-store
Version: 0.1.0
Summary: Add your description here
Requires-Python: >=3.10
Description-Content-Type: text/markdown
Requires-Dist: chromadb>=1.5.8
Requires-Dist: requests>=2.33.1

# 内容向量库存储及查询

> 基于 ChromaDB 向量数据库的内容存储、检索工具。

## 📋 项目简介

- **内容存储**：将内容及其分析结果存入 ChromaDB 向量数据库
- **语义检索**：通过语义相似度快速检索相关爆款内容
- **多维度查询**：支持语义搜索、关键词搜索、元数据过滤
- **数据管理**：提供内容更新、删除、备份等完整管理功能

## 🚀 快速开始

### 环境要求

- Python >= 3.8
- ChromaDB（向量数据库）
- 嵌入模型 API（默认支持硅基流动）

### 配置环境变量

```bash
# 嵌入模型配置（使用硅基流动免费模型）
export EMBEDDING_BASE_URL="https://api.siliconflow.cn/v1/embeddings"
export EMBEDDING_API_KEY="your-api-token"
export EMBEDDING_MODEL="BAAI/bge-large-zh-v1.5"
```

### 安装
```bash
uv tool install jl-vector-store
```



## 📖 命令行使用

### 存储内容

```bash
# 从文件存储
uvx jl-vector-store store --file sample.txt --title "爆款标题" --platform "抖音" --author "作者名"

# 直接输入内容存储
uvx jl-vector-store store --content "这里是要存储的爆款内容" --title "爆款标题" --platform "小红书"
```

### 查询相似内容

```bash
# 基础查询（返回5条）
uvx jl-vector-store query --text "工作效率提升技巧"

# 按平台过滤
uvx jl-vector-store query --text "学习方法" --platform "公众号" --n 3
```

### 关键词查询

```bash
# 通过关键词查询
uvx jl-vector-store keyword --keywords "效率,时间管理,职场" --n 10

# 按平台过滤
uvx jl-vector-store keyword --keywords "减肥,健身" --platform "抖音" --n 5
```

### 查看统计信息

```bash
uvx jl-vector-store stats
```

### 备份数据

```bash
# 默认路径备份
uvx jl-vector-store backup

# 指定路径备份
python main.py backup --path /path/to/backup.json
```
