Metadata-Version: 2.4
Name: dhcckb-guji-wordfreq-mcp-20260618b
Version: 0.1.0
Summary: 面向古籍、古诗文和课堂文本分析的中文词频统计 MCP Server
License: MIT
Requires-Python: >=3.10
Requires-Dist: jieba>=0.42.1
Requires-Dist: mcp>=1.0.0
Description-Content-Type: text/markdown

# dhcckb-guji-wordfreq-mcp-20260618b

面向古籍、古诗文和课堂文本分析的中文词频统计 MCP Server。

## 简介

本 MCP Server 提供基于 Python 生态 jieba 分词库的中文词频统计能力，适用于数字人文学者、古文研究者及课堂教学场景的量化文本分析。

## 功能

- **word_frequency**: 对中文文本执行分词与词频统计，支持 Top-K、停用词过滤、最小词长过滤
- **health_check**: 返回服务健康状态、版本信息和依赖版本

## 安装

```bash
uvx dhcckb-guji-wordfreq-mcp-20260618b
```

或直接通过 pip 安装：

```bash
pip install dhcckb-guji-wordfreq-mcp-20260618b
```

## 使用

作为 MCP Server 通过 stdio 运行：

```bash
python -m dhcckb_guji_wordfreq_mcp
```

## 工具说明

### word_frequency

对输入的中文文本执行分词与词频统计。

参数：
- `texts` (必填): 待分析的中文文本列表
- `topK` (可选, 默认 20): 返回词频最高的前 K 个词
- `stopWords` (可选, 默认 []): 自定义停用词列表
- `minWordLength` (可选, 默认 1): 最小词长过滤
- `useBuiltinStopWords` (可选, 默认 true): 是否启用内置停用词

### health_check

返回服务器健康状态、版本信息和 jieba 版本号。

## 依赖

- Python >= 3.10
- jieba >= 0.42.1
- mcp >= 1.0.0

## 许可

MIT
