Metadata-Version: 2.4
Name: pyetool
Version: 0.29.0
Summary: Add your description here
Requires-Python: >=3.13
Requires-Dist: bilibili-api-python>=17.3.0
Requires-Dist: click>=8.3.3
Requires-Dist: google-genai>=2.0.1
Requires-Dist: httpx[socks]>=0.27
Requires-Dist: playwright>=1.55
Requires-Dist: pydantic-ai-slim[google]>=1.96.1
Requires-Dist: pydantic>=2.13.4
Requires-Dist: python-dotenv>=1.2.2
Requires-Dist: rich>=15.0.0
Requires-Dist: tenacity>=9.0.0
Requires-Dist: toolz>=1.1.0
Requires-Dist: tos>=2.9.0
Requires-Dist: yt-dlp>=2026.3.17
Description-Content-Type: text/markdown

# Pyetool

A personal efficiency enhancing tool.

## Sprint 1 — Resource objects (done)
- [x] pexel api
- [x] video downloader
- [x] video resource object, understand method
- [x] audio resource object, transcribe method
- [x] bilibili page object, data & action

## Sprint 2 — More resource types
- [ ] GIF resource object, understand method
- [ ] music resource object, understand method
- [ ] resource management

## Sprint 3 — Video composition
- [ ] use Remotion to make descriptive video clip

## Sprint 4 — Video topic research toolkit

为选题决策提供数据支撑：探索新主题或验证已有灵感。Pipeline:

```
[关键词/种子] → [找视频] → [视频+评论分析] → [角度卡]
```

### P1: 标题相关性过滤 - done
搜索结果噪声率高（实测「结构主义」：1391 条中真正相关约 24%）。在拉评论 /
转录 / 分析之前，按标题用 LLM 判定与目标主题的相关性。
- 三档输出（高度相关 / 弱相关 / 不相关）+ 一句理由
- CLI 子命令，jsonl → jsonl，可与 `search` 管道串联

### P2: 评论 & 弹幕收集
- 评论：B 站 API 拉 top N 热评（按点赞排序），反映"观众关注什么"
- 弹幕：反映"瞬时反应点"，跟评论是不同维度
- 两者用途不同，可分两步实现

### P3: 单点深挖原语
"好主题来自迭代深挖"——需要的物理操作：
- 给定 UP 主 → 拉全部投稿（最高频，先做这一个）
- 给定视频 → 拉 B 站相关推荐
- 给定视频 → 拉同分区 / 同 tag 热门

### Misc: ASR 段落化
SeedASR / SeedASRFlash 当前输出只有标点 + utterance（句子级）切分，无段落结构，
长文阅读体验差。两个 API 都没有段落参数（已核对参数列表），需要客户端后处理
（基于语义 / 话题切分归并段落，LLM 或规则均可）。
