經緯·Contexture
Copyright 2024-2025 AIH-Infra (人文学科人工智能基础设施)
Authors: Güriedrich & Baireinhold (橘里德里希 & 白茵霍尔德)

================================================================================
基于 Marker 的衍生作品声明 (GPL-3.0 合规)
================================================================================

本项目是基于 Marker 的衍生作品，根据 GNU General Public License v3.0 发布。

原始项目：
  - 名称：Marker
  - 版权：Copyright 2024 Endless Labs, Inc. (Datalab)
  - 许可证：GPL-3.0-or-later
  - 仓库：https://github.com/VikParuchuri/marker

================================================================================
主要修改内容
================================================================================

Contexture 在 Marker 基础上进行了以下重大修改和创新：

1. 架构创新
   - OCR 后端可插拔架构（支持 Surya / Calamari / Chandra / VLM）
   - Layout 后端可插拔架构（支持 Surya / YOLO / DocLayout-YOLO / VLM）
   - 三模式处理架构（传统 Pipeline / VLM 泛化 / VLM 特化）
   - 异步并发处理架构

2. 人文学科专用功能（完全原创）
   - 双重页码系统（PDF 页码 + 印刷页码）
   - 页码锚点系统（{n} 包裹结构）
   - 页码模式识别与自动修正
   - 边注/页边码处理器
   - 行内小字注处理器
   - 模板系统（中国古籍、德语哥特体等）

3. 集成创新
   - Calamari OCR 集成（欧洲历史文献专用）
   - Chandra OCR 集成（手写/表单/复杂文档）

================================================================================
第三方组件声明
================================================================================

本项目使用或集成了以下第三方组件：

Datalab 项目（Endless Labs, Inc.）：
  - Marker (GPL-3.0) - 核心框架
  - Surya (GPL-3.0) - OCR 引擎
  - Chandra (Apache-2.0) - 高级 OCR
  - PDFText (Apache-2.0) - PDF 文本提取

其他项目：
  - Calamari OCR (Apache-2.0) - 欧洲历史文献 OCR
    通过 Docker 容器集成，作为可选 OCR 后端

================================================================================
许可证兼容性说明
================================================================================

- GPL-3.0 组件：Marker, Surya → 本项目必须使用 GPL-3.0
- Apache-2.0 组件：Chandra, PDFText, Calamari → 与 GPL-3.0 兼容

本项目整体使用 GPL-3.0-or-later 许可证。
