a46f34aa5e812cc870d53d4da1bb3d92f6f894fe
WordMark: 词性标注工具
WordMark 是一个基于 FastAPI 和 THULAC 的词性标注工具。用户可以通过上传文件或粘贴文本来对中文内容进行词性标注,并以不同颜色标记名词、动词、形容词、副词等。
功能特性
- 词性标注:支持中文文本的词性标注,采用不同颜色区分名词、动词、形容词和副词。
- 文件上传:支持
.txt文件上传进行标注。 - 文本粘贴:直接粘贴文本处理,无需额外准备文件。
- 结果展示:标注结果以直观、可视化的方式展示。
- 格式导出:支持导出为 HTML、PDF、RTF 文件。
项目目录结构
project/
├── app.py # FastAPI 项目入口
├── Dockerfile # Docker 配置文件
├── requirements.txt # Python 包依赖文件
├── templates/ # HTML 模板文件夹
│ ├── index.html # 上传文件和粘贴文本页面
│ ├── result.html # 标注结果展示页面
└── README.md # 项目说明文档
环境要求
- Python 3.12+
- Docker(可选)
快速开始
1. 克隆项目
git clone <repository-url>
cd project
2. 安装依赖
确保您已安装 Python,运行以下命令安装依赖:
pip install -r requirements.txt
3. 启动服务
运行以下命令启动 FastAPI 应用:
uvicorn app:app --host 0.0.0.0 --port 8000
服务启动后,访问 http://127.0.0.1:8000 查看应用。
使用 Docker 部署
1. 构建镜像
在项目根目录运行以下命令构建 Docker 镜像:
docker build -t wordmark-app .
2. 运行容器
运行以下命令启动容器:
docker run -d -p 8000:8000 --name wordmark-app wordmark-app
服务启动后,访问服务器的 IP 地址或 http://127.0.0.1:8000。
项目功能
首页
用户可以选择以下方式提交内容:
- 上传文件:支持
.txt文件。 - 粘贴文本:直接粘贴中文文本内容。
标注结果
提交成功后,页面会显示词性标注结果,并以不同颜色高亮标记词性:
- 红色:名词
- 蓝色:动词
- 绿色:形容词
- 橙色:副词
导出结果-开发中
标注结果支持导出为以下格式:
- HTML
- RTF
开发与测试
本地开发
- 安装 Python 环境。
- 修改
app.py调整后端逻辑。 - 运行
uvicorn查看效果。
测试
- 使用 Postman 或 cURL 测试
/process接口:curl -X POST -F "text=这是一个测试文本" http://127.0.0.1:8000/process
贡献
欢迎贡献代码!请确保遵循以下步骤:
- Fork 本仓库。
- 创建分支:
git checkout -b feature/your-feature-name - 提交更改:
git commit -m "添加新功能" - 推送分支:
git push origin feature/your-feature-name - 提交 Pull Request。
问题与反馈
如果在使用过程中遇到问题,请通过 Issues 提交反馈。
许可证
本项目使用 MIT 许可证。详见 LICENSE 文件。
Description
Languages
HTML
47.4%
Python
42.1%
Smarty
8.2%
Dockerfile
1.9%
Shell
0.4%