This commit is contained in:
theliu
2026-04-25 14:23:16 +08:00
parent e6308db035
commit d3f1949a6a
+15 -11
View File
@@ -48,24 +48,23 @@ conda create -n VidMarmot python=3.12 -y
conda activate VidMarmot conda activate VidMarmot
# 安装依赖 # 安装依赖
pip install PyQt6 moviepy Pillow requests openai pip install -r requirements.txt
pip install funasr modelscope torch torchaudio
# 下载 ASR 模型(约 1.2GB # 下载 ASR 模型(约 1.2GB
python qwen_download.py python qwen_download.py
``` ```
### 配置 API Key ### 配置
编辑 `config.py`,在对应模型的 `api_key` 字段填入你的 Key。只需填你用到的服务即可。 编辑 `config.py`,在对应模型的 `api_key` 字段填入你的 Key。只需填你用到的服务即可。
| 服务 | 用途 | Key 对应 | 免费额度 | | 服务 | 用途 | 免费额度 |
|------|------|----------|----------| |------|------|----------|
| ModelScope | LLM + 文生图 | `MODELSCOPE_API_KEY` | 有 | | ModelScope | LLM (Qwen3.5-35B) + 文生图 | 有 |
| 硅基流动 | LLM + 文生图 | `SILICONFLOW_API_KEY` | 有 | | 硅基流动 | LLM (GLM-4/Qwen3-32B) + 文生图 | 有 |
| 阿里云百炼 | LLM (Qwen3-235B) | `DASHSCOPE_API_KEY` | 有 | | 阿里云百炼 | LLM (Qwen3-235B) | 有 |
| DeepSeek | LLM (V3/R1) | `DEEPSEEK_API_KEY` | 有 | | DeepSeek | LLM (V3/R1) | 有 |
| OpenAI 兼容 | 自定义 Router | `OPENAI_API_KEY` | - | | OpenAI 兼容 | 自定义 Router | - |
### 运行 ### 运行
@@ -102,24 +101,29 @@ workspace/my_lesson/
├── asr.py # ASR 强制对齐 ├── asr.py # ASR 强制对齐
├── make_video.py # 视频合成 + 字幕渲染 ├── make_video.py # 视频合成 + 字幕渲染
├── text_ai.py # LLM API 客户端 ├── text_ai.py # LLM API 客户端
├── config.py # 配置管理(路径、API、模型 ├── config.py # 全部配置(API Key、模型路径、参数
├── qwen_download.py # ASR 模型下载脚本 ├── qwen_download.py # ASR 模型下载脚本
├── requirements.txt # Python 依赖
├── run.bat # Windows 启动脚本 ├── run.bat # Windows 启动脚本
└── .gitignore └── .gitignore
``` ```
## 依赖 ## 依赖
`requirements.txt`
| 包 | 用途 | | 包 | 用途 |
|----|------| |----|------|
| PyQt6 | GUI 框架 | | PyQt6 | GUI 框架 |
| moviepy | 视频合成 | | moviepy | 视频合成 |
| Pillow | 图片处理 / 字幕渲染 | | Pillow | 图片处理 / 字幕渲染 |
| numpy | 数值计算 |
| requests | HTTP API 调用 | | requests | HTTP API 调用 |
| openai | 兼容 OpenAI 格式的 LLM 客户端 | | openai | 兼容 OpenAI 格式的 LLM 客户端 |
| funasr | ASR 强制对齐 | | funasr | ASR 强制对齐 |
| modelscope | 模型加载 | | modelscope | 模型加载 |
| torch / torchaudio | GPU 推理后端 | | torch / torchaudio | GPU 推理后端 |
| mutagen | 音频时长获取(可选 fallback |
## Roadmap ## Roadmap