Whisper&deepseek
whispher转写会议音频+deepseek总结项目记录
- 目前通过脚本实现与用户的简单交互:./start.sh 一行命令回车进行录音,再回车结束录音后,Whisper进行转写,deepseek进行总结;效果如下
结果生成在/data/VAproject/output/时间戳目录下
1h40min会议音频测试结果展示在文章末尾,用户也可以通过如下步骤自定义生成docx文件的模版样式(通过pypandoc库实现);
1 |
|
项目整体达到可使用的水平,但还现存一些模型能力带来的小问题
- 极少数情况下,某些段落总结中会夹杂着少许英文,添加提示词强调中文输出无用,不明显;
- 通过修改模型参数generation_mode=’greedy’为“penalty_sample”,可以避免无限输出重复内容的问题,但少数情况下,模型并不按照我的提示词模版进行输出;
Whisper&deepseek
https://tolsz.me/2025/03/01/Whisper-deepseek/