核心功能
1. 智能文档处理
- 自动提取PDF文本,清理格式错误和冗余内容
- 支持处理含数学公式的学术论文
- 智能分块处理大文件(最大支持10万字)
2. 多模式内容生成
- 支持15种输出格式(播客/访谈/辩论/讲座等)
- 8种内容风格(专业/学术/轻松/搞笑等)
- 4种内容长度(短篇10分钟到长篇100+分钟)
3. 灵活模型支持
- 支持6种 LLM 服务(OpenAI/Groq/本地模型等)
- 可配置 TTS 语音角色(主持人与嘉宾双角色对话)
- 本地优先设计,保护隐私的同时降低使用成本
4. 全渠道使用方式
- 命令行一键生成
- Python API 集成
- 网页版服务(基于 FastAPI)
技术亮点
1. 四步处理流程
- Step1 :PDF 解析(PyPDF2 提取 + 智能清洗)
- Step2 :脚本生成(动态提示词 + 分块处理技术)
- Step3 :语音优化(添加自然停顿/语气词)
- Step4 :音频合成(多角色语音 + 片段拼接)
2. 智能提示工程
- 内置角色设定(如"博学的老师 vs 好奇的新手")
- 支持用户自定义内容焦点(偏好指令优先处理)
- 自动生成对话中的即兴发挥内容(类比/反问/幽默元素)
3. 工程化设计
- 中间结果缓存(可断点续生成)
- 自动清理临时文件
- 完善的错误处理与日志系统
https://github.com/Goekdeniz-Guelmez/Local-NotebookLM
