语言优先级规则
文档类型:产品规格说明
版本:v1.1
更新日期:2026-03-10
一、概述
1.1 文档目的
本文档定义了 Notra AI 录音笔产品在转写(ASR)、纪要(LLM)、思维导图三个环节的语言处理规则,确保各端(iOS/Android/Web)实现一致。
1.2 核心概念
| 概念 |
定义 |
| 转写语言 |
ASR 识别音频内容后输出的语言 |
| 纪要语言 |
LLM 生成摘要/纪要时使用的目标语言 |
| 导图语言 |
思维导图展示内容的语言 |
二、语言模式定义
2.1 自动识别模式(当前实现)
- 转写语言:ASR 自动识别音频中的语言,按原语言输出
- 纪要语言:客户端传入
languageCode(由客户端获取手机系统语言)
- 导图语言:与纪要语言一致
2.2 自定义语言模式(最终预期)
- 转写语言:ASR 识别音频中的所有语言
- 纪要语言:用户选择的目标语言
- 导图语言:与纪要语言一致
2.3 汇总表格
| 场景 |
转写语言来源 |
纪要语言来源 |
导图语言 |
| 自动识别模式 |
ASR 自动识别音频语言 |
客户端传入 languageCode(获取自手机系统语言) |
与纪要语言一致 |
| 自定义语言模式(最终预期) |
ASR 识别音频中的所有语言 |
用户选择语言 |
与纪要语言一致 |
三、转写(ASR)处理规则
3.1 自动识别模式
- 转写策略:ASR 根据音频自动识别语言
- 异常处理:若小语种识别失败或结果为空,则过滤该段
- UI 展示规则:不展示空文本
3.2 自动识别模式(多语种)
- 转写策略:支持识别音频中的多种语言,并按原语言输出
- 异常处理:若部分语言识别失败,仅展示成功识别内容
- UI 展示规则:不展示空段落(包括发言人信息)
3.3 自定义语言模式(最终预期)
- 转写策略:ASR 识别所有语言
- 异常处理:统一翻译为用户选择语言
- UI 展示规则:只展示目标语言
3.4 汇总表格
| 场景 |
转写策略 |
异常处理 |
UI 展示规则 |
| 自动识别模式 |
ASR 根据音频自动识别语言 |
若小语种识别失败或结果为空,则过滤该段 |
不展示空文本 |
| 自动识别模式(多语种) |
支持识别音频中的多种语言并按原语言输出 |
若部分语言识别失败,仅展示成功识别内容 |
不展示空段落(包括发言人信息) |
| 自定义语言模式(最终预期) |
ASR 识别所有语言 |
统一翻译为用户选择语言 |
只展示目标语言 |
四、转写异常处理规则
4.1 异常类型
| 编号 |
异常类型 |
| 1 |
ASR 识别为空 |
| 2 |
发言人识别存在但文本为空 |
| 3 |
小语种识别失败 |
4.2 处理策略
| 异常类型 |
处理策略 |
| ASR 识别为空 |
UI 不展示该段内容 |
| 发言人识别存在但文本为空 |
不展示发言人 |
| 小语种识别失败 |
当前预期:仅展示成功识别部分;最终预期:Fallback 策略 |
4.3 整段无法识别 - 缺省页提示
当整段音频无法识别语言时,显示缺省页:
未识别到可转写内容
可能原因:
建议:
尝试重新转写并选择目标语言
五、纪要(LLM)生成规则
5.1 自动识别模式
- 纪要生成语言:客户端传入的
languageCode(获取自手机系统语言)
- 生成策略:LLM 根据
languageCode 生成纪要
5.2 自定义语言模式
- 纪要生成语言:用户选择语言
- 生成策略:LLM 按用户选择的目标语言生成纪要
5.3 汇总表格
| 场景 |
纪要生成语言 |
生成策略 |
| 自动识别模式 |
手机系统语言 |
LLM 根据用户手机系统语言生成纪要 |
| 自定义语言模式 |
用户选择语言 |
LLM 按用户选择的目标语言生成纪要 |
六、纪要语言异常处理
⚠️ 待办事项:本节描述的语言检测与 Fallback 机制尚未实现,当前仅依赖 LLM Prompt 中的语言指令。
6.1 处理流程
flowchart TD
A[LLM 生成纪要] --> B[检测语言]
B --> C{是否包含目标语言?}
C -->|是| D[输出纪要]
C -->|否| E[重新生成]
E --> F{是否包含目标语言?}
F -->|是| D
F -->|仍不一致| G[生成英语纪要]
G --> H[翻译为目标语言]
H --> D
6.2 策略说明
| 步骤 |
操作 |
说明 |
| 1 |
LLM 生成纪要 |
按目标语言生成 |
| 2 |
检测语言 |
验证输出是否为目标语言 |
| 3 |
重新生成 |
若语言不符,触发重新生成 |
| 4 |
Fallback |
若仍不一致,生成英语纪要后翻译为目标语言 |
七、思维导图语言规则
规则:思维导图语言始终与纪要语言保持一致。
| 纪要语言 |
导图语言 |
客户端传入 languageCode(获取自手机系统语言,自动识别模式) |
与纪要语言一致 |
| 用户选择语言(自定义语言模式) |
与纪要语言一致 |
附录
A. 术语表
| 术语 |
英文 |
定义 |
| ASR |
Automatic Speech Recognition |
自动语音识别,将音频转换为文本 |
| LLM |
Large Language Model |
大语言模型,用于生成纪要、摘要等 |
| 纪要 |
Summary / Minutes |
AI 生成的会议/录音内容摘要 |
| 导图 |
Mind Map |
基于纪要内容生成的思维导图 |
| Fallback |
- |
降级/兜底策略 |
B. 版本历史
| 版本 |
日期 |
变更内容 |
作者 |
| v1.1 |
2026-03-10 |
明确纪要语言来源为客户端传入 languageCode;标记语言检测 Fallback 为待办 |
- |
| v1.0 |
2026-03-10 |
初始版本 |
- |