语言优先级规则

文档类型：产品规格说明
版本：v1.1
更新日期：2026-03-10

一、概述

1.1 文档目的

本文档定义了 Notra AI 录音笔产品在转写（ASR）、纪要（LLM）、思维导图三个环节的语言处理规则，确保各端（iOS/Android/Web）实现一致。

1.2 核心概念

概念	定义
转写语言	ASR 识别音频内容后输出的语言
纪要语言	LLM 生成摘要/纪要时使用的目标语言
导图语言	思维导图展示内容的语言

二、语言模式定义

2.1 自动识别模式（当前实现）

转写语言：ASR 自动识别音频中的语言，按原语言输出
纪要语言：客户端传入 languageCode（由客户端获取手机系统语言）
导图语言：与纪要语言一致

2.2 自定义语言模式（最终预期）

转写语言：ASR 识别音频中的所有语言
纪要语言：用户选择的目标语言
导图语言：与纪要语言一致

2.3 汇总表格

场景	转写语言来源	纪要语言来源	导图语言
自动识别模式	ASR 自动识别音频语言	客户端传入 `languageCode`（获取自手机系统语言）	与纪要语言一致
自定义语言模式（最终预期）	ASR 识别音频中的所有语言	用户选择语言	与纪要语言一致

三、转写（ASR）处理规则

3.1 自动识别模式

转写策略：ASR 根据音频自动识别语言
异常处理：若小语种识别失败或结果为空，则过滤该段
UI 展示规则：不展示空文本

3.2 自动识别模式（多语种）

转写策略：支持识别音频中的多种语言，并按原语言输出
异常处理：若部分语言识别失败，仅展示成功识别内容
UI 展示规则：不展示空段落（包括发言人信息）

3.3 自定义语言模式（最终预期）

转写策略：ASR 识别所有语言
异常处理：统一翻译为用户选择语言
UI 展示规则：只展示目标语言

3.4 汇总表格

场景	转写策略	异常处理	UI 展示规则
自动识别模式	ASR 根据音频自动识别语言	若小语种识别失败或结果为空，则过滤该段	不展示空文本
自动识别模式（多语种）	支持识别音频中的多种语言并按原语言输出	若部分语言识别失败，仅展示成功识别内容	不展示空段落（包括发言人信息）
自定义语言模式（最终预期）	ASR 识别所有语言	统一翻译为用户选择语言	只展示目标语言

四、转写异常处理规则

4.1 异常类型

编号	异常类型
1	ASR 识别为空
2	发言人识别存在但文本为空
3	小语种识别失败

4.2 处理策略

异常类型	处理策略
ASR 识别为空	UI 不展示该段内容
发言人识别存在但文本为空	不展示发言人
小语种识别失败	当前预期：仅展示成功识别部分；最终预期：Fallback 策略

4.3 整段无法识别 - 缺省页提示

当整段音频无法识别语言时，显示缺省页：

未识别到可转写内容

可能原因：

音频语言暂不支持

录音环境噪声较大

音频内容较少

建议：
尝试重新转写并选择目标语言

五、纪要（LLM）生成规则

5.1 自动识别模式

纪要生成语言：客户端传入的 languageCode（获取自手机系统语言）
生成策略：LLM 根据 languageCode 生成纪要

5.2 自定义语言模式

纪要生成语言：用户选择语言
生成策略：LLM 按用户选择的目标语言生成纪要

5.3 汇总表格

场景	纪要生成语言	生成策略
自动识别模式	手机系统语言	LLM 根据用户手机系统语言生成纪要
自定义语言模式	用户选择语言	LLM 按用户选择的目标语言生成纪要

六、纪要语言异常处理

⚠️ 待办事项：本节描述的语言检测与 Fallback 机制尚未实现，当前仅依赖 LLM Prompt 中的语言指令。

6.1 处理流程

flowchart TD
    A[LLM 生成纪要] --> B[检测语言]
    B --> C{是否包含目标语言?}
    C -->|是| D[输出纪要]
    C -->|否| E[重新生成]
    E --> F{是否包含目标语言?}
    F -->|是| D
    F -->|仍不一致| G[生成英语纪要]
    G --> H[翻译为目标语言]
    H --> D

6.2 策略说明

步骤	操作	说明
1	LLM 生成纪要	按目标语言生成
2	检测语言	验证输出是否为目标语言
3	重新生成	若语言不符，触发重新生成
4	Fallback	若仍不一致，生成英语纪要后翻译为目标语言

七、思维导图语言规则

规则：思维导图语言始终与纪要语言保持一致。

纪要语言	导图语言
客户端传入 `languageCode`（获取自手机系统语言，自动识别模式）	与纪要语言一致
用户选择语言（自定义语言模式）	与纪要语言一致

附录

A. 术语表

术语	英文	定义
ASR	Automatic Speech Recognition	自动语音识别，将音频转换为文本
LLM	Large Language Model	大语言模型，用于生成纪要、摘要等
纪要	Summary / Minutes	AI 生成的会议/录音内容摘要
导图	Mind Map	基于纪要内容生成的思维导图
Fallback	-	降级/兜底策略

B. 版本历史

版本	日期	变更内容	作者
v1.1	2026-03-10	明确纪要语言来源为客户端传入 `languageCode`；标记语言检测 Fallback 为待办	-
v1.0	2026-03-10	初始版本	-