语言优先级


语言优先级规则

文档类型:产品规格说明
版本:v1.1
更新日期:2026-03-10


一、概述

1.1 文档目的

本文档定义了 Notra AI 录音笔产品在转写(ASR)纪要(LLM)思维导图三个环节的语言处理规则,确保各端(iOS/Android/Web)实现一致。

1.2 核心概念

概念 定义
转写语言 ASR 识别音频内容后输出的语言
纪要语言 LLM 生成摘要/纪要时使用的目标语言
导图语言 思维导图展示内容的语言

二、语言模式定义

2.1 自动识别模式(当前实现)

  • 转写语言:ASR 自动识别音频中的语言,按原语言输出
  • 纪要语言:客户端传入 languageCode(由客户端获取手机系统语言)
  • 导图语言:与纪要语言一致

2.2 自定义语言模式(最终预期)

  • 转写语言:ASR 识别音频中的所有语言
  • 纪要语言:用户选择的目标语言
  • 导图语言:与纪要语言一致

2.3 汇总表格

场景 转写语言来源 纪要语言来源 导图语言
自动识别模式 ASR 自动识别音频语言 客户端传入 languageCode(获取自手机系统语言) 与纪要语言一致
自定义语言模式(最终预期) ASR 识别音频中的所有语言 用户选择语言 与纪要语言一致

三、转写(ASR)处理规则

3.1 自动识别模式

  • 转写策略:ASR 根据音频自动识别语言
  • 异常处理:若小语种识别失败或结果为空,则过滤该段
  • UI 展示规则:不展示空文本

3.2 自动识别模式(多语种)

  • 转写策略:支持识别音频中的多种语言,并按原语言输出
  • 异常处理:若部分语言识别失败,仅展示成功识别内容
  • UI 展示规则:不展示空段落(包括发言人信息)

3.3 自定义语言模式(最终预期)

  • 转写策略:ASR 识别所有语言
  • 异常处理:统一翻译为用户选择语言
  • UI 展示规则:只展示目标语言

3.4 汇总表格

场景 转写策略 异常处理 UI 展示规则
自动识别模式 ASR 根据音频自动识别语言 若小语种识别失败或结果为空,则过滤该段 不展示空文本
自动识别模式(多语种) 支持识别音频中的多种语言并按原语言输出 若部分语言识别失败,仅展示成功识别内容 不展示空段落(包括发言人信息)
自定义语言模式(最终预期) ASR 识别所有语言 统一翻译为用户选择语言 只展示目标语言

四、转写异常处理规则

4.1 异常类型

编号 异常类型
1 ASR 识别为空
2 发言人识别存在但文本为空
3 小语种识别失败

4.2 处理策略

异常类型 处理策略
ASR 识别为空 UI 不展示该段内容
发言人识别存在但文本为空 不展示发言人
小语种识别失败 当前预期:仅展示成功识别部分;最终预期:Fallback 策略

4.3 整段无法识别 - 缺省页提示

当整段音频无法识别语言时,显示缺省页:

未识别到可转写内容

可能原因:

  • 音频语言暂不支持
  • 录音环境噪声较大
  • 音频内容较少

建议:
尝试重新转写并选择目标语言


五、纪要(LLM)生成规则

5.1 自动识别模式

  • 纪要生成语言:客户端传入的 languageCode(获取自手机系统语言)
  • 生成策略:LLM 根据 languageCode 生成纪要

5.2 自定义语言模式

  • 纪要生成语言:用户选择语言
  • 生成策略:LLM 按用户选择的目标语言生成纪要

5.3 汇总表格

场景 纪要生成语言 生成策略
自动识别模式 手机系统语言 LLM 根据用户手机系统语言生成纪要
自定义语言模式 用户选择语言 LLM 按用户选择的目标语言生成纪要

六、纪要语言异常处理

⚠️ 待办事项:本节描述的语言检测与 Fallback 机制尚未实现,当前仅依赖 LLM Prompt 中的语言指令。

6.1 处理流程

flowchart TD
    A[LLM 生成纪要] --> B[检测语言]
    B --> C{是否包含目标语言?}
    C -->|是| D[输出纪要]
    C -->|否| E[重新生成]
    E --> F{是否包含目标语言?}
    F -->|是| D
    F -->|仍不一致| G[生成英语纪要]
    G --> H[翻译为目标语言]
    H --> D

6.2 策略说明

步骤 操作 说明
1 LLM 生成纪要 按目标语言生成
2 检测语言 验证输出是否为目标语言
3 重新生成 若语言不符,触发重新生成
4 Fallback 若仍不一致,生成英语纪要后翻译为目标语言

七、思维导图语言规则

规则:思维导图语言始终与纪要语言保持一致。

纪要语言 导图语言
客户端传入 languageCode(获取自手机系统语言,自动识别模式) 与纪要语言一致
用户选择语言(自定义语言模式) 与纪要语言一致

附录

A. 术语表

术语 英文 定义
ASR Automatic Speech Recognition 自动语音识别,将音频转换为文本
LLM Large Language Model 大语言模型,用于生成纪要、摘要等
纪要 Summary / Minutes AI 生成的会议/录音内容摘要
导图 Mind Map 基于纪要内容生成的思维导图
Fallback - 降级/兜底策略

B. 版本历史

版本 日期 变更内容 作者
v1.1 2026-03-10 明确纪要语言来源为客户端传入 languageCode;标记语言检测 Fallback 为待办 -
v1.0 2026-03-10 初始版本 -


扫描二维码,在手机上阅读
收藏

多 SKU 同单购买需求决策清单

批量转录Batch REST API

评 论
请登录后再评论