当前数据记录情况说明
一、已有数据记录
1. 转写服务(t_transcription_record表)
- 已记录:调用的转写平台(
platform字段,如:azure、doubao、google等) - 已记录:转写消耗的时长(
duration_sec字段,单位:秒) - 未记录:转写时长的单价(元/小时或元/秒)
2. 纪要生成服务(t_transcription_summary表)
- 已记录:使用的AI模型(
model字段,如:gpt-4o-mini、deepseek-reasoner、grok-4-0709等) - 已记录:消耗的token数(
total_tokens字段,或input_tokens+output_tokens) - 已记录:部分成本(
cost字段,但可能不完整或不准确) - 未记录:AI模型的单价(元/千token或元/次)
二、缺失的关键数据
1. 转写平台单价配置
- 缺失:各转写平台(azure、doubao、google等)的计费单价
- 缺失:单价单位(元/小时、元/分钟、元/秒)
- 缺失:单价的有效期(是否随时间变化)
2. AI模型单价配置
- 缺失:各AI模型(gpt-4o-mini、deepseek-reasoner、grok-4-0709等)的计费单价
- 缺失:单价单位(元/千token、元/次、元/输入token+元/输出token)
- 缺失:单价的有效期(是否随时间变化)
3. 成本计算规则
- 缺失:转写成本计算公式(时长 × 单价)
- 缺失:纪要成本计算公式(token数 × 单价,或区分输入/输出token)
- 缺失:是否需要考虑最小计费单位、折扣等
三、补充说明
当前状态
- 数据基础:已有转写平台、时长、AI模型、token数等基础数据
- 成本计算:缺少单价配置,无法直接计算成本
- 成本字段:
t_transcription_summary.cost字段存在,但可能不完整或不准确
需要补充的内容
-
创建单价配置表(建议)
- 表名:
t_ai_service_cost_config - 字段:
service_type(服务类型:转写/纪要生成)platform(转写平台)或model(AI模型)unit_cost(单价)unit(单位:小时/次/千token等)currency(货币类型)effective_date(生效日期)expire_date(失效日期,可选)remark(备注)
- 表名:
-
成本计算逻辑
- 转写成本 =
duration_sec / 3600 * unit_cost(如果单价是元/小时) - 纪要成本 =
total_tokens / 1000 * unit_cost(如果单价是元/千token) - 或根据实际计费规则调整
- 转写成本 =
-
数据补全方案
- 方案A:实时计算(推荐)
- 查询时根据单价配置实时计算成本
- 优点:单价变更不影响历史数据
- 缺点:查询性能可能受影响
- 方案B:历史数据补全
- 根据当前单价配置,补全历史记录的成本字段
- 优点:查询性能好
- 缺点:单价变更时历史数据不准确
- 方案C:混合方案
- 新数据记录成本,历史数据实时计算
- 优点:兼顾准确性和性能
- 缺点:实现复杂度较高
- 方案A:实时计算(推荐)
四、需要确认的事项
1. 单价配置来源
- 单价数据来源(合同、账单、API文档等)
- 单价是否已确定,还是需要从外部获取
2. 单价配置方式
- 是否创建配置表存储单价
- 还是通过配置文件或代码硬编码
- 是否需要支持单价的历史版本查询
3. 成本计算时机
- 实时计算(查询时计算)
- 还是预先计算(调用AI服务时记录成本)
4. 成本字段补全
t_transcription_summary.cost字段是否需要补全t_transcription_record表是否需要新增cost字段
五、建议的实施步骤
第一步:收集单价配置
- 整理各转写平台的单价(元/小时)
- 整理各AI模型的单价(元/千token或元/次)
- 确认单价的有效期和变更历史
第二步:设计单价配置存储
- 创建
t_ai_service_cost_config表 - 录入单价配置数据
- 设计单价查询接口
第三步:实现成本计算
- 实现转写成本计算逻辑
- 实现纪要成本计算逻辑
- 实现成本统计聚合逻辑
第四步:数据补全(可选)
- 根据单价配置补全历史成本数据
- 或实现实时计算逻辑
六、总结
- 已有:转写平台、时长、AI模型、token数
- 缺失:转写平台单价、AI模型单价、成本计算规则
- 需要:创建单价配置表、实现成本计算逻辑、确定成本计算时机