Create Next App

选择音频

上传录音文件后，调用豆包模型生成完整文字内容，并支持下载 Markdown。

支持 mp3 / wav / ogg / opus / m4a / mp4，建议 100MB 以内。

当前阶段：等待开始

预计总耗时：通常 1-3 分钟

1. 上传 OSS

2. 提交任务

3. 豆包识别

4. 整理结果

状态码

暂无

状态说明

暂无

查询次数

0

最近查询

暂无

火山 LogId

暂无

文件名

暂无

模型

待识别

时长

--:--

分段数

0

主要发言人估计

0

说话人簇

0

男性（主要）

0

女性（主要）

0

未判定（主要）

0

这里会显示豆包识别完成后的元信息。

主讲人与主要发言人

按发言总时长排序

主讲人

暂无稳定主讲人。

主要发言人 Top 5

暂无主要发言人数据。

完整文本

Doubao Speech

分段结果

这里显示的是说话人聚类结果。主要发言人估计会过滤发言极少的簇，比原始说话人簇更接近真实人数，但仍只是模型估计。

暂无分段结果。