上传录音文件后,调用豆包模型生成完整文字内容,并支持下载 Markdown。

支持 mp3 / wav / ogg / opus / m4a / mp4,建议 100MB 以内。

当前阶段:等待开始
预计总耗时:通常 1-3 分钟
1. 上传 OSS
2. 提交任务
3. 豆包识别
4. 整理结果
状态码
暂无
状态说明
暂无
查询次数
0
最近查询
暂无
火山 LogId
暂无
文件名
暂无
模型
待识别
时长
--:--
分段数
0
主要发言人估计
0
说话人簇
0
男性(主要)
0
女性(主要)
0
未判定(主要)
0
这里会显示豆包识别完成后的元信息。

主讲人与主要发言人

按发言总时长排序
主讲人
暂无稳定主讲人。
主要发言人 Top 5
暂无主要发言人数据。

完整文本

Doubao Speech

分段结果

这里显示的是说话人聚类结果。主要发言人估计会过滤发言极少的簇,比原始说话人簇更接近真实人数,但仍只是模型估计。

暂无分段结果。