通义听悟
语音
通义听悟:语音转录利器
功能:会议实时记录、音视频转录、播客转写
通义听悟 是阿里云旗下的 AI 产品,其采用的大模型是「通义」。它能够“听”,也就是做「语音到文字」的转录。
能够高质量地将声音转换为文本,并用大模型进行处理,这让它可以做我们工作学习的助手。
通义听悟的特点有[1]:
- 功能场景:音频实时转录,上传音频转录,播客链接听写
- 特色功能:对话人角色识别,一键改写原文,转录文本分享
- 多端服务:网站、APP、钉钉小程序、微信小程序、浏览器插件
实用场景案例解读
AI 工作流优秀案例
播客转录及总结
- 将播客链接输入通义听悟,选择分角色功能,转录为文本。
- 采用通义听悟的功能浏览内容,可使用其智能速览功能。
- 将长文本全文拷贝到 kimi,进行文字整理、摘要总结等任务。
一个播客转录后的分享截图与分享链接如下。从中我们可以看到,除了原文外,它提供了智能速览,其中有如下贴心功能:
- 发言人区分
- 关键词
- 全文概要
- 章节速览
- 发言总结
- 问答回顾