Skip to content
通义听悟
语音

通义听悟:语音转录利器

功能:会议实时记录、音视频转录、播客转写

通义听悟 是阿里云旗下的 AI 产品,其采用的大模型是「通义」。它能够“听”,也就是做「语音到文字」的转录。

能够高质量地将声音转换为文本,并用大模型进行处理,这让它可以做我们工作学习的助手。

通义听悟的特点有[1]

  • 功能场景:音频实时转录,上传音频转录,播客链接听写
  • 特色功能:对话人角色识别,一键改写原文,转录文本分享
  • 多端服务:网站、APP、钉钉小程序、微信小程序、浏览器插件

实用场景案例解读

AI 工作流优秀案例

播客转录及总结

  • 将播客链接输入通义听悟,选择分角色功能,转录为文本。
  • 采用通义听悟的功能浏览内容,可使用其智能速览功能。
  • 将长文本全文拷贝到 kimi,进行文字整理、摘要总结等任务。

一个播客转录后的分享截图与分享链接如下。从中我们可以看到,除了原文外,它提供了智能速览,其中有如下贴心功能:

  • 发言人区分
  • 关键词
  • 全文概要
  • 章节速览
  • 发言总结
  • 问答回顾

通义听悟:语音转文本

以大模型的语音听写为核心能力的 AI 应用,能够提高工作生活的效率。

https://tingwu.aliyun.com/

  1. 通义听悟功能学堂:https://tingwu.aliyun.com/helpcenter/academy ↩︎

最新更新:

Make Great AI Applications