2025-04-20 10:07:38 | 来源: AICG工具箱
3月19日报道丨今日,阿里通义大模型应用产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。
通义听悟本次升级上新了六大功能点,其中最重磅的是音视频问答助手“小悟”,关键信息直接“问”出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。
用户不仅可在单一记录页呼唤小悟,对最高 6 小时、6G 大小的音视频提问任何相关话题,或直接小悟要求整理金句、梳理结论、写会议纪要;更可在首页针对用户所有记录提问,支持一次性扫描理解上百条音视频内容;也可花式对英文视频用中文提问,小悟将直接给出中文回答,省去翻译。作为一个“懂你”的 AI,小悟还会智能推荐问题。
针对用户需求,通义听悟还上线了一键 AI 改写、思维导图生成等新能力。
例如,一键 AI 改写,将口语转为书面表达,尤其适合整理采访;思维导图自动生成,最多支持五级 xmind 脑图,适合播客摘要。产品细节体验也进一步升级,包括笔记支持一键插入视频时间戳及截图、音视频文件语种自动识别等。
此外,“通义听悟”现宣布推出“高校公益计划”,针对所有中国大陆高校师生提供服务,师生们可以通过后缀为 edu.cn 的教育邮箱进行认证后,均可直接免费获赠 500 小时转写时长,存储空间从 20G 拓展至 200G。
热门榜单
阿贝智能
常用AIWPS AI
常用AIRunway
常用AI剪映
常用AIEmo-阿里巴巴的AI视频生成框架
常用AICanva AI图像生成
常用AI万相营造
常用AIARC
常用AIDeepSwapper
常用AI热门资讯
中文多模态大模型SuperCLUE-V榜单发布丨Stability AI推出Stable Fast 3D模型丨Meta AI向好莱坞明星采买声音授权
02-11阿里云发布通义千问2.5大模型:号称多项能力赶超GPT-4,发布开源模型Qwen1.5-110B
04-09华为Pura 70打造「AI抓拍」逆天黑科技,高清复原手抖模糊图像,拯救拍照手残党
04-15全网沸腾!AI大模型「开源之王」Llama 3正式发布:性能比肩GPT-4
04-15stable diffusion初识_stable diffusion跟其他工具有什么区别]
01-17小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
02-24OpenAI今夜发布新版GPT-4大模型:“青春版”GPT4-Lite现身,AI搜索引擎「SearchGPT」代码首曝光
04-03英伟达CEO黄仁勋:人形机器人将逐渐成为主流,售价将在1万-2万美元之间
04-15波士顿动力最新电驱版Atlas机器人,完美复刻《午夜凶铃》贞子女鬼经典动作
04-15国产AI创业公司Kimi Chat凭200万字上下文窗口「长文本」大火,但前景可能跟淄博相似
04-18