文章详情页顶部通栏

多模态交互开发套件,用户交互频次提升70% | 创新场景

钛度号
意图识别模型准确率95%的前提下时延低于200ms。

场景描述

随着AI能力进步,越来越多的传统硬件厂商以及基于小模型AI能力构建的智能硬件厂商,迫切得需要升级到大模型以提升交互体验。然而,对于众多企业来说要想保障低延时交互的同时,又要确保模型的效果并且引入外部服务丰富AI能力,还要兼顾成本就变得尤为挑战。

众所周知,想要低时延则模型尺寸不能过大,而模型尺寸偏小又会带来效果问题;想要引入更多的外部服务来丰富AI能力,则工程链路必然更复杂,工程链路的冗长又会带来高时延问题。

面对这些挑战,众多硬件厂商急需一种兼顾成本、时延、功能、效果并且易用的解决方案。

解决方案

阿里通义实验室,深刻认识到消费电子行业升级AI能力的紧迫性和重要性,为了解决上述挑战,决定建设多模态交互方案。

该方案借助通义实验室的应用算法能力,对AI硬件的常见场景进行了分析,专项定制了数个小尺寸意图识别模型,在确保效果的同时最大程度降低时延。另外依托于阿里云百炼平台的生态,使得用户可以灵活自主得添加各类接口、MCP、智能体,极大程度地扩展了应用的能力边界。而且在阿里云自研算力的加持下,保障了性能和稳定的前提下让成本可控。使其最终成为硬件厂商用得起、用得好的解决方案。

成效

面向消费电子产品,提供结合了意图识别、安全审核、长期记忆、联网搜索、Function call与Agent灵活插拔的语音、视觉多模态实时交互的一站式解决方案:

1. 低延时,语音对话最低不足1s,视频流对话最低1.5s
2. 丰富的内置技能与Agent(互联网搜索、设备控制、天气、翻译、新闻)
3. 从上下文到备忘录到长期记忆的多级记忆,记忆召回F1值90%以上
4. 意图识别模型准确率95%的前提下时延低于200ms

阿里云为听力熊、希沃、深励科技等厂商提供的多模态交互解决方案使得其多款产品的AI体验大幅度提升,无论是情感陪伴、学习教育、语音控制、视觉理解都赢得了最终用户的好评和赞誉,用户粘性大幅提升,产品使用时长和交互频次分别提升20%和70%。

本文系作者 阿里云 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

文章详情

快报

更多

18:49

华纳药厂:股东徐小强9月1日至9月12日期间累计减持129.61万股

18:40

毕得医药:股东拟合计减持不超过1%公司股份

18:37

硕世生物副总经理刘中华突发疾病去世,终年56岁

18:37

谢云鹏:云迹科技机器人在全球三万余家酒店中每日完成超百万次任务

18:36

海底捞“小便门”相关纠纷案一审宣判:涉案者父母赔偿220万元

18:34

世纪天鸿:控股股东质押2120万公司股份

18:32

高德AI出行智能体月活突破4亿

18:29

博睿数据:股东拟合计减持不超过5.4%公司股份

18:25

证监会严肃查处东方通严重财务造假案件

18:24

金科环境:持股5%以上股东权益变动触及1%刻度

18:23

山西三季度调整储能项目:入库13.2GW/23.8GWh、出库1.01GW/2.02GWh

18:22

*ST东通:公司股票被叠加实施退市风险警示

18:19

山西焦煤:所属水峪煤业复产

18:19

金融监管总局:坚持信托“卖者尽责,买者自负;卖者失责,按责赔偿” 打破刚性兑付

18:12

李明德:美的内部已涌现9000多个“民间智能体”,由一线员工自主开发

18:11

上交所:本周对*ST亚振等异常波动风险警示股票,以及天普股份等严重异常波动股票进行重点监控

18:10

晶科能源:股东晶科能源投资等拟询价转让4%公司股份

18:10

央行:调整后的一级交易商考评办法将从2025年启用,考评期内行为不当的一级交易商将被暂停参与公开市场操作

18:09

炬光科技:控股股东、实际控制人及其一致行动人近期减持86.88万股

18:06

康达新材:支付完成第一期股权转让款2754万元

扫描下载App

Baidu
map