阿里巴巴称,新的Qwen2.5-Omni-7B系统在语音理解和生成方面性能特别高。

中国科企阿里巴巴发布Qwen系列人工智能新模型,称该模型可处理文本、图片、音频和视频,可以直接在手机和笔记本电脑上运行。

- Advertisement -

据彭博社报道,阿里于26日在声明中称,新的Qwen2.5-Omni-7B系统在语音理解和生成方面性能特别高。

阿里称,目前公开发布于Hugging Face和GitHub的这个新模型将被用于构建所谓的AI智能体,例如,可以通过实时音频描述帮助视障人士确定他们周边的状况。

阿里巴巴不是唯一一家开发多模态模型的AI开发商。OpenAI和Alphabet Inc.的谷歌都提供了生成式AI工具,可处理包括文本和音频在内的不同类型输入。


- Advertisement -