中国在人工智能军备竞赛中迈出了一大步,阿里巴巴发布了一款能够“读取”图像的新聊天机器人

阿里巴巴发布了读取图像的新聊天机器人,中国在人工智能军备竞赛中迈出一大步

这些开源模型被称为Qwen-VL和Qwen-VL-Chat,是视觉语言模型,意味着它们“阅读”图像而不是文本,与竞争对手Chat-GPT和Google Bard不同。Qwen-VL-Chat承诺提供复杂的功能,如通过扫描街道标志提供方向,根据照片解决数学方程,并根据多张图片编织故事。例如,它可以扫描一张用普通话写的医院标志的图像,然后将其翻译成英语,或者帮助新闻机构为照片写标题,该公司表示。

另一个于上周五发布的Qwen-VL是其现有图像阅读聊天机器人的更新版本,现在可以以更高的分辨率阅读图片。

阿里巴巴拒绝对ANBLE发表评论,除了公开宣布的内容。

这些人工智能的新版本是开发者在创建越来越复杂的工具方面的最新尝试,因为这项技术从噱头逐渐成为真正的改变游戏规则的技术。例如,阿里巴巴表示,其新的图像扫描技术在帮助视力受损的人们购物方面有重要的机会,使他们能够扫描物品,并让聊天机器人将标签内容朗读给他们。

这两个模型将在阿里巴巴云的专有模型服务平台Modelscope和流行的创业公司Hugging Face上提供。

阿里巴巴的发布正值Meta推出了一款针对编写代码进行了优化的人工智能模型,该模型是基于今年7月发布的开源模型Llama 2构建的。过去几个月,阿里巴巴一直在努力跟上Meta的人工智能发布步伐。本月早些时候,阿里巴巴推出了其首个两个开源大型语言模型Qwen-7B和Qwen-7B-Chat,这两个模型也是本周发布的模型的基础。今年7月,两家公司达成协议,通过阿里巴巴的云部门向中国市场提供Meta的Llama 2模型。

通过开源这些新模型,阿里巴巴允许用户调整工具以开发自己的应用程序或进行研究。大多数人工智能公司希望用户将开源模型改编为高度特定用例的工具,而无需从头开始构建大型语言模型。除了开源提供的模型,这些公司还提供自己的专有模型作为服务,希望在这个新兴行业中占据市场份额。

人工智能发展是中国政府的优先事项

就在上个月,中国政府成为最早发布人工智能综合规定的国家之一,专家们表示,这为阿里巴巴和其他中国科技公司公开推出他们的产品提供了绿灯。

阿里巴巴还准备进行一次完全重组,将其云计算部门阿里巴巴云(承载其人工智能研究)独立出来,这一举措受到投资者的欢迎。由于人工智能技术需要大量计算能力,只有通过云网络才能得到适当的服务,将两者放在同一部门中将提升人工智能的效率。阿里巴巴云的现任CEO兼董事长Daniel Zhang将于9月辞职,由阿里巴巴的两位联合创始人Eddie Wu担任CEO,Joseph Tsai担任董事长。

中国政府曾多次表示,它认为人工智能对其技术未来至关重要,与美国展开了一场军备竞赛。即使是像阿里巴巴上周发布的这些看似无害的工具,也可能因为其底层技术以及其他开发者如何使用它们而受到牵连。人工智能“已经成为中国和美国争夺首位的代理人,”伦敦大学国王学院中国研究所所长凯利·布朗本月早些时候告诉ANBLE。

到目前为止,中国科技公司似乎稍逊于美国同行。Meta的Llama 2开源版本基于大约700亿个变量(在人工智能术语中称为参数),比阿里巴巴的新版本大约大10倍(阿里巴巴确实表示拥有更大的未开源模型)。尽管美国具有优势,但政府官员担心中国政府最终将利用私营企业开发的一些人工智能技术用于军事或监视目的,据Axios报道。