受欢迎程度排名第二的开源 AI 背后的公司 Mistral 升级了 AI 模型,与此同时,多语言巨头 Cohere 也在升级 AI 模型。
开源开发商 Mistral 对其大型语言模型 (LLM) 进行了重大升级。此次升级默认不受审查,并带来显著增强。
法国人工智能研究实验室没有像往常一样在推特和博客上疯狂发布消息,而是通过 HuggingFace 平台发布了 Mistral 7Bv0.3 模型。
最新版本与其前身一样,将成为引领其他开发人员后续 AI 工具创新的平台。
Mistral 升级版是在加拿大人工智能公司 Cohere 推出 Aya 升级版时问世的,Aya 升级版具有与开源领域中的 Mistral 和 Meta 相匹配的多语言功能。
Mistral 升级 AI 模型
尽管 Mistral 运行在本地基础设施上,但它承诺提供未经审查的响应。尽管如此,当有人输入寻求非法内容和危险信息的提示时,它会发出警告。
Mistral AI 会对敏感提示做出回应,警告其非法性。它添加了免责声明,敦促人们不要使用这些信息进行非法活动。
最新的 Mistral 升级版整合了基础和指令调整标准。基础模型利用大型文本语料库进行预训练。
包括大型文本语料库是其他开发人员在微调过程中可以利用的坚实基础。指令调整模型被描述为一种现成的设计,适用于对话和特定任务的用途。
法国人工智能研究实验室的升级使 Mistral 7B v0.3 中的 token 上下文扩展到 32,768 个 token。它允许升级后的模型执行各种短语和单词,从而增强各种文本的性能。
最新的 Mistral 版本被认定为一个标记器,可以实现高效的文本处理和深入的理解。
与 Meta 的 Llama 相比,升级后的 Mistral 版本具有 8,000 个标记上下文大小,但词汇量达到 128K。
升级中的关键功能是函数调用,它不断与 API 和外部函数交互。这增强了它们在执行代理与第三方工具交互的任务时的多功能性。
将 Mistral AI 集成到各种系统和服务中的能力将产生有吸引力的面向消费者的应用程序和工具。这将方便开发人员设置自交互代理。
Mistral 升级使代理能够搜索网络和专业数据库中的信息。代理可以撰写报告并举行头脑风暴会议以提出想法,而无需将数据提交给 OpenAI 和 Google 等中心化公司。
尽管 Mistral 尚未提供基准测试,但这些增强功能与前代产品相比有显著的改进。特别是,性能是标记和词汇上下文容量的四倍。
法国人工智能研究实验室的升级为排名第二的开源人工智能法学硕士 (LLM) 带来了更广泛的认可能力。
Cohere 推出升级版 Aya 23 多语言机型
加拿大 AI 初创公司推出了 Aya 23 开源法学硕士价格,与 Meta、Mistral 和 OpenAI 竞争。Cohere 秉承其多语言身份,Aya 23 代表精通 23 种语言。
整合多种语言旨在打造一个服务于全球近一半人口的包容性人工智能。该模型在执行生成任务方面优于前代 Aya 101、谷歌的 Gemma 和 Mistral Mistral 7B v2。
Cohere 对 Aya 23 表示赞赏,称其执行多语言 MMLU 任务的能力比 Aya 101 模型提高了 41%。
Cohere 澄清说,Aya 23 有 80 亿个版本,是针对消费级硬件使用而优化的较小型号。较大的 35B 型号具有顶级性能,值得拥有强大的硬件。
Cohere 的 Aya 23 模型微调
Cohere 透露,Aya 23 模型通过多语言教学数据集进行了独特的微调,以确保高质量的性能。它拥有 5570 万幅插图,这些插图来自 161 个独特的数据集,包括人工注释、翻译和合成来源。
Cohere 认为 Aya 23 模型在生成任务中表现出色。它在 spBLEU 翻译基准和 RougeL 摘要指标中的出色得分使其超越了前辈和竞争对手。
新的架构变化涉及旋转位置和分组查询注意,以提高效率和效力。
多语言功能使 Aya 23 能够继续促进多语言 AI 项目在实际应用中的执行。
编辑致谢:T. Schneider / Shutterstock.com
资讯来源:由a0资讯编译自THECOINREPUBLIC。版权归作者A0资讯所有,未经许可,不得转载