IBM 的新企业 AI 模型比 OpenAI 或 Google 的任何模型都更强大
为企业提供更大、更好的全开源人工智能:IBM 发布 Granite 3.1 大型语言模型。
IBM 每隔几个月就会发布新的开源 Granite 大型语言模型 (LLM)。 Granite 3.1 是最新一代型号,建立在 Granite 3.0 的成功之上。该模型提供了针对业务应用程序优化的增强功能和性能。
Granite 3.1 模型系列拥有令人印象深刻的 128K 令牌上下文窗口,比其前身有大幅增加。这种扩展使模型能够处理和理解更大量的文本(相当于大约 85,000 个英语单词),从而实现更全面的分析和生成任务。相比之下,引发人工智能革命的OpenAI的ChatGPT 3只能处理2000个代币。
超越竞争对手
Big Blue 声称,在 HuggingFace 的 OpenLLM 排行榜基准测试中,其新的 Granite 8B Instruct 模型的性能优于其竞争对手,例如 Google Gemma 2、Meta Llama 3.1 和 Qwen 2.5。
Granite 3.1 系列包括密集模型和专家混合 (MoE) 变体。 IBM 表示,其 Granite 2B 和 8B 模型是纯文本密集型法学硕士,经过超过 12 万亿个数据令牌的训练。密集模型旨在支持基于工具的用例和检索增强生成(RAG),简化代码生成、翻译和错误修复。
MoE 模型接受了超过 10 万亿个代币的数据训练。 IBM 声称这些模型非常适合低延迟地部署在设备上的应用程序中。
改进的图形和语言能力
新版本还引入了图像输入/文本输出功能,扩大了模型对图形处理企业的适用性。
Granite 3.1 还提高了外语能力。除了英语之外,它现在还可以支持十几种语言,包括德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语和简体中文。简而言之,如果您经营国际业务,IBM 可以提供 LLM 课程供您选择。
和以前一样,新的 Granite LLM 是根据 Apache 2 开源许可证获得许可的。 IBM 还通过公开训练数据集并提供有关模型开发和性能的全面文档来维持其开放承诺。
如果您担心知识产权问题和人工智能,IBM 可以为与其模型使用相关的第三方知识产权索赔提供无上限的赔偿。您可能还不担心此类潜在的法律问题,但我向您保证您会担心的。
为企业提供强大、值得信赖的人工智能
Granite 3.1 模型可在 IBM 的 Watsonx 平台上使用;云服务提供商,例如 Google Vertex AI;以及 AI 平台,包括 Hugging Face、NVIDIA(作为 NIM 微服务)、Ollama 和 Replicate。
Granite 3.1 的发布有望加速人工智能在企业环境中的采用。通过使用 IBM InstructLab 等技术将这些模型与专有数据相结合,企业可以以极低的成本实现与大型模型相媲美的特定任务性能。
随着人工智能领域的快速发展,IBM 的 Granite 3.1 在为企业提供强大、高效且值得信赖的人工智能工具以推动创新和解决复杂的业务挑战方面向前迈出了重要一步。