网站搜索

IBM 通过新的 Granite 3.0 模型加大开源 AI 投入


Big Blue 的 Granite LLM 是为商业而构建的,现在可以在旧的 Apache 2.0 许可证下使用。

开源和人工智能之间的关系并不稳固。没有开源,人工智能就不可能存在,但很少有公司愿意开源他们的人工智能程序或大型语言模型(LLM)。值得注意的是,IBM 除外,该公司之前开源了其 Granite 模型。现在,蓝色巨人正在加大其开源人工智能的力度,在 Apache 2.0 许可证下发布了最新的 Granite AI 3.0 模型。

IBM 使用来自公开数据集(例如 GitHub Code Clean、Starcoder 数据、公共代码存储库和 GitHub 问题)的预训练数据来完成此任务。 IBM 竭尽全力避免潜在的版权或法律问题。

为什么其他主要人工智能公司没有这样做?一个重要原因是他们的数据集充满了受版权保护或其他知识产权保护的数据。如果他们公开数据,他们也会面临诉讼。例如,《华尔街日报》和《纽约邮报》等新闻集团出版物因窃取其内容而起诉 Perplexity。

相比之下,Granite 模型是专门为业务用例设计的法学硕士,重点关注编程和软件开发。 IBM 声称这些新模型的训练数据量是今年早些时候发布的模型的三倍。它们还具有更大的建模灵活性以及对外部变量和滚动预测的支持。

特别是,新的 Granite 3.0 8B 和 2B 语言模型被设计为企业 AI 的“主力”模型,为检索增强生成 (RAG)、分类、摘要、实体提取和工具使用等任务提供强大的性能。

这些模型还有 Instruct 和 Guardian 变体。第一个,顾名思义,可以帮助人们学习特定的语言。 Guardian 旨在检测用户提示和人工智能响应中的风险。这一点至关重要,因为正如安全专家 Bruce Schindler 在安全开源软件 (SOSS) Fusion 会议上指出的那样,“即时注入 [攻击] 之所以有效,是因为我正在发送将其解释为命令的 AI 数据”——这可能导致灾难性的答案。

Granite 代码模型的参数范围为 30 亿至 340 亿个参数,并接受了 116 种编程语言和 3 至 4 TB 令牌的训练,结合了广泛的代码数据和自然语言数据集。这些模型可通过多个平台访问,包括 Hugging Face、GitHub、IBM 自己的 Watsonx.ai 和 Red Hat Enterprise Linux (RHEL) AI。Ollama 和 Replicate 上还提供了一组精选的 Granite 3.0 模型。

此外,IBM还发布了新版本的Watsonx Code Assistant,用于应用程序开发。在那里,Granite 提供跨 C、C++、Go、Java 和 Python 等语言的通用编码帮助,并为企业 Java 应用程序提供高级应用程序现代化功能。 Granite 的代码功能现在可以通过 Visual Studio Code 扩展 IBM Granite.Code 访问。

Apache 2.0 许可证允许研究和商业用途,与其他主要的法学硕士相比,这是一个显着的优势,其他主要的法学硕士可能声称是开源的,但其法学硕士却受到商业限制。最显着的例子是 Meta 的 Llama。

通过免费提供这些模型,IBM 正在降低人工智能开发和使用的准入门槛。 IBM 有理由相信,由于它们是真正的开源,开发人员和研究人员可以快速构建和改进模型。

IBM 还声称这些型号的性能可以与更大、更昂贵的型号相媲美。

把所有这些放在一起,我印象深刻。诚然,Granite 不会帮助孩子们做作业或写出伟大的人工智能美国小说,但它将帮助您开发有用的程序和基于人工智能的专家系统。

相关文章