• 首页 > 云计算频道 > 大模型

    Ollama更新 优化软件并支持Command R+等多个热门模型

    2024年04月17日 14:32:00   来源:站长之家

      Ollama软件的最新更新为用户带来了一系列显著的性能提升和新功能。这次更新主要集中在优化软件性能,提高VRAM的利用率,减少内存不足的错误,并改善GPU的运行效率。此外,Ollama还扩展了对一些热门新模型的支持,以满足用户对最新技术的需求。

      功能更新细节

      VRAM和GPU优化: 更新后的Ollama能够更高效地利用可用的VRAM,这有助于减少内存不足的错误,确保软件运行的流畅性。同时,通过优化GPU的利用率,软件能够在处理复杂任务时表现更好,提供更快的处理速度和更高的性能。

      macOS上的模型分割: 对于在macOS系统上运行且VRAM较大的模型,Ollama现在能够将模型在GPU和CPU之间进行分割,这样做可以最大化性能,使得在资源有限的情况下也能运行复杂的模型。

      新增模型支持

      WizardLM2: 这是微软人工智能推出的最先进大型语言模型,它在复杂聊天、多语言、推理和代理使用案例上都有所改进。WizardLM2的加入意味着Ollama用户现在可以利用这一强大的模型进行更多样化和高质量的文本生成任务。

      Snowflake Arctic Embed:这是一个全新的嵌入模型,它的加入为Ollama用户提供了更多的选择,以适应不同的文本处理需求。

      Command R+:这是一款功能强大且可扩展的大型语言模型,专门为RAG(Retrieval-Augmented Generation)用例而构建。Command R+的集成将增强Ollama在文本生成方面的灵活性和准确性。

      Mixtral8x22B: Mistral AI推出的新领先专家混合模型,它结合了专家知识和混合模型的优势,为用户提供更高质量的输出结果。

      DBRX:由Databricks创建的大型132B开放通用用途LLM,DBRX的加入使得Ollama用户能够利用这一大规模模型进行广泛的应用,从数据分析到自然语言处理等多个领域。

      通过这次更新,Ollama不仅提高了自身的性能和稳定性,还通过支持新的模型,为用户提供了更多的选择和可能性。这些改进将帮助用户更高效地完成任务,同时也为探索人工智能的潜力开辟了新的道路。无论是研究人员、开发者还是普通用户,都能够从Ollama的新功能和模型支持中受益。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    华为Pura70 系列不怕丢!云空间实现楼层级设备查找

    华为 Pura70 系列突然先锋开售,你抢到了吗?对于这次的新机来说,除了一如既往的优雅设计和强悍的硬件配置外,我们更为关注的则是其全球首发的「楼层级设备查找」功能,软实力也可以很硬核!

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。