最近,一组来自斯坦福大学、康奈尔大学和西弗吉尼亚大学的计算机科学家与法律学者共同发表了一项引人瞩目的研究,分析了几款开源大型语言模型在文本记忆方面的表现。这项研究着重考察了五种不同的开放权重模型,它们的能力是否能够重复经典书籍中的内容。这五款模型中,有三款来自 Meta,另外两款分别由微软和 EleutherAI 开发。
研究团队采用了 Books3这一流行的书籍数据库,作为训练这些大模型的素材,值得一提的是,这些书籍中许多依然受到版权保护。研究者们将36本书划分为多个重叠的100个标记段落,然后利用前50个标记作为提示,计算接下来的50个标记与原文相同的概率。如果逐字重复的概率超过50%,那么这段内容就被标记为 “已记住”。
令人惊讶的是,Meta 于2024年发布的 Llama3.170B 模型在回忆《哈利波特》第一部的表现中,竟能记住42% 的内容。而相比之下,Meta 在2023年发布的 Llama165B 模型仅能回忆起4.4% 的内容。这一显著提升引发了学术界的广泛关注。研究人员还发现,相较于冷门书籍,Llama3.170B 在热门书籍如《霍比特人》和乔治・奥威尔的《1984》中的记忆能力更为突出,记忆量远高于其他模型。
这一研究成果不仅展示了大型语言模型在文本记忆方面的显著进步,也引发了人们对未来 AI 技术在处理和理解文本内容能力的期待。可以说,随着技术的发展,人工智能正在不断接近人类的认知水平。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。