第一生活网

谷歌推出Titans模型:仿生设计引领200万Token上下文长度新突破

封辰顺
导读 谷歌研究院发布了创新的Titans模型架构,采用仿生设计实现了200万Token的上下文长度突破,并计划未来开源相关技术。该架构的核心是深度神经...

谷歌研究院发布了创新的Titans模型架构,采用仿生设计实现了200万Token的上下文长度突破,并计划未来开源相关技术。该架构的核心是深度神经长期记忆模块,设计灵感源自人类记忆系统,结合了短期记忆的快速响应和长期记忆的持久性。

Titans在处理长序列任务中表现出色,尤其在语言建模和时间序列预测方面取得突破性进展,甚至在某些场景下超越了参数量更大的GPT-4等模型。谷歌承诺开源相关技术,Titans的出现可能为AI领域长文本处理带来新方向,展示了在减少模型参数的同时提升处理效能的潜力。