第一生活网

Search-o1:清华人大联袂打造,主动查资料强化推理,性能超人类专家

阙心邦
导读 Search-o1是人大与清华联合推出的最新Agentic搜索增强推理模型框架。在博士级别科学问答、数学、代码能力评测中,Search-o1在11项评测中拿...

Search-o1是人大与清华联合推出的最新Agentic搜索增强推理模型框架。在博士级别科学问答、数学、代码能力评测中,Search-o1在11项评测中拿下10个第一。该框架解决了o1类模型在推理过程中知识不足的问题,通过暂停推理去搜索查找缺少的知识,再返回继续推理。Search-o1结合了RAG和Reason-in-Documents模块,实现了自主知识检索,提升了大型推理模型的可靠性和适用性。在复杂推理任务和开放域问答基准测试中,Search-o1表现突出,整体性能优于人类专家。目前,该项目已开源,可在抱抱脸和GitHub上获取。

Search-o1的核心动机是通过自主检索来增强推理模型。其包含的Reason-in-Documents模块和Agentic RAG机制,确保模型在推理过程中能够自主决定何时检索外部知识,并将精炼后的知识整合回推理链。实验证明,Search-o1在复杂推理任务和多跳QA任务中表现优异,获得网友的广泛肯定。Search-o1的通讯作者是人大高瓴人工智能学院教授窦志成,团队成员来自人大和清华。