栏目导航
首页
家电百科
实时讯息
常识
首页
家电百科
实时讯息
常识
当前位置:
首页
>
红杉
>
红杉中国正式开源AI基准测试xbench评测集
2025-06-18 08:31:00
6月18日,红杉中国正式开源其AI基准测试工具xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch。红杉中国表示,未来将基于大模型和AI Agent的发展情况不断动态更新评测集,并且采用“黑白盒”机制,既保证xbench的发展可以服务更多的大模型和Agent开