风险提示:理性看待区块链,提高风险意识!
FlagEval大语言模型评测9月榜:Baichuan2排名第一
首页 > 快讯 2023-09-19 11:59:23
币界网报道:据 TechWeb 9 月 19 日报道,国内权威评测体系 FlagEval(天秤)公布最新 9 月榜单大模型评测结果。基于最新 CLCC v2.0 主观评测数据集,FlagEval(天秤)9 月榜重点评测了近期大热的 7 个开源对话模型。从整体结果来看,Baichuan2-13 b-chat、Qwen-7 b-chat、Baichuan2-7 b-chat 名列前茅,准确率均超过 65%。在基座模型榜单中,Baichuan 2、Qwen、InternLM、Aquila 的客观评测结果表现均超越同参数量级的 Llama 及 Llama2 模型。在 SFT 模型榜单中,Baichuan 2-13 B-chat、YuLan-Chat-2-13 B、AquilaChat-7 B 名列前三。在客观评测两个榜单中,Baichuan 2 均表现出优异性能,基础模型测试在中英文领域均全面超越 Llama 2。据悉,FlagEval(天秤)是北京智源人工智能研究院推出的大模型评测体系及开放平台,旨在建立科学、公正、开放的评测基准、方法、工具集,协助研究人员全方位评估基础模型及训练算法的性能。FlagEval 大语言模型评测体系当前包含 6 大评测任务,近 30 个评测数据集,超 10 万道评测题目。
上一篇: 公链Canto正迁移至由PolygonCDK套件支持的ZKL2
下一篇: 李家超:已要求警方及证监会于今日下午会见媒体交代JPEX相关事件
推荐专栏
Boss Wallet Web3 Econom Pass
专注币圈最新资讯
通俗浅显地聊透Web3大事小情
读懂区块链生态与未来,尽在币界网!
热门币种
更多
币种
美元价格
24H涨跌幅
BTC比特币
66,209.59 USDT
¥472,544.46
-1.15%
ETH以太坊
3,074.62 USDT
¥21,943.87
-1.44%
BNB币安币
574.47 USDT
¥4,100.04
-0.66%
USDT泰达币
1.01 USDT
¥7.20
+0.12%
SOL
171.11 USDT
¥1,221.22
-1.96%
XRP瑞波币
0.51010 USDT
¥3.64
-2.19%
USDC
1.00 USDT
¥7.14
+0.04%
TON
6.30 USDT
¥44.99
-1.85%
DOGE狗狗币
0.14920 USDT
¥1.06
-2.86%
ADA艾达币
0.46960 USDT
¥3.35
-2.61%
热搜币种
更多
币种
美元价格
24H涨跌幅
Filecoin
5.5472 USDT
¥39.34
-5%
比特币
66209.35 USDT
¥469,510.36
-1.13%
Solana
169.61 USDT
¥1,202.76
-2.21%
Arweave
47.2199 USDT
¥334.85
-0.38%
ChainLink
16.3687 USDT
¥116.08
+0.81%
Fantom
0.8488 USDT
¥6.02
-4.56%
Livepeer Token
18.6347 USDT
¥132.14
-2.41%
Gala
0.043174 USDT
¥0.31
-5.59%
Yield Guild Games
0.8495 USDT
¥6.02
-5.13%
以太经典
27.6914 USDT
¥196.37
-3.01%
Shiba Inu
2.378E-5 USDT
¥0.00
-4.27%
狗狗币
0.1487 USDT
¥1.05
-3.13%
最新快讯
更多
尽管近期价格下跌且存在技术阻力,但PEPE仍显示出看涨迹象
2024-05-20 05:08:02
分析师预测以太坊ETF获批
2024-05-20 05:03:44
2024年可能超过比特币的Altcoins
2024-05-20 05:03:00
小心:重要的一周来了——新的一周有很多经济发展和Altcoin活动——这是一个逐日、逐小时的列表
2024-05-20 05:02:11
BlockDAG的Dashboard在Ripple的大型XRP交易和比特币现金下降的情况下,以700%的涨幅活跃投资者活动
2024-05-20 05:01:15
比特币价格超过67000美元,面临市场波动
2024-05-20 05:00:03
比特币全网未确认交易数量为106,509笔
2024-05-20 04:51:52
下载币界网APP