访客投递服务 100 HKD 起立即获取！

Easy Branches 允许您在世界任何国家/地区的网络中分享您的客座帖子，以覆盖全球客户今天开始分享您的故事！

Easy Branches

34/17 Moo 3 Chao fah west Road, Phuket, Thailand, Phuket

Call: 076 367 766

[email protected]

大模型落地，苦「最强」久矣

没有刷不了的榜，只有还没 over-fitting 的数据集；没有搞不定的第一，只有还没加够 XX 领域，XX 尺寸，XX 语言的限定词。尽管自 2012 年深度学习复苏之日起，AI 打榜就成为了行业默认惯例，但历来如此，就是真的正确吗？去年 9 月，一篇 LLM 味爆棚的反讽文章，在 arXiv 引起轩然大波《Pretraining on the Test Set Is All You Need》，（别搞大模型了），你只需要在测试集上预训练就够了。吐槽了市面上层出不穷的各种大模型测试

经过: Geekpark.net

Dec 22 2024
35
4467 观点

大模型落地，苦「最强」久矣

大模型落地，苦「最强」久矣

over-fitting XX XX XX 2012 AI 9 LLM arXiv Pretraining on the Test Set Is All You Need phi-1TinyStories phi-1.5 phi-1.5 MMLUGSM8KBig-BenchAGIEval A B 01 Scaling law GPT4 1.8 2.15e… [+940 chars]

有关的

德国赫尔辛推出新型HX-2"x 翼"AI攻击无人机

德国赫尔辛推出新型HX-2"x 翼"AI攻击无人机

三星 Galaxy F16 手机渲染图曝光：多彩外观，5000 万主摄、天玑 6300 芯片

三星 Galaxy F16 手机渲染图曝光：多彩外观，5000 万主摄、天玑 6300 芯片

OpenAI CEO Sam Altman将向特朗普就职典礼基金捐赠100万美元

OpenAI CEO Sam Altman将向特朗普就职典礼基金捐赠100万美元

Arm与高通版权案“开打” 美国法院未做出裁决

Arm与高通版权案“开打” 美国法院未做出裁决

清华洪波：明年将至少开展 30~50 例本土脑机接口植入手术

清华洪波：明年将至少开展 30~50 例本土脑机接口植入手术

效率神器：微软 Win11 为任务栏酝酿文件搜索伴侣，更快、更精准查找文件

效率神器：微软 Win11 为任务栏酝酿文件搜索伴侣，更快、更精准查找文件

人形机器人，能横扫工业场景吗？

人形机器人，能横扫工业场景吗？

微软宣布 2025 年 1 月 6 日起停用 Microsoft 365 标签功能

微软宣布 2025 年 1 月 6 日起停用 Microsoft 365 标签功能

苏姿丰否认Intel-AMD合并传言并谈论人工智能的光明前景

苏姿丰否认Intel-AMD合并传言并谈论人工智能的光明前景

索泰曝光英伟达 RTX 50 系列首批阵容：5090 显卡配 32GB GDDR7 显存

索泰曝光英伟达 RTX 50 系列首批阵容：5090 显卡配 32GB GDDR7 显存

vivo 将开启巴西新征程：JOVI 品牌 2025 年首发

vivo 将开启巴西新征程：JOVI 品牌 2025 年首发

马斯克加码诉讼OpenAI 专家：共享人工智能红利避免数字鸿沟

马斯克加码诉讼OpenAI 专家：共享人工智能红利避免数字鸿沟

分享此页面

Easy Branches 的来宾帖子

跨境追梦：华人移民在全球经济变局中的新机遇与挑战

印尼的双重天堂：火山湖与白沙滩

all our websites

anchor links ads by Easy Branches

下一个

德国赫尔辛推出新型HX-2"x 翼"AI攻击无人机