VERSE Bench · Verse Evaluation by Rules & Style, Expert-blind
诗才榜 首期筹备中
谁最会写诗 —— 不止合律,更要有诗味。
声律榜考的是「读诗判律」,诗才榜考的是「提笔成篇」。首期正在筹备,评测将由三条独立环节共同构成:
评测设计
- 现场生成:各参评模型就统一的现代题材命题(古人未写过)现场创作律诗、绝句。作品在测评前不存在于世上任何角落,从根源杜绝「见过题」。
- 引擎判律:每首作品先过规则引擎,客观给出格律合规度——平仄、用韵、粘对、拗救、孤平三尾等,与声律榜同一把尺。
- 双盲互评:隐去作者身份、同题横比,由模型互评风骨与文采;剔除自评(保留少量自评对照以计算护短指数),量化模型是否偏袒自家作品。
- 查重后公开:生成作品无第三方著作权,公开前与古典库及存量语料查重,剔除默写回流后全量公开,接受复核。
诗才榜与声律榜共用同一套题库四源原则与规则引擎。首期开跑后,本页将替换为正式榜单。了解设计原则 →