研究成果
Reasoning Model Is Superior LLM-Judge, Yet Suffers from Biases
Hui Huang, Xuanxin Wu, Muyun Yang, Yuki Arase
ACL 2026 Workshop on Evaluating Evaluations (EvalEval)
2026年7月
現在、受賞データはありません。
Hui Huang, Xuanxin Wu, Muyun Yang, Yuki Arase
ACL 2026 Workshop on Evaluating Evaluations (EvalEval)
2026年7月
現在、受賞データはありません。