🎯 Paper Under Submission

Arxiv

Benchmarking LLM-as-a-Judge for Long-Form Output Evaluation

Junjie Chen, Yuxi Dong, Haitao Li, Weihang Su, Yujia Zhou, Min Zhang, Yiqun LIU, Qingyao Ai

Arxiv

Multi-Source Retrieval and Reasoning for Legal Sentencing Prediction

Junjie Chen, Haitao Li, Qilei Zhang, Zhenghua Li, Ya Zhang, Quan Zhou, Cheng Luo, Yiqun LIU, Min Zhang, Yueyue Wu, Dongsheng Guo, Qingyao Ai

Paper | Code

✍️ Publications

AAAI 2026

Simulating Dispute Mediation with LLM-Based Agents for Legal Research

Junjie Chen, Haitao Li, Minghao Qin, Yujia Zhou, Yanxue Ren, Wuyue Wang, Yiqun Liu, Yueyue Wu, Qingyao Ai

AAAI 2026 Main, Long Paper, CCF-A

Paper | Code

AAAI 2026

Auto-PRE: An Automatic and Cost-Efficient Peer-Review Framework for Language Generation Evaluation

Junjie Chen, Weihang Su, Zhumin Chu, Haitao Li, Yujia Zhou, Dingbo Yuan, Xudong Wang, Jun Zhou, Yiqun Liu, Min Zhang, Shaoping Ma, Qingyao Ai

AAAI 2026 Main, Long Paper, CCF-A

Paper | Code

NCIIP 2025

Enhancing LLM-Based Agents via Global Planning and Hierarchical Execution

Junjie Chen, Haitao Li, Jingli Yang, Yiqun Liu, Qingyao Ai

NCIIP 2025, Best Paper

Paper | Code

NTCIR-18

Overview of the NTCIR-18 Automatic Evaluation of LLMs (AEOLLM) Task

Junjie Chen, Haitao Li, Zhumin Chu, Yiqun Liu, Qingyao Ai

NTCIR-18

Paper | Code

ACL 2025 Main

LegalAgentBench: Evaluating LLM Agents in Legal Domain

Haitao Li*, Junjie Chen*, Jingli Yang, Qingyao Ai, Wei Jia, Youfeng Liu, Kai Lin, Yueyue Wu, Guozhi Yuan, Yiran Hu, Wuyue Wang, Yiqun Liu, Minlie Huang (* Equal contribution)

ACL 2025 Main, Long Paper, CCF-A

Paper | Code

ACL 2025 Main

CalibraEval: Calibrating Prediction Distribution to Mitigate Selection Bias in LLMs-as-Judges

Haitao Li, Junjie Chen, Qingyao Ai, Zhumin Chu, Yujia Zhou, Qian Dong, Yiqun Liu

ACL 2025 Main, Long Paper, CCF-A

Paper | Code

SIGIR 2025

LexRAG: Benchmarking Retrieval-Augmented Generation in Multi-Turn Legal Consultation Conversation

Haitao Li, Yifan Chen, Yiran Hu, Qingyao Ai, Junjie Chen, Xiaoyu Yang, Jianhui Yang, Yueyue Wu, Zeyang Liu, Yiqun Liu

SIGIR 2025, Long Paper, CCF-A

Paper | Code

Survey

LLMs-as-Judges: A Comprehensive Survey on LLM-Based Evaluation Methods

Haitao Li, Qian Dong, Junjie Chen, Huixue Su, Yujia Zhou, Qingyao Ai, Ziyi Ye, Yiqun Liu

Paper