연구
The Long-Horizon Task Mirage? Diagnosing Where and Why Agentic Systems Break
arXiv:2604.11978v1 Announce Type: new Abstract: Large language model LLM agents perform strongly on short and midhorizon tasks, but often break down on longhorizon tasks that require extended, interdependent action sequences.
이 콘텐츠는 ArXiv AI 원본 기사의 요약입니다. 전문은 원본 사이트에서 확인해주세요.
원문 기사 보기 →