연구
RiskWebWorld: A Realistic Interactive Benchmark for GUI Agents in E-commerce Risk Management
arXiv:2604.13531v1 Announce Type: new Abstract: Graphical User Interface GUI agents show strong capabilities for automating web tasks, but existing interactive benchmarks primarily target benign, predictable consumer environments.
이 콘텐츠는 ArXiv AI 원본 기사의 요약입니다. 전문은 원본 사이트에서 확인해주세요.
원문 기사 보기 →