基于 LLM 的剧情 QA 测试