本研究旨在評估大型語言模型(LLM)在為自閉癥兒童照護者提供實時、情境感知的干預建議方面的有效性。系統(tǒng)基于親子互動觀察數(shù)據(jù),使用三種提示策略生成照護建議。
您將看到一個家庭的三個親子互動錄像、LLM生成的干預建議,以及視頻的總結(jié)與提醒內(nèi)容,每個錄像分別完成互動任務(wù):(1)自由玩(2)搭積木(3)講故事 / 象征游戲。
對于每個互動任務(wù),請按照以下步驟完成評估任務(wù)。
第一部分:段落級評估(每一分鐘段落)
每段視頻為一分鐘時長,共3~5段。
系統(tǒng)根據(jù)每段的互動質(zhì)量提供了照護或干預建議。
第二部分:視頻總結(jié)與提醒評估(每5分鐘視頻一輪)
在看完視頻之后,系統(tǒng)展示該視頻的“總結(jié)與提醒”內(nèi)容。
第三部分:家庭互動反饋報告(每3個視頻一輪)
在看完三個視頻之后,系統(tǒng)基于父母心智化教養(yǎng)干預技術(shù),展示該家庭互動反饋報告,包含互動建議與問題總結(jié)。
各部分末尾:開放補充
您可以在每個段落或總結(jié)評分后,填寫“開放補充意見”,例如:
(1)哪種建議語言最符合實際?
(2)模型的誤判點有哪些?
(3)哪些提示策略在該任務(wù)中表現(xiàn)更具優(yōu)勢?