©2018 by IISR. Proudly created with Wix.com

問題產生

Question Generation

問題產生(Question Generation)是指利用自然語言處理技術,針對一篇文字、一段語音、一個主題,抑或是一張圖片去產生相對應的問題。問題的應用及目的相當廣泛,而最常見的即是利用問題來獲取資訊。在學習方面,我們常以問題來檢測學習者對於內容的了解程度;醫療方面,初步的問診及病人分類可以利用回答問題來解決,進而減輕醫師負擔;而在聊天機器人上,問題可以用來延續對話,並且從中得到使用者更多的訊息。

目前實驗室研究成果如下:

  • 基於故事文本之互動問題生成

現在人手一支智慧型手機,除了大人常用來處理事情、打發時間外,小孩子也常用手機觀看卡通、玩遊戲。而智慧型手機的盛行也造成許多人有沉迷上癮的問題,更造成學童閱讀能力退步。比起紙本的故事書,我們使用聊天機器人的形式來和小孩子互動,不但可以增加他們的專注度,自動生成問題的系統也能大大降低人力及時間成本。 我們利用Stanford的工具對文本標註,並利用標註後的結果來生成問句,最後以聊天機器人的方式來與聆聽者互動。根據故事內容與主題,我們一開始設計出「誰」、「什麼」、「哪裡」、「什麼時候」以及「怎麼樣」的問題來引導聆聽故事者能夠更深入了解一篇故事,而問題的設計根據就是文本切割並標註後的結果。最後,在產生故事問題資料庫後,聊天機器人端會隨機挑選問題來做詢問。

 

目前Deep Learning也有應用在Question Generation的領域,機器會根據資料內容自我學習,相較於傳統方式,節省了許多人工定義規則的成本,且能產生更多樣性的問法。通常模型的架構分為兩個部分,encoder與decoder,都是以Recurrent Neural Network組成,encoder主要在處理輸入的資訊進而之傳遞給decoder輸出最終結果。