人工智慧普適研究中心 PAIR Labs
具深度理解之對話系統及智慧型輔助學習機器人
計畫主持人:許聞廉教授
摘要
本計畫為小學數學應用題(Math Word Problem, MWP)開發了智慧型學習助手(Intelligent Learning Assistant, ILA),建立一個可解釋的人工智慧(Explainable AI, XAI)案例。ILA能夠自動解出MWP並提供逐步解釋。當ILA犯了錯誤,我們可以很容易地修正;當ILA正確解決問題時,我們可提供解釋讓學生理解其背後的邏輯。本計畫採用統計準則式方法(Statistical Principle-Based Approach, SPBA),保留了統計機器學習(SML)和規則(Rule-Based, RB)方法的優點,同時避免了它們的缺陷。機器人學會了以類似於人類學習的方式解答MWP。MWP解題需要的自然語言理解,除了知識範圍有限,句型較為單純外,一般自然語言研究會遇到的困難,如:指代、省略、倒裝句、文本蘊含(entailment)、剖析、知識本體、推論等等幾乎無所不包。因此,在我們解決了小學數學的自然語言理解後,多輪對談系統所需要的理解模組幾乎已全數完成。目前,我們已實現80%的目標,正在努力實現半自動的知識本體構建和自然語言生成。
關鍵詞
統計準則式演算法(SPBA)、自然語言處理、問答機器人、虛擬助理、語意理解、智慧型代理人
技術創新
大多數機器學習方法的模式識別能達成大約八十幾的F score,然而MWP通常需要幾乎滿分的F score才能得出清晰、合乎邏輯的解釋。此外,蘊含和推斷對於構建整合性的MWP系統至關重要。為實現這一點,需要灌輸robot許多常識,以及利用這些知識的新技術。本計畫已在動詞和名詞框架中安排以上的知識,包括知識本體,以及我們的知識庫和推理系統InfoMap中的各種替代的描述。
- 知識獲取:主要目標是半自動學習知識本體。一個詞的知識本體中的詞串經常會在句子中與該詞一起出現(共現詞組)。通過深度學習,我們嘗試學習NN,NV,AN和名詞分類配對。目前,該項目中學習到的名量詞配對已達到了95%的準確率,而其他配對的準確率也達到了90%。名量詞組在MWP的計算問題中至關重要。總之,共現詞組是解決NL中許多模糊問題的主幹。
- 指代和省略解析:已解決了MWP中的指代和省略(如圖1所示),並利用共現詞組來發掘中文特有的倒裝句。
- 自然語言(NL)腳本:自然語言腳本對我們的自然語言代理軟體很重要。本計畫採用自然語言蘊涵和解答腳本來代替形式邏輯的表示法及推論,為學生提供自然語言的解題過程說明。
- MWP對話系統:在解答了MWP之後,我們的系統可以回答更進一步問題,譬如關於這個問題的不同面向,以及改變問題內的角色和數字,再重新計算等等。將來,我們將處理學生遇到困難時所提出的問題。
- 自然語言生成:給定一個句子,系統能夠生成知識本體的實例。本研究試圖翻轉<句子產生本體實例>這個過程來生成自然語言句子,此步驟對於問答和聊天機器人回應文句的生成至關重要。
預計明年初將完成中文MWP解決方案系統並將其擴展到英文版本。
效益
- 知識積累:相較於SML機器學習只能學到一堆參數和產生一些零散的模組,本系統學習到的本體知識可無縫接軌,用類似於教科書的方式分類、累積和重用,甚至可以依據學生的水平作個人化的應用。此外,本系統之核心程式能夠輕鬆地擴展到其他聊天機器人,以實現對領域知識的深度理解。
- 敘事:許多現有的MWP解題系統採用形式邏輯供robot執行定理證明。傳統上,利用自動定理證明系統產生的結果(例如,在三角學的自動定理證明),很難讓人類直接理解其邏輯原理。由於本系統乃為小學生所設計,因此必須提供類似於人類編寫的解題方案,且提供許多替代描述。此外,MWP的推斷過程並不太複雜,只需要簡單的蘊涵關係就足夠了。目前本研究試圖自動生成如上所述的NL句子,未來可將這一方法進一步擴展,以生成篇章段落和故事。
- NL代理人:本計畫之MWP解題系統是奠基於SPBA構建的NL代理人軟體。InfoMap內的核心程式使用蘊涵腳本,語義框架和實例映射。本項目的MWP解題系統的流程圖如圖2所示。經由這個核心,可以透過語義框架將自然語言句子與MWP中的概念進行匹配,以形成本體實例圖。然後根據解答腳本,利用問題框架和概念來模擬人類的解題過程。本研究以循序漸進的方式捕獲關鍵概念並計算正確答案。未來將繼續研究如何向學生提供更詳細的說明,以協助他們破除盲點,並以聊天機器人的方式產生提示。同時,我們計劃將這些知識納入並整合,以建立一個通用的語言教育AI系統。此AI系統的功能除了錯字、語法檢查,還能提供改述及寫作建議,以大幅提高學生的寫作能力。