目良和也,市村匠,山下利之
広島市立大学情報科学部
本論文では質問に対する相手の返答から 発話意図を抽出するための手法を提案する。 具体的には返答文に含まれる肯定/否定の意図を表す要素を 抽出し、それらにファジィ推論を適用することによって 返答文全体の発話意図を推論する。 肯定/否定の意図を表す要素には 1) 真偽疑問文における肯定/否定表現 2) 直接的な発話意図表現 3) 間接的発話表現 の3つがある。 これらの要素は発話文の表層構造と質問の持つ概念に基づいて抽出される。 本手法はあいまいな返答発話からの意図抽出に特に有効である。 本手法を検証するために、WWWを用いた高齢者健診システムのインターフェース 部分に適用し、実験を行なった。
今日の情報化社会において,我々がコンピュータと接する機会は非常に増加している.
それとともにコンピュータ自体も大きく進化してきている.
しかしコンピュータとのインターフェース部分に関しては,いまだにキーボードと
ディスプレイを介したものが主流であり,やりとりされる内容についても
非常にデジタル的な情報が多い.
そこで我々は言語的そして非言語的なコミュニケーションによるインターフェース
について考える[7].
特に情緒表現や柔軟な対話処理によって,より人間らしいコミュニケーションを
目指す.
しかし,現在のシステムにおいて日常会話から話者の意図をとりだすことは困難
である.
以前,美馬は間接発話文から相手の発話意図を理解する方法を提案した[1].
この手法は間接発話文から得られる主動詞の概念から,(1)拒絶,(2)逆,
(3)限定,(4)簡便,(5)不能の5種類の意図属性を決定する.
しかしこの手法では意図属性決定のために多くの厳格な形態素,構文解析
規則が必要である.そのため話し言葉のように構文があいまいなものには
適用しづらい.また質問内容に対する深い概念知識も必要である.
一方熊本のシステムは,文の表層的な知識(原形情報,品詞情報,活
用形情報)と単純な意味情報から特徴量を推定し,発話意図のタイプを抽出する[2].
この手法は表層知識のみを用いているため多少あいまいな構文でも発話意図の
特徴を抽出することが可能である.しかし表層構造のみでは対話中に現れる
多様な表現に対応することが出来ない.
そこで本研究ではファジィ推論を用いてあいまいな話し言葉からその発話意図を
抽出する手法を提案する.具体的には,
表層構造と主動詞の概念に基づいた肯定/否定の意図を表す要素を
返答発話から抽出し,これらにファジィ推論を適用することで返答発話全体の意図を求める.
肯定/否定の要素には
1) 真偽疑問文における肯定/否定表現,
2) 直接的な発話意図表現,
3) 間接的発話表現 の3つがある.
これらの要素は発話文の表層構造と質問の持つ概念に基づいて抽出される.
日本では2000年4月から介護保険制度が実施されている.
この制度は家庭内介護能力の低下や長期入院などの問題に対応しており,
認定者に有料サービスを供給する.
このような背景から高齢者介護の現場にも今後コンピュータが導入されていく
ことは十分考えられる.しかし,高齢者がコンピュータを操作する上で,やはり
インターフェース部分が問題となる.
特に高齢者は``しわがれ声'',``痴呆症''などにより「はい」,
「いいえ」などのキーワードが聞きとりにくかったり発話内容が時々
おかしくなったりすることがある.
本研究ではそのような状況でも相手のあいまいな発話意図を抽出できるような,
多段階の解析を行なう.
2章では返答発話に含まれる肯定/否定の意図要素からのファジィを用いた
返答全体の意図の計算手法を示す.
3章では本研究の土台となる高齢者の健康支援システムについて
述べる.そして4章では老人ホームで行なった調査結果をもとに,
本システムの有効性を検証する.
返答発話が持つ肯定/否定の意図を解析するために,
本研究では発話文の表層構造と質問の持つ概念に基づいて肯定/否定要素を抽出する.
図1にシステムの概要を示す.
被験者から音声による返答が入力されると,
まず入力文章に対して形態素解析及び構文解析を行なう.
次に図2のようにして,
解析結果から表層的な肯定/否定要素を,
さらに質問文の持つ概念知識から間接的な要素を抽出する.
表層的な肯定/否定要素の抽出手法については次節で説明する.
そして抽出したこれらの要素に対してファジィ推論を適用することで
最終的に返答全体の発話意図を推測する.
図1. システムの概要
図2. 肯定/否定要素抽出の流れ
本研究では市村らの高齢者健康支援システム[4]を土台としているため, 日本語を対象としている. また,このシステムは「AはBですか?」のように「はい」「いいえ」で 答えられる真偽疑問文形式で質問を行なうため,それを考慮して 返答から肯定/否定要素を抽出する. 以下に本研究で対象とする肯定/否定要素をおおまかに示す.
質問に対する返答発話には,構文的,意味的にその発話意図を示している部分が 存在している.本研究では真偽疑問文に対する返答意図を肯定と否定に限定し, 返答発話中で肯定や否定を示すような部分(肯定/否定要素)を抽出することによって, 返答発話全体の意図推測に用いる.
質問内容に対する肯定/否定の表明とは,
返答発話単独では意味を持たず,質問文の肯定/否定という形で質問文の
内容に依存して話者の意図を表すものである.
質問内容に対する肯定/否定の表明には一般的に感動詞が使われることが多く、
真偽疑問文の場合,感動詞だけで簡潔かつ非常に強い返答を意味する.
本研究では基礎日本語文法[5]に基づいて,以下の感動詞を対象とする.
肯定: ``はい'', ``ええ'', ``ああ'', ``うん'', ``はあ'', ``そうだ''
否定: ``いいえ'', ``いや'', ``ちがう''
ただし,「だめですね,はい」のように, 返答の途中であらわれたものについては直前の発話文への同意や訂正を表す ことがあるので,返答の最初にあらわれたもののみを対象とする. また,「〜書けませんか?」のような否定形疑問文の場合,「はい」, 「いいえ」の意図が話者と聴者で逆転することがある. しかし本研究で対象とする高齢者の健康支援システム中にある質問には 否定形疑問文は含まれていないため,これについては考慮しない.
返答発話では一般的に質問に用いた述語(主動詞)の肯定形/否定形を用いることが多い.
また,「できる」「している」のように助動詞の肯定形/否定形によって
表現されることもある.
さらに,肯定/否定のニュアンスを持つ副詞も存在し,``とても'',``わりと'',
``少し''などは肯定を,``とてもとても'',``全然'',``めったに''などは
否定を表している.
もし質問の主動詞が返答発話中で使われて,かつ否定の様相を伴わなければ
返答は肯定的な意図を持つと考える.助動詞についても同様である.
肯定/否定表現と組で出てくる副詞についてリストを作成し,該当した場合には
Yes/Noの意図を検出する.
本研究では「とてもとても,とうてい,あまり,たいして,さほど,そんなに,
ちっとも,全く,全然,めったに,さっぱり,少しも」を否定的ニュアンスを
もつ副詞の対象とする[5].
後ろに否定表現があるときはそこから検出できるが,これらの副詞のみが発話
されていても否定を暗示するため,副詞自身も否定の意図を持っていると
判断し,否定要素とみなす.
一方,肯定の意味合いを持つ副詞として,「とても,非常に,だいぶ,ずいぶん,
相当,かなり,わりあい,わりと,わりに,結構,少し,ちょっと,少々,
多少,いくらか,十分,よく,ずっと」を対象とする.
山田[6]は質問に対する間接的な応答を分類している.
本研究では,特に相手の発話意図が肯定であるか否定であるかに
着目するため,これらのうち「間接情報付加」,「非標準理由付加」,
「標準理由付加」の3つに注目する.
「間接情報付加」は質問に対して明確な返答が出来ない時,返答を推測するための
要素を与えている.
「非標準理由付加」はユーザーの返答が標準的ではないものの場合,
その理由を発話している.
「標準理由付加」は標準的ではない返答が導かれそうな要因がありながらそうでない場合,
その理由を発話している.
本研究では次節に示すように,各質問文が肯定的/否定的な意味を推測させるような
述語のリスト(間接肯定/否定述語)を持っている.
そこで返答発話が間接肯定/否定述語を含む時には,
上記のような間接的な意図表現を行なっているとみなし,発話者の意図を
肯定/否定と認識する.
各質問文は,予測される返答に対処するために,返答述語, 間接肯定述語,間接否定述語の3つのデータを持つ. まず返答述語には主動詞と様相の助動詞を挙げている. 以下の例では質問文でもともと「書ける」という述語を用いているため, 返答としては「書けます」,「書けません」といった形が予想される. しかし,「書ける」という述語は「書く」という行為が可能であることを 示している.そこで「出来ます」,「出来ません」のように 可能性に対する肯定/否定といった返答パターンも考えられる. また,間接肯定/否定述語は\ref{ssb間接的な意図表明}節で説明したように, 間接的な意図表明を判別するために用いられる.
次に返答発話のデータ形式を示す.
まず返答中の各文に対して形態素解析,構文解析を行ない,
その結果を格フレーム表現で記述する.
なお本研究では形態素解析にchasenを用いるため,可能を表す接辞 '(kak)-eru'を
分割せず,1つの動詞として扱う.
以下に例を示す.
Q1: 「年金などの書類を一人で書けますか?」
A1: 「はい.書けます.めったに書きませんけど.」
本研究ではこの返答データから発話意図を抽出するが,その際に 質問文の持つ情報も必要となる.
質問文: 「年金などの書類を一人で書けますか?」 返答述語: 書ける,出来る 間接肯定述語: 書く 間接否定述語: 頼む |
返答データ
S1,S2,S3はそれぞれの文を示す. 質問文のデータに基づいて,返答発話から3種類の肯定/否定要素を抽出する.
EA: 質問内容に対する肯定/否定の表明
EB: 直接的な意図表明
EC: 間接的な意図表明
返答発話内に存在するこれらの肯定/否定要素をもとにファジィ推論することに よって最終的な相手の発話意図を解析する.
本章では肯定/否定要素からファジィ推論[7]によって相手の発話意図を解析 する手法について述べる. EA,EB,ECのカテゴリに存在する各要素は EA={EA1,EA2,...,EAm}, EB={EB1,EB2,...,EBn}, EC={EC1,EC2,...,ECl} のように肯定/否定の意図の度合ごとにファジィセットで表現される. これらは0から1の間の値をとる. Pは返答発話全体の意図を表し, EA'={EA1,EA'2,...,EA'm}, EB'={EB'1, EB'2,...,EB'n}, EC'={EC'1,EC'2,...,EC'l} はそれぞれの入力セットを表す. このファジィ推論モデルは以下のMandani手法に基づいている.
Mandani手法
P'は以下の式を満たしている.
μp'(z) = μp1(z) ∧ μp2(z) ∧ … μpk(z)
μp(z)は返答発話の全体的な意図を示している. 図3は肯定/否定意図のファジィ推論モデルを示している.
図3. 肯定/否定意図のファジィ推論モデル
昨今の高齢者の急増によって,医学的なケアだけでなく日々の健康のための
サービスへの要求が高まっ
ている.
日本政府は4月から介護保険法を実施している.
しかしながらそれらは健康な高齢者に対するものではあると言いがたい.
高齢者検診システムは高
齢者のQOL(Quality Of Life)を測定して
健康な日常生活を支援するために構築されている.
このシステムではQOLに関連する50問からなる基本的な質問が用意され,
QOLを知的活動,イライラ度,社会的関心,
生活様式,生き甲斐の5項目について,偏りの程度をグラフ化して表示している.
被験者は図4のようにホームページ上でそれらの質問に答え,その回答は
WWWサーバーに送られる.
WWWサーバーはこれらの返答を受けとり,
計算の結果,システムは被験者に解析結果と健康に関するカウンセリング
コメントを出力する.
またこの結果はofficial health centerに送られ,集計される.
集計結果は,現在の高齢者に必要とされるサービスの選定などに
用いられる予定である.
このようなシステムを各高齢者の家庭に支給することが出来れば,
高齢者介護およびQOLの向上に非常に有効であると考えられる.
しかし経済企画庁の調べによると,日本でのコンピュータ
の普及率は約30%であるが,誰もがコンピュータに慣れている
という訳ではない.
特に高齢者の場合,コンピュータを
使用できる環境にあったとしても,視力や細かな操作などの問題により
実際に使用するには困難を伴うことが多い.
ここでコンピュータに音声発話によるインターフェースを持たせる
ことが出来るならば,この問題は解消する.
さらに,挨拶のような基本的な対話のやりとりや,発話速度や抑揚,
ゼスチャーの認識,また顔画像によるシステムの疑似感情の表出
などの機能を付加することによって,コンピュータに抵抗のある
ユーザに対してより友好的なシステムとなる.
本研究では,前述したWWWベースの健康支援システムに改良を加えるため,
クライアント側のヒューマンインターフェース部分に音声認識,音声合成
機能を付加することにより,キーボード,マウス等を使用しない
相手の意図認識システムを付加する.
その際,自然言語に多い省略,不完全な文法構造,しわがれ声に
よる不完全な音声認識,老人性痴呆症などによる不明瞭な発話意図
などにも対処できるようにする.
また,クライアント側のコンピュータは音声認識,合成機能を備えたWindows
パソコンを想定している.
図4. WWWを用いた高齢者健診システム
我々は本手法をWWWを用いた高齢者健診システムのインターフェース部分に
適用し,被験者の肯定/否定の発話意図を抽出した.
本章では実際の質問と返答発話の例を示す.
まず2.3.2節の例で示した返答発話(1)には
EA,EB,ECの3種類の肯定/否定要素が含まれている.
肯定度の値を図5(a)に示す.
肯定/否定要素 | 肯定度 |
---|---|
EA1: はい | 1.0 | EB1: 出来ます | 1.0 | EB2: めったに | 0.2 | EC1: 書きません | 0.0 |
次に以下の例を示す.
Q2: 「最近物忘れがひどくなったと思いますか?」
A2: 「特に思いませんよ,まだ私は.」
肯定/否定要素 | 肯定度 |
---|---|
EB1: 思いません | 0.2 |
この例は直接的な意図表明にあたる. この場合,発話全体の肯定度は0.2であるため,相手の発話意図を 否定だと解析する.
Q3: 「いらいらすることがありますか?」
A3: 「いいえ.めったに.」
肯定/否定要素 | 肯定度 |
---|---|
EA1: いいえ | 0.0 | EB1: めったに | 0.2 |
この例も直接的な意図表明の例である. この場合,発話全体の肯定度は0.1であるため,相手の発話意図を 否定だと解析する. 図5(d)は間接発話意図の例である.
Q4: 「道に迷うことがありますか?」
A4: 「わしら遠くに遠くに行きたいほうじゃから.」
肯定/否定要素 | 肯定度 |
---|---|
EC1: 行きたい | 0.7 |
この場合,発話全体の肯定度は0.7であるため,相手の発話意図を 肯定だと解析する.
本論文では,ファジィ推論を用いて真偽疑問文に対する返答発話から被験者の意図を
求めるための手法を提案した.
この手法では,返答発話の部分的な文法構造に注目することにより,しわがれ声や
痴呆症などがあっても,
残りの解析可能な部分の情報をもとにして,返答発話から肯定/否定という
被験者の意図を求めることが出来る.
この手法ではまず,返答発話から肯定/否定を表す要素を抽出する.
本論文ではこれらの要素を
1) 質問内容に対する肯定/否定
2) 直接的な意図表明
3) 間接的な意図表明
のような3種類に分類した.
そして質問文の持つ主動詞の概念と
返答発話の形態素及び構文解析結果から肯定/否定を表す要素を
抽出する.抽出された要素はその肯定/否定の適合度合いによって
1〜0の値を持つ.
最終的に抽出された要素の値からファジィ推論を用いて返答発話の肯定/否定
意図を求める.
我々はこの手法をWWWを用いた高齢者健診システムに組み込み,
システムが持っている真偽疑問文
に対する実際の高齢者の返答発話20例を解析した.
その結果,ほとんどの返答発話において被験者の本来の意図と同じ結果が
得られた.
今後は,肯定/否定要素の種類及び検出手法の充実,
肯定/否定の度合を厳密に求めるためのメンバーシップ関数の精度の向上を
行なう予定である.
また,本論文の意図検出手法に基づいた情緒表出処理を付加することによって
より複雑な人間の感情を分析,表現可能とするシステムの構築を目指す.
[1] 美馬秀樹, 泓田正雄, 林淑隆, 青江順一: 自然言語インタフェースにおける間接発話文の意図理解法, 電子情報通信学会論文誌D-II, Vol.J78-D-II, No.5, pp.803-810 (1995).
[2]熊本忠彦, 伊藤昭, 海老名毅: 支援対話におけるユーザ発話意図の認識 --- ユーザ発話文の解析に基づく 統計的アプローチ, 電子情報通信学会論文誌D-II, Vol.J77-D-II, No.6, pp.1114-1123 (1994).
[3]M. Takahashi, T. Yamashita, H. Sakai, T. Takeda and T.Ichimura: An application of facial selection model by fuzzy reasoning to human interface, J.Japan Soc. Fuzzy Theory Systems, Vol.12, No.2, pp.313-320 (2000).
[4]K. Yoshida, T. Ichimura et al.: Analytical System of Health Service needs among Healthy Elderly by using Internet, Proc. of Geontechnology Third Intl. Conf. (1999).
[5]益岡隆志, 田窪行則: 基礎日本語文法 --- 改訂版 ---, くろしお出版 (1992).
[6]山田耕一, 溝口理一郎, 原田直樹: 質問応答システムにおけるユーザ発話モデルと協調的応答の生成, 情報処理学会論文誌, Vol.35, No.11, pp.2265-2275 (1994).
[7]T. Yamashita: Fuzzy Reasoning model of facial selection and its applications, Proc. of the 5th Intl. Conf. on Soft Computing and Information/ Intelligent Systems, pp.201-204 (1998).