会話でパーキンソン病を診断:自然言語処理と機械学習による発話解析の成果

1797 posts

名古屋大学大学院医学系研究科神経内科学の勝野雅央教授、横井克典客員研究者(筆頭研究者、国立長寿医療研究センター脳神経内科)の研究グループは、愛知県立大学情報科学部の入部百合絵准教授、豊橋技術科学大学情報・知能工学系の北岡教英教授と共同で神経変性疾患※1のひとつであるパーキンソン病※2に関する研究、解析を行いました。自然言語処理※3の技術を用いて会話内容の解析を行うことで、パーキンソン病患者の会話の特徴の把握と、自由会話テキストからのパーキンソン病の診断の可能性を検討しました。

パーキンソン病患者は、発声の障害や言語の障害など、様々な発話に関する問題に遭遇します。勝野教授らの本研究チームは、パーキンソン病における言語変化の病態生理学的メカニズムを解明するために、自然言語処理の技術を用いて、患者の発話と健常対照者の発話を比較しました。本研究では、認知機能が正常なパーキンソン病患者 53 名と健常対照者 53 名の会話を録音し、その内容を文章に書き起こしました。次に、書き起こしたテキスト情報について自然言語処理を用いて分析し、さらに機械学習アルゴリズムを用いて各グループの会話の特徴を明らかにすることを試みました。この分析では、品詞と構文の複雑さに焦点を当てた 37 の特徴量を評価項目とし、サポートベクターマシン(SVM)※4を用い、10 分割交差検証法※5でこれらの特徴量のうち、パーキンソン病患者の会話の識別に有効な項目を絞り込み、各群の識別率についても検証しました。本研究での解析により、パーキンソン病患者は健常対照者群に比べ、1 文あたりの品詞数の数が少ないことがわかりました。また、パーキンソン病患者は健常対照者と比較して、会話文全体での動詞の割合、格助詞の分散(データのばらつきをしめす指標)、1 文あたりの動詞の割合が高く、1 文あたりの普通名詞、固有名詞、フィラー※6の割合が低いことがわかりました。このような会話の変化を利用して、パーキンソン病患者または健常対照者のそれぞれの識別を試みたとき、その識別率はそれぞれ 80%以上でした。

本研究の結果から、パーキンソン病患者の会話には認知機能低下がなくとも健常者と比較して異常があることが示唆されました。このことから、会話内容について自然言語処理を用いて解析することがパーキンソン病の診断の一助となると考えられます。米国科学雑誌「Parkinsonism &Related Disorders」(2023 年 5 月 12 日付の電子版)に掲載されました。

 

ポイント

・パーキンソン病患者は様々な発話に関する問題を有するが、自由会話のテキストの解析と異常の報告はこれまでほとんど行われてこなかった。

・パーキンソン病患者が話す 1 文の品詞数は健常者より少なく、パーキンソン病患者は健常対照者に比べ、動詞の割合が高く、名詞、フィラーの割合が低かった。

・抽出された特徴量を用いることで、80%以上の精度でパーキンソン病患者と健康な方を見分けることができた。

・自然言語処理はパーキンソン病患者の言語障害のメカニズムを解明し、診断精度を高めるために有効な手段であることが示された。

 

背景

パーキンソン病は、アルツハイマー病に次いで 2 番目に多い神経変性疾患です。比較的患者数が多い疾患であり、その有病率は年齢とともに増加します。パーキンソン病は、動作緩慢、筋強剛、安静時振戦などの運動徴候と、認知、精神、睡眠、自律神経、感覚障害などの非運動徴候によって特徴づけられます。これらの症状に加え、パーキンソン病ではコミュニケーション上の変化もよく見られ、発話、音声、心理などさまざまな要因が影響します。既報告によると、パーキンソン病患者の 90%以上が何らかの言語障害を経験していると考えられています。本研究では、自然言語処理を用いて発話テキストを解析し、認知機能低下のないパーキンソン病患者における発話変容の病態生理的メカニズムを明らかにすることを目的としました。

 

研究成果

2012 年 4 月から 2020 年 3 月にかけて、合計 73 名のパーキンソン病患者と 54 名の健常対象者を募集しました。このうち、パーキンソン病患者 17 名と健常対象者 1 名がデータ不足のため除外され、さらに、最終的にレビー小体型認知症と診断された患者 3 名も除外されました。結果として、パーキンソン病患者 53 名(男性 24 名、女性 39 名)、健常対象者 53 名(男性 24 名、女性 39 名)を解析対象としました。年齢、性別、教育年数、MoCA-J※7 の各値に関して、グループ間で有意な差は認めませんでした。

パーキンソン病群と健常対象者群の間で言語流暢性課題(「か」で始まる単語を 1 分間で、できるだけたくさん言ってください)や意味流暢性課題(動物の名前を 1 分間で、できるだけたくさん言ってください)に有意差はありませんでしたが、品詞の数はパーキンソン病群が健常者群より有意に少ないことがわかりました(表 1)。文の数に関しては、有意な群間差は見られませんでした。

 

表 1 各群の言語的特徴

 

次に Wrapper 法※8 を用いて、パーキンソン病群と健常対象者群を識別するための特徴量を選択する試行を 4 回実施しました。10 分割交差法の結果、3 回目の試行で、陽性的中率と陰性的中率のバランスを示す値である F 値が最も良好でした。感度※9、特異度※10、陽性的中率※11、陰性的中率※12は、3 回目の試行ですべて 0.83 を上回っていました(表 2)。

 

表 2 Wrapper 法 3 回目で選択された特徴量を用いた各群の識別の診断精度

 

以上の解析において、パーキンソン病患者と健常者を見分けるのに重要な手がかりとして、動詞の割合、格助詞の分散、1 文あたりの一般名詞、固有名詞、動詞、フィラーの 6 つの特徴量が選択されました。選択された特徴量を分析したところ、6 項目すべてでパーキンソン病群と健常者群との間に有意差が認められました(図 1)。

 

図 1 各特徴量のパーキンソン病患者と健常者の差

 

今後の展開

本研究の結果より、認知障害のないパーキンソン病患者と健常者との間で、会話内容の差異があることが見出されました。具体的には、パーキンソン病患者の会話は健常者に比べて、①自発的な会話で 1 文に話す品詞の数が少なく 1 つの文章が短い、②動詞と格助詞(分散)が多く、名詞とフィラーが少ない、ということなどがわかりました(図 2)。この会話の変化を応用することで、サポートベクタマシンは 80%以上の精度でパーキンソン病と健常者を判別できることがわかりました。これらの結果は、自然言語処理による言語解析の可能性を示唆し、パーキンソン病の診断に利用できる可能性を示唆しました。

今後、認知機能の低下を来したパーキンソン病患者の会話の解析や、パーキンソン病以外のアルツハイマー病を中心とする神経変性疾患の患者の会話の解析を自然言語処理により行っていく予定です。

 

図 2 Parkinson 病患者の会話への自然言語処理

 

用語説明

※1 神経変性疾患:特定の種類の神経細胞が進行性に変性する(死滅する)疾患の総称。神経変性疾患に共通する病理学的な特徴として、神経細胞の中や周囲に異常な蛋白質が蓄積し、それによって特定の種類の神経細胞が障害されることが知られている。パーキンソン病、アルツハイマー病、筋萎縮性側索硬化症などが神経変性疾患の代表的疾患。

※2 パーキンソン病:神経細胞内にαシヌクレインという異常な蛋白質が蓄積し、主に脳内のドーパミン神経に障害を起こすことで、振戦(手足の震え)、筋強剛(筋肉や関節がかたくなる)、動作緩慢、姿勢反射障害(転びやすくなる)などの運動症状を引き起こす進行性の難病。

※3 自然言語処理:自然言語処理とは、人が日常的に使用している言語(自然言語)をコンピュータで機械的に分析することです。様々な手法があります。

※4 サポートベクターマシン:2 クラス分類の線形識別(直線で区分けできること)関数を構築する機械学習モデルの一種です。教師あり学習の分類と回帰で活用可能ですが、おもに分類のタスクにおいて強力な効力を発揮します。

※5 10 分割交差法:データセットを 10 個に分割し,モデルの訓練と評価を 10 回行います.得られた 10 個の評価値の平均をとった値を最終的なモデルのスコアとして扱う方法です.

※6 フィラー:「えーと」、「あのー」といった、それ自体には特に意味がない、間をつなぐためのつなぎ文句のこと。

※7 MoCA-J:軽度の認知障害を評価、早期発見するために開発された検査です。10 分程度の短時間で軽度の認知機能障害の有無について評価することができます。

※8 Wrapper 法:複数の特徴を同時に使って予測精度の検証を行い、精度が最も高くなるような特徴量の組み合わせを探索する方法です。様々な組み合わせでそれぞれ学習を行わせ、その学習結果をもとに組み合わせに優劣をつけて、有効な特徴量を選択します。

※9 感度:ある疾患を持つ人のうち、検査で陽性と正しく判断される割合を感度と言います。感度が高いということは、「疾患を持つ人を、陽性と正しく判定する可能性が高い」ということになります。

※10 特異度:検査で陰性を正しく判断される割合を指します。特異度が高いということは、「疾患を持たない人を、陰性と正しく判定する可能性が高い」ということになります。

※11 陽性的中率:全ての陽性者のうち、実際に陽性だったものを正しく陽性と判定できた割合のことです。

※12 陰性的中率:全ての陰性者のうち、実際に陰性だったものを正しく陰性と判定できた割合のことです。

 

発表雑誌

掲載誌名:Parkinsonism & Related Disorders

論文タイトル:Analysis of Spontaneous Speech in Parkinson's Disease by NaturalLanguage Processing

著者:Katsunori Yokoi, MD, PhD1,2, Yurie Iribe, PhD3, Norihide Kitaoka, PhD4, TakashiTsuboi, MD, PhD1, Keita Hiraga1, MD, Yuuki Satake1, MD, Makoto Hattori, MD,PhD1, Yasuhiro Tanaka, PhD1, Maki Sato1, Akihiro Hori, MD, PhD5, MasahisaKatsuno, MD, PhD1, 6

所属:

1 Department of Neurology, Nagoya University Graduate School of Medicine,Nagoya, Japan

2 Department of Neurology, National Hospital for Geriatric Medicine, NationalCenter for Geriatrics and Gerontology, Obu, Aichi, Japan

3 School of Information Science and Technology, Aichi Prefectural University,Nagoya, Japan

4 Department of Computer Science and Engineering, Toyohashi University ofTechnology, Toyohashi, Japan

5 Kumiai Kosei Hospital, Takayama, Gifu, Japan

6 Department of Clinical Research Education, Nagoya University GraduateSchool of Medicine, Nagoya, Japan

 

DOI: 10.1016/j.parkreldis.2023.105411

English ver.

https://www.med.nagoya-u.ac.jp/medical_E/research/pdf/Par_230512en.pdf

会話でパーキンソン病を診断:自然言語処理と機械学習による発話解析の成果

Popular articles

PR

Articles