キャリアコンサルタントが徹底サポート

発話音声からアルツハイマー型認知症を検出するアプリを開発

2159 posts

アルツハイマー病を早期に検出するための簡便な自己検査ツールとして、発話音声から認知機能障害の特徴を分析するモバイルアプリを開発しました。発話内容や話し方の特徴について音声認識を用いて自動で解析し、認知機能障害を高精度に検出できることが、初めて示されました。

 

認知症の主たる原因疾患であるアルツハイマー病(AD)は、その早期段階である軽度認知障害(MCI)期から予防・治療を開始することが重要であり、在宅や介護予防教室などでも簡便に利用できる検査ツールの開発が求められています。その一つとして、発話音声から抽出可能な言語的特徴(何を話したか)は、ADの早期検出・予測での有効性が示されている一方、実用上、発話をテキストに変換する音声認識の精度に問題がありました。

本研究では、5つの課題に音声で回答することで自己検査可能な、認知機能障害の早期検出を支援するモバイルアプリ(プロトタイプ)を開発しました。これらの課題は従来の認知機能検査を元にしており、写真を言葉で説明したり、動物の名前をできるだけ多く挙げる課題などが含まれます。このアプリを用いて、健常例、MCI例、AD例の3群から音声データを収集し解析を行った結果、音声認識が完璧ではない音声データについても、MCIやADで有意に変化する語彙力や情報量に関する言語的特徴を正確に推定できることが分かりました。さらに、音響韻律的特徴(どのように話したか)と組み合わせて、機械学習モデルを構築し、MCIを88%、ADを91%の精度で検出できることが示されました。 

本研究成果は、高齢者の発話や方言を含む言い回しなど、音声認識が苦手とする音声データからでも、認知機能障害に関連する言語的特徴を適切に推定し、自己検査を通じMCIとADを簡便で高精度に検出できる可能性を示した初めての研究です。このようなツールにより、認知症の早期発見・早期介入への貢献が期待されます。

 

研究代表者

筑波大学 医学医療系

新井哲明 教授

 

研究の背景

世界的に高齢化が進む中で、認知症注1対策は喫緊の課題です。本邦における認知症患者数は、2012年の時点で462万人と推計され、2025年には700万人を超えると予想されています注2。認知症の過半数を占めるのはアルツハイマー病注3(Alzheimerʼs disease: AD)で、その予防・治療は、軽度認知障害注4(mild cognitive impairment: MCI)を含む早期段階から開始することが極めて重要ですが、とりわけ、近年のコロナ禍においては、専門機関の受診が妨げられ、問題が深刻化しています。さらに、MCIを含む早期段階でアルツハイマー型認知症を診断する方法は確立していない上、現在、実施可能で比較的信頼度が高いとされている検査法は、高価であるか身体的侵襲性が高く、一般の医療機関で行うことは困難です。こうした中で、在宅や介護予防教室等でも安価で簡便に、MCIやADを検出できるツールが求められています。一方、認知機能検査中の発話音声から言語的特徴(何を話したか)を抽出し活用することで、従来の認知機能検査よりも高い精度を達成する研究が幾つも報告されています。こうした発話音声の解析を自動化することが、ツール開発の一助になると期待されていますが、発話をテキストに変換する音声認識は、高齢者の発話や方言を含む言い回しで特に精度が悪く、これまでの研究の多くは、人手による書き起こしを用いて解析を行ってきました。

 

研究内容と成果

そこで本研究では、MCIやADで有意に変化し、音声認識精度にも頑健な言語的特徴に着目し、5つの課題に音声で回答することで自己検査可能な認知機能障害の早期検出支援のためのモバイルアプリ(プロトタイプ)を開発しました。これらの課題は、従来の認知機能検査を元にしており、写真を言葉で説明する課題や、動物の名前をできるだけ多く挙げる課題などが含まれます。このモバイルアプリの検証のために、健常例43名、MCI例46名、AD例25名の3群合計114人から音声データを収集し解析を行いました。

まず、認知機能障害に関連する言語的特徴を自動で推定することが可能かを検証しました。音声認識を用い自動で変換したテキストを、人手で書き起こしたテキストを正解として、その認識精度を検証したところ、単語誤り率は32%でした。これは、英語などのその他の言語を含む過去の類似研究と同程度に誤りを多く含むものでした。他方、音声認識を用いて自動変換したテキストから抽出した言語的特徴は、人手で書き起こしたテキストから抽出した特徴とほぼ一致しており(図1A)、MCIやADで有意に変化する語彙力や情報量に関する言語的特徴を正確に推定できることを示しました。さらに、音響韻律的特徴(どのように話したか)と組み合わせて機械学習モデルを構築することで、MCIを88%、ADを91%の精度で検出できることを示しました(図1B、1C)。

 

今後の展開

本研究結果は、モバイルアプリによる自己検査を通じて、高齢者の発話や方言を含む言い回しなど、音声認識が苦手とする音声データからでも、認知機能障害に関連する言語的特徴を正確に推定し、MCIとADを高精度かつ安価で簡便に検出できる可能性を示した初めての成果です。このようなツールは、アルツハイマー型認知症以外の認知症性疾患の他、言語的変化を伴う統合失調症やうつ病などの精神疾患にも適用可能であり、疾患の早期検出だけではなく、進行度の推定や介入効果の定量化などにも役立つと考えられます。

 

参考図

図1モバイルアプリを用いた発話音声の解析結果

A:言語的特徴の一つである語彙力に関連する指標Brunét's indexについて、人手で書き起こしたテキストから抽出した値(横軸)と、音声認識を用いて自動で抽出した値(縦軸)とを比較した散布図。

B: 言語的特徴および音響韻律的特徴について、軽度認知障害群(MCI)、アルツハイマー病群(AD)について、健常群(Control)の平均値・標準偏差をもとに標準化されたスコア。†がついている特徴量は、見やすさのために符号を逆転している。(Total number of information units: 写真説明課題における説明の情報量に関する指標、Pitch variation: 声の抑揚の程度、Pauseduration: 発話間の無音区間の⻑さ、Variance of MFCC5: スペクトラムに関する音響特徴のばらつき、Phonemerate: 話すスピードに関する指標)

C: 自動音声認識に基づく言語的特徴および音響韻律的特徴を組み合わせて構築した機械学習モデルの分類結果。図は混同行列で、それぞれの値は割合(例数)となっている。対角成分が予測の正しさの程度を、非対角成分が予測の誤りの程度を表している。

 

用語解説

注1)認知症:記憶、見当識、実行機能、視空間機能などの認知機能の障害によって、仕事や日常生活に支障を来す疾患の総称。せん妄(意識障害)や精神疾患に伴う認知機能障害は認知症には含まれない。

注2)厚生労働省「認知症施策推進総合戦略(新オレンジプラン)〜認知症高齢者等にやさしい地域づくりに向けて〜」より(2015年)

注3)アルツハイマー病:認知症の原因として最も多い疾患。通常、記憶や見当識の障害から始まり、緩徐に進行する。65歳以降の老年期に発症することが多いが、50歳台〜60歳台前半に発症することもある(若年性アルツハイマー型認知症)。脳内に、アミロイドβタンパクとタウタンパクという2種類のタンパク質が蓄積することが病態に関係すると考えられている。

注4)軽度認知障害:物忘れなどの軽い認知機能障害の訴えが本人あるいは家族からあるが、日常生活全般には支障がない状態。その一部が認知症に移行することから、本症が認知症の前段階を示している場合がある。

 

研究資金

本研究は、筑波大学とIBMResearch社との共同研究契約に基づいて行われました。また、日本学術振興会科学研究費の一環として実施されました。

 

掲載論文

【題名】

A mobile application using automatic speech analysis for classifying Alzheimer's disease and mild cognitive impairment(アルツハイマー型認知症早期検出のための自動音声認識を用いたモバイルアプリケーション)

【著者名】

Yasunori Yamada,KaoruShinkawa, Miyuki Nemoto,Kiyotaka Nemoto,Tetsuaki Arai

【掲載誌】

Computer Speech &Language

【掲載日】

2023年3月22日

【DOI】

10.1016/j.csl.2023.10151 

詳細▶︎https://www.tsukuba.ac.jp/journal/medicine-health/20230403140000.html

注)プレスリリースで紹介している論文の多くは、単純論文による最新の実験や分析等の成果報告に過ぎました。 、さらに研究や実験を進める必要があります。 、専門家の指導を受けるなど十分に配慮するようにしてください。

発話音声からアルツハイマー型認知症を検出するアプリを開発

最近読まれている記事

企業おすすめ特集

編集部オススメ記事