音声認識アルゴリズム「黒人がなんか喋ってるけど何言ってんのかわかんなくてワロタ」

投稿日：2020年4月19日

1: なまはげ君(東京都) [SA] 2020/04/19(日) 17:08:28.53 ID:DqaXzzkq0● BE:969416932-2BP(2000)

音声認識アルゴリズムはスマートスピーカーやスマートフォンなど、さまざまなデバイスやアプリケーションに採用されており、もはや日常の一部となっています。
ところが、AppleやAmazon、Google、IBM、Microsoftなどの音声認識アルゴリズムを使った実験で、「音声認識アルゴリズム白人の声と比較して黒人の声を上手く認識できない」問題があることが判明しました。

音声認識アルゴリズムはスマートアシスタントの操作や音声入力、文字起こしサービスなど、さまざまなアプリケーションに採用されています。
音声を認識するシステムには機械学習アルゴリズムが用いられており、開発者らが用意した音声データやテキストデータで機械学習アルゴリズムが訓練されています。

そんな音声認識アルゴリズムの精度を調査するため、スタンフォード大学の研究チームはApple、Amazon、Google、IBM、Microsoftの音声認識アルゴリズムに対し、さまざまな人が話した音声を文字に変換させる実験を行いました。
実験に用いられた音声は合計で19.8時間分であり、42人の白人と73人の黒人によって話された2141個の音声で構成されていたとのこと。また、話者の44％が男性であり、平均年齢は45歳だったそうです。

実験の結果、各社の音声認識アルゴリズムは平均で白人が話した単語のうち19％を誤認しましたが、黒人が話した単語が誤認される割合は35％に上りました。また、エラー率は黒人男性で全体の41％、黒人女性のエラー率は30％でした。

以下のグラフが、各社の音声認識アルゴリズムによる白人話者のエラー率と黒人話者のエラー率を比較したもの。どの音声認識アルゴリズムにおいても、黒人が話す言葉のエラー率が白人の話す言葉のエラー率を上回っていることがわかります。
Appleの音声認識アルゴリズムが最もエラー率が高く、黒人話者のエラー率は45％、白人話者のエラー率は23％。最も成績がよかったMicrosoftの音声認識アルゴリズムでも、黒人話者のエラー率は27％、白人話者のエラー率は15％となりました。

スタンフォード大学の工学准教授であるSharad Goel氏は、「結果は特定の企業に限定されるものではありません。5社全てに類似したパターンが見られました」と述べています。

過去にもアルゴリズムやソフトウェアが人種的な偏りを持つケースは報告されており、Google Photosが黒人を「ゴリラ」と認識してタグ付けしてしまった事例や、人種に関するデータが存在しない医療システムで黒人が不平等に評価されるケースも判明しています。

一連の問題は、機械学習アルゴリズムを訓練する際のデータセットに存在する偏りが原因の可能性が高いと考えられています。
訓練に使用されるデータそのものが白人話者の音声を豊富に含み、黒人話者の音声をあまり含んでいない場合、音声認識アルゴリズムが黒人話者のアクセントや話し方を上手く学習できず、エラー率が高くなってしまうとのこと。

このまとめの続きはコチラ！

-Web系関連記事：プログラミング、開発関連

: レジでのキャッシュレス決済は現金よりも16秒早く完了、JCB調査

1: 田杉山脈 ★ 2019/08/31(土) 19:46:47.43 _USER
JCBは、現金、クレジットカード、非接触型決済、QRコード決済の4つの決済方法を対象に、決済速度に関する実証実験を行った。　調査対象者は20代～40代の男女100人。非接触型決済はQUICPay、クレジットカードはサイン…

: 「物質を破壊して色を表現」　京都大iCeMS、新印刷技術を開発

1: 田杉山脈 ★ 2019/06/20(木) 19:19:44.56 _USER
アクリル樹脂などに代表されるポリマーに規則的に亀裂を入れることで発色させる新たな印刷技術を開発したと、京都大物質－細胞統合システム拠点（iCeMS、アイセムス）のシバニア・イーサン教授（化学工学）らの研究グルー…

: 「英語話せない」小学校教師の不安　ロボットも教壇に

1: 田杉山脈 ★ 2019/03/27(水) 19:56:54.40 _USER
2020年度から小学校で新たに採用される学習指導要領。「英語」が教科になり、「プログラミング」も加わる。受け身ではなく、自ら能動的に学ぶ「アクティブラーニング」の仕組みも導入される。大きく変わる方針に教科書は…

: 人間の耳は約20kHzまでしか聞こえない、「ハイレゾ音源」に意味はあるのか

1: 田杉山脈 ★ 2019/10/31(木) 20:50:11.53 _USER
プロの現場に「ハイレゾ音源」は必要　人間の耳は約20kHzの音までしか聞こえないのに、「ハイレゾ音源」に意味はあるのか──。　ハイレゾ音源を語る際に常に論争を呼ぶテーマがこの「20kHz問題」だ。解像度24bitと…

: Windows10次期大型アップデートでコマンドプロンプトがカラーに対応！IBM PCの制限がついに廃止

1: 名無しさん＠涙目です。(catv?) [ﾆﾀﾞ] 2019/01/01(火) 20:19:43.95 BE:323057825-PLT(12000)
Windows 10の次期大型アップデートで現在プレビュー版が提供されている19H1（来年4月にリリース予定）では、コンソールが改良された。具体的には、文字色と背景色で「デフ…

PREV: 孫正義「無償でPCR検査やるよ」日本人「検査すると医療崩壊する！テロやめろ！」←これなんだったの？
NEXT: マクドナルド、田舎以外の全店舗で店内での飲食禁止へ

: 2024/11/21

【急募】Memeコインで億る方法

: 2024/11/21

中国の通販サイト、まじで終わってる

: 2024/11/21

【緊急】ビットコイン、1500万円超え

: 2024/11/21

ワイ「そのガジェット乾電池式なのがネックだよね？」敵「乾電池式の方が便利だぞ！」

: 2024/11/21

【悲報】ワイの7年使ったスマホ、ガチでヤバい