IT、ガジェットネタまとめ速報

IT技術やガジェットネタに関するみんなの反応のまとめをチョイスしてお届け!

Web系関連記事: プログラミング、開発関連

音声認識アルゴリズム「黒人がなんか喋ってるけど何言ってんのかわかんなくてワロタ」

投稿日:

1: なまはげ君(東京都) [SA] 2020/04/19(日) 17:08:28.53 ID:DqaXzzkq0● BE:969416932-2BP(2000)
fggdfmaxresdefault

音声認識アルゴリズムはスマートスピーカーやスマートフォンなど、さまざまなデバイスやアプリケーションに採用されており、もはや日常の一部となっています。
ところが、AppleやAmazon、Google、IBM、Microsoftなどの音声認識アルゴリズムを使った実験で、「音声認識アルゴリズム白人の声と比較して黒人の声を上手く認識できない」問題があることが判明しました。

音声認識アルゴリズムはスマートアシスタントの操作や音声入力、文字起こしサービスなど、さまざまなアプリケーションに採用されています。
音声を認識するシステムには機械学習アルゴリズムが用いられており、開発者らが用意した音声データやテキストデータで機械学習アルゴリズムが訓練されています。

そんな音声認識アルゴリズムの精度を調査するため、スタンフォード大学の研究チームはApple、Amazon、Google、IBM、Microsoftの音声認識アルゴリズムに対し、さまざまな人が話した音声を文字に変換させる実験を行いました。
実験に用いられた音声は合計で19.8時間分であり、42人の白人と73人の黒人によって話された2141個の音声で構成されていたとのこと。また、話者の44%が男性であり、平均年齢は45歳だったそうです。

実験の結果、各社の音声認識アルゴリズムは平均で白人が話した単語のうち19%を誤認しましたが、黒人が話した単語が誤認される割合は35%に上りました。また、エラー率は黒人男性で全体の41%、黒人女性のエラー率は30%でした。

以下のグラフが、各社の音声認識アルゴリズムによる白人話者のエラー率と黒人話者のエラー率を比較したもの。どの音声認識アルゴリズムにおいても、黒人が話す言葉のエラー率が白人の話す言葉のエラー率を上回っていることがわかります。
Appleの音声認識アルゴリズムが最もエラー率が高く、黒人話者のエラー率は45%、白人話者のエラー率は23%。最も成績がよかったMicrosoftの音声認識アルゴリズムでも、黒人話者のエラー率は27%、白人話者のエラー率は15%となりました。

スタンフォード大学の工学准教授であるSharad Goel氏は、「結果は特定の企業に限定されるものではありません。5社全てに類似したパターンが見られました」と述べています。

過去にもアルゴリズムやソフトウェアが人種的な偏りを持つケースは報告されており、Google Photosが黒人を「ゴリラ」と認識してタグ付けしてしまった事例や、人種に関するデータが存在しない医療システムで黒人が不平等に評価されるケースも判明しています。

一連の問題は、機械学習アルゴリズムを訓練する際のデータセットに存在する偏りが原因の可能性が高いと考えられています。
訓練に使用されるデータそのものが白人話者の音声を豊富に含み、黒人話者の音声をあまり含んでいない場合、音声認識アルゴリズムが黒人話者のアクセントや話し方を上手く学習できず、エラー率が高くなってしまうとのこと。

続きを読む

このまとめの続きはコチラ!

-Web系関連記事: プログラミング、開発関連

関連記事

プログラミング、まず目標 お手本「コピペ」で理解

プログラミング、まず目標 お手本「コピペ」で理解

1: 田杉山脈 ★ 2020/03/22(日) 06:19:55.20 _USER
まもなく新年度。仕事のスキルを磨くため、プログラミングを学ぼうと考える人もいるだろう。ただし、選択肢があまりにも多いため、初心者にとってはハードルが高い。最初の一歩をどう踏み出せばいいか。専門家に聞いた。 …

20年度の小学校教科書、「プログラミング」が必修に

1: へっぽこ立て子@エリオット ★ 2019/03/26(火) 15:47:42.88 _USER
文部科学省は26日、全国の小学校で2020年度から使われる教科書の検定結果を公表した。文科省の審議会の検定意見を受けて修正を加えるなどし、教科書会社が申請した164点全てが合格した。20年度に始まる…

AI後進国ニッポンが危ない! 米国や中国に比べて大きく出遅れ

1: ノチラ ★ 2018/06/05(火) 19:09:06.57 _USER
ディープラーニング(深層学習)に代表されるAI技術の活用ビジネスで、米国はもとより中国に比べて大きく出遅れている日本。「世界で勝てる感じがしない、敗戦に近い」という松尾豊・東京大学大学院特任准教授の強い危機感…

京都市が基幹系刷新で2度目の失敗、2020年1月の予定だった稼働時期が「未定」に

京都市が基幹系刷新で2度目の失敗、2020年1月の予定だった稼働時期が「未定」に

1: サーバル ★ 2019/12/28(土) 20:57:49.75
京都市が基幹系刷新で2度目の失敗、2020年1月の予定だった稼働時期が「未定」に 2019/12/27 18:30  京都市はNEC製メインフレーム上で約30年稼働する基幹系システムのバッチ処理をオープンシステムに刷新するプロジェクトに…

「メモ帳」がLinuxの改行コードをサポート

1: ノチラ ★ 2018/05/09(水) 23:51:08.97 _USER
 Microsoftの開発者向けイベント“Build 2018”が米国シアトルにて開催中で、今日は2日目のキーノートセッションが行われていました。新しい機械学習技術やクロスデバイス体験などがお披露目されましたが、なかでも会場を…