生成AIとウェブアクセシビリティ

ウェブアクセシビリティ基盤委員会 作業部会4 作業協力者
伊原 力也

ChatGPTなどの生成AIは、私たちの社会のあらゆる場面で活用が期待されています。この技術の波は、ウェブアクセシビリティの世界にも大きな変化をもたらそうとしています。AIは、誰もが情報にアクセスできる社会を実現するための救世主となるのでしょうか。

本コラムでは、「ウェブサイトの利用者」と「ウェブサイトの制作者」という2つの視点から、AIがウェブアクセシビリティをどう向上させるのか、私たちがAIとどう向き合っていくべきかを考えます。

AIが可能にする、多様な情報アクセス

ウェブサイトを利用する側にとって、AIは情報アクセスの手段を劇的に多様化させています。後述するように、これまでアクセスが困難だった場面でも、AIを使って自分に合ったフォーマットや粒度にコンテンツを変換することで、完全ではないものの、アクセスの道がひらかれています。

代表的な例が、視覚情報のテキスト化です。スクリーンリーダーのAI拡張機能(例:NVDAAI Content Describer)は、代替テキストが設定されていない画像でも、AIがその内容を解析し、説明を生成してくれます。操作の手間や金銭的負担が閲覧者側に生じるという課題は残りますが、これまでアクセスできなかった情報への扉を開く新たな手段です。

また、複雑な情報の要約や言い換えもAIの得意分野です。例えばNotebookLMのようなツールを使えば、ウェブページやPDF、YouTube動画などのさまざまな形式のコンテンツを情報ソースとして取り込み、それらの内容をもとに要約文を生成したり、チャット形式で質疑応答したり、ポッドキャストを生成したりといった形で、自分が理解しやすい形態にコンテンツを変換できます。

さらに、OperatorBrowser-Useに代表される、AIエージェントがユーザーの代わりにブラウザを操作する技術も登場しています。画面を操作するのに必要以上に時間がかかり、ユーザーの負担になる状況では、こうしたツールが大いに役立つと考えられます。

AIも求める、オリジナル&マシンリーダブル

AIの進化は、アクセシビリティ視点での新たな問いを私たちに投げかけます。それは「閲覧者側がAIでコンテンツを変換したり、自動操作できるなら、制作者がコンテンツをアクセシブルにする必要はないのでは?」という問いです。

しかし、その答えは現時点において明確に「No」です。

まず、コンテンツが伝えようとする意図について、AIは類推しかできないという問題があります。画像の代替テキストなどはその顕著な例です。AIにおいては、画像の置き方やレイアウトなどから意図を類推し、候補を提案するまでが限界です。「この画像で何を伝えたいのかという意図」はオリジナルとしてウェブサイト提供側が用意する必要があります。

AI自身も学習のために、質の高い、信頼できる情報源を必要とします。制作者が提供するオリジナルかつアクセシブルな情報こそが、AIの性能を最大限に引き出すための鍵でもあるのです。

加えて、AI自身が効率的に動作するためには、アクセシビリティが必要であるという事実があります。AIは、コンテンツの見た目を画像として認識することもできます。しかし、その方法には処理に時間がかかり、AIの利用料金も高くなり、確実性にも欠けるという課題があります。それよりも、HTMLとして記述されたマシンリーダブルな構造やテキストを読み取るほうが、現時点では高速・安価・確実に動作します。

例えば、先に挙げたNotebookLMでは情報ソースとしてYouTubeの動画を使用できますが、このとき利用されているのは、実は字幕として文字起こしされたテキストのほうです。テキストである字幕は、AIによる認識や再加工が容易な、マシンリーダブルなコンテンツだからです。

自動操作においても、この点は同じです。画像認識モードで自動操作させると、スクリーンショットの送信や解釈に対してAI利用料が高額になります。例えば、先述のOperatorは画像認識モードで動くツールですが、これを使うには月額$200かかります。いっぽうで、構造やテキストを読み取る自動操作ツールは、その数分の1〜数十分の1のAI利用料で実現できます。

探索的な活動こそがウェブの価値

「AIの自動操作にすべてを任せればよい。だからウェブサイトに人間がアクセスする必要はない。UI自体が不要である」という論調にも、筆者は一石を投じたいと考えています。

私たちはウェブサイトやウェブアプリケーションを利用する際、常に最短距離で目的を達成したいわけではありません。まだ目的ややりかたがはっきり定まっていないときに、自分自身でウェブサイトを直接操作するなかで考えがまとまっていったり、違うやりかたが思いついたりするという経験は誰にでもあるはずです。ウェブサイトを回遊する中で偶然面白い情報に出会うこともあるでしょう。そうした探索的な活動ができることこそ、ウェブの大きな価値です。

AIによる自動操作というショートカットと、ユーザー自らが探索し発見するという自律的なアクセスという、両方の選択肢が用意されていることこそが重要です。そして後者の自律的なアクセスを実現するためには、ウェブサイトのUIが人間にとってアクセシブルでなければなりません。

このように、AIのため、そして人間自身のためにも、ウェブアクセシビリティは依然として、そしてこれまで以上に重要だと言えるのです。

AIが支援する、アクセシブルなウェブ制作

ウェブサイトを制作する側にとっても、AIは強力なアシスタントになり得ます。これまで専門知識や作業時間が必要とされたアクセシビリティ改善の取り組みを、AIが支援してくれます。

例えば、アクセシビリティチェックツールであるaxe DevToolsは、AIを用いて手動チェックを補佐したり、背景画像がある場合でもテキストとのコントラストを分析したりする機能を搭載しています。また、デザインツールのFigma上で動作するアクセシビリティ改善ツールStarkは、見出し要素をAIでサジェストしたり、代替テキスト案を生成したりする機能を備えています(※現在、日本語は未対応)。

チェックだけでなく、デザインや実装においてもAIの活用は広がっています。アクセシブルな部品(コンポーネント)とその組み合わせ指示を人間が用意しておけば、AIがそれらを参照してアクセシブルなページを生成することも、現実的に可能になってきています。日本では社内デザインシステムをMCPサーバー化したらUI実装が爆速になったという記事を皮切りに、各社がこの取り組みを進めています。

さらに、デザイン案から直接コードを生成するツールも複数あります。そのうちのひとつのbuilder.ioには、アクセシブルなコードの出力を試みるオプションが用意されており、それを使うことで品質が向上する可能性が高まります。

もっとも、こうした制作側でのAI活用の潮流は、まったく新しいものというわけではありません。例えば、動画の字幕付与にはAIによる音声認識が活用されていました。AIの汎用性が高まった現在では、制作側がコンテンツをアクセシブルにする際にAIを活用できる状況も増えつつあります。

そして、AIの補助によって作成された字幕というテキストコンテンツを、現在では先述のNotebookLMのような生成AIツールが変換や加工を行い、ユーザーに届けるようになっています。AIの汎用性が高まり、活用範囲が広がることで「AIで作り、AIで受け取る」という構造がさまざまな分野に広がってきているのです。

まとめ:人間とAIの協奏が生む、真にアクセシブルなウェブを目指して

生成AIは、ウェブアクセシビリティにとって大きな可能性を秘めたツールであることは間違いありません。

利用者は、ウェブサイトの情報を自身が直接読み解く形でのアクセス、AIによる変換や加工を経てのアクセス、そしてAIによる自動操作でのアクセスを、状況に応じて組み合わせたり選択できたりすることが理想でしょう。

これを実現しやすくするには、ウェブサイト自体のアクセシビリティを高めることが土台になります。マシンリーダブルであることが、人間とAIの双方のアクセシビリティを同時に高めるという、極めて重要な意味を持っているからです。

その重要なウェブアクセシビリティを高めるためには、デザイン・実装・チェックの工程をAIで効率化することが有効でしょう。そうすることで、人間は「その情報はどうすれば最も伝わるのか」「本当に『使い物になる』デザインとは何か」といった、より本質的な仕事に注力できるようになります。

アクセシビリティの高さは、選択肢の多さ。目指すべきは、AIに任せる世界ではなく、私たちがAIを使いこなす世界です。「未来がどうなるかではなく、未来をどうするか」。私たち自身の選択と設計が、これからのアクセシビリティを形作っていくのです。

  • この文章は、一般社団法人 情報通信ネットワーク産業協会(CIAJ)のメールマガジンへ掲載することを目的に書かれたものです。
  • この文章は、執筆者個人の見解に基づくものであり、ウェブアクセシビリティ基盤委員会の公式的な見解を示すものではありません。
このページのトップへ