What is TACO?
今回はTACOというデータセットについてご紹介したいと思います。こちらのサイトでは世界のゴミ問題を解決するためにTACOというゴミのオープンイメージデータセットを作成し、それを無料で公開しています。最近のAI(ディープラーニング)はデータがあればあるほどに賢くなりますので、データを大量に集める必要があります。
そこで、大量のデータを集めるために必要な機能がTACOのサイトにあります。こちらのサイトには画像をアップロードする機能や画像のアノテーションを付ける機能があり、大勢の人の協力を得て大量の画像データを集める仕組みができています。誰もがゴミの画像をアップロードすることで社会貢献できるようになっています。また、上記で集められたデータは引用を付ければダウンロードしてAIの開発に使用することも可能です。例えば、以下のようなゴミをAIが認識できるようになります。
その素晴らしいTACOのサイトについて今回は説明していきます。ゴミの画像をアップロードしたい方はアップロードのページをご参照ください。
エクスプロー(Explore)ページ
TACOについて概要が記載されています。TACOのプロジェクトについて説明されているので興味があればざっと翻訳して読んでみるといいかもしれないです。
タクソノミー(Taxonomy)ページ
TACOのデータセットに含まれるカテゴリ(画像の種類)について説明が記載されています。カテゴリにはスーパーカテゴリと普通のカテゴリがあり、大分類と小分類といったように分けられています。例えばスーパーカテゴリには「Bottle」というカテゴリがあり、その下に「Clear plastic bottle」や「Glass bottle」といった普通のカテゴリが含まれています。普通のカテゴリは今現在のところ60個に分けられています。
ステータス(Stats)ページ
TACOのデータセットの状況を確認することができます。カテゴリごとの画像がどの程度登録されているか確認することができます。一般的にAIの学習には大量の画像をバランスよく学習させたほうが精度のよいものができると言われていますので、こちらのグラフが高く、そして均等になっているのが理想的な状態だと言えそうです。
アノテーション(Annotate)ページ
登録されている画像にアノテーションをつけることができるページです。アノテーションとは、画像の中でゴミがどの位置にあるかということを指定することのことです。この情報をもとにAIは学習を行っていきますので、こちらの作業はできる限り正確に行っていく必要があります。
アップロード(Upload)ページ
こちらのページでゴミの画像をアップロードすることができます。こちらのUPLOADを選択してアップロードのページに移動します。
一度に複数の画像を選択してアップロードすることができます。画像を選択したら「送信」を押してアップロードします。どのような画像をアップロードするべきかという点についてですが、このあと人がゴミを分類する(アノテーションを付ける)ことを考えると、人の目で見てどの種類のゴミなのか分かるものが好ましいです。また、このデータセットはポイ捨てされているゴミの画像の集まりなので、ゴミ捨て場の写真などはアップロードしないようにしましょう。
チーム(Team)ページ
TACOを運営している方々の紹介ページです。海外にはこのような素晴らしいサイトを制作されている方々がいらっしゃるんですね。尊敬の念しかないです。ありがとうございます。
以上、今回はTACOのデータセットについてご紹介させていただきました!たくさんゴミの写真をアップロードしてみんなで世界のゴミ問題に貢献しましょう!!
コメントを残す