ピクスタとグローバルウォーカーズは、機械学習用教師データの画像素材販売強化のために業務提携し、「機械学習・深層学習における商用利用可能な画像データセット」の共同販売を開始すると発表した。
同サービスは、ピクスタが運営する写真・イラスト・動画・音楽素材のマーケットプレイス「PIXSTA」が保有する画像データに、グローバルウォーカーズ社が提供する機械学習・深層学習向け教師データ作成サービス「Annotation One」が、クライアント企業の要望に合わせたアノテーション(画像データに適切な情報をタグ付けする業務)を施したもの。
以下は、グローバルウォーカーズ社で施せるアノテーション例となる。
外接矩形(Bounding Box)
対象となる物体の画像やテキストを四角い矩形にくくり、X/Y座標の2次元データを付与。顔検出や物体検出など様々な分野の機械学習で利用されているという。
領域分割(Semantic Segmentaion)
1画素単位でどの物体のカテゴリーの範囲であるのかを取得するためのアノテーション手法。自動運転、ロボティクス、医療診断画像など人体検知のほか、工業製品検査、土木建設現場などの高精細な情報を必要とする分野で多く利用されている。
骨格データ付与(Key Point)
画像や動画データの中から人物の姿勢を推定する「姿勢推定」や「骨格検出」などに利用されるデータ。スポーツや医療・ヘルスケア業界、教育関連、セキュリティなど人の動きにまつわる分野で利用されている。
ピクスタがクライアント企業の要望に応じた人物画像素材を必要点数ピックアップし、グローバルウォーカーズ社経由でクライアント企業の要望に応じたアノテーションを施した上で納品するという。(営業窓口はグローバルウォーカーズ社が対応)
納品までの期間は、必要とするデータ数、アノテーションの種類やタグ数にもよるが、外接矩形アノテーションでタグ数5〜10を想定した場合、5,000枚で約2週間〜で納品が可能だという。
これにより、機械学習・深層学習を望む国内企業が欲する「商用利用可能なアノテーション(タグ付け)された日本人を主とした人物画像データ」を短期間で提供することができるという。
今後は、クライアント企業の要望に合わせた完全オーダーメイドによる画像選定およびアノテーションをほどこした教師データセットの販売を皮切りに、汎用的に利用可能な両社オリジナルのデータセットのパッケージ展開も検討していくとのことだ。