アマナイメージズのAI学習用ビジュアルデータセット開発サービス『Qlean(キュリン)』は、2023年8月のリリース以来、ありがたいことに実に様々な業種のお客様からご依頼をいただいています。その1つが、先端技術を取り入れ、社会や顧客の課題を解決する事業を展開する株式会社Ristです。京セラグループの一員である同社では「工場×AI」をコンセプトに事業を拡大させており、2022年10月には外観検査装置に組み込むAIを開発するための工数を大きく削減できる「RPipe-Image」の親モデル開発において『Qlean』を活用いただきました。今後「RPipe-Image」が導入された検査装置が海外で利用されることを見据え、権利クリアで安心・安全な100万枚以上の画像が必要だったと言います。

プロデューサーとしてAI学習用ビジュアル開発を牽引する平山が、Rist代表取締役社長 藤田亮氏に、『Qlean』を活用いただく上で感じた独自の強みなどを伺いました。

藤田亮氏
株式会社Rist 代表取締役社長

京都大学大学院にて数学・数理解析を専攻。2010年京セラコミュニケーションシステム株式会社(以下、KCCS)に入社、M&Aやベンチャー企業とのアライアンスを担当。2012年から機械学習のモデル作成を行うデータ分析業務に従事。2015年から画像認識事業の立ち上げを行う。KCCSとRistの資本提携に伴い、2019年1月からRistに出向。2019年7月、二代目社長として就任。
平山清道
株式会社アマナイメージズ AI学習用ビジュアル開発 プロデューサー

明治大学法学部卒業。日本テレビグループの映像制作会社入社後、動画コンテンツの企画・開発を主とするディレクターとして独立。2014年12月、株式会社アマナイメージズに参画し、動画・静止画コンテンツの調達部門の責任者として、新規クリエイターの開拓からコンテンツの制作までを統括。2023年、同社にて新規事業「AI学習用ビジュアル開発チーム」を立ち上げ。データの提供に留まらず依頼主の期待に沿ったビジュアルの開発を目指し、制作現場でのディレクション経験とクリエイターネットワークを活用しながら、AI・機械学習用教師データ(画像、動画、音声等)のプロデュースを推進している。

文:Kuwano H


開発したAIが海外で利用されることも視野に、
世界基準の権利規定に則ったデータが必要だった

平山:『Qlean(キュリン)』をご活用いただき、ありがとうございます。なぜ我々のサービスをご利用いただいたのか、はじめにその経緯をお伺いできますか。

藤田氏:製造業の外観検査におけるAI活用は世の中に浸透してはいるものの、これまで著作権を含む知的財産権や肖像権の観点で課題を感じていました。というのも、お客様の不良製品の画像だけで学習するわけではなく、インターネットで集めた大規模な親モデルからファインチューニングすることが多いからです。インターネット上には著作権フリーと謳われているオープンなデータセットが広く展開されていますが、本当に問題ないのか確認する術はありません。現状日本国内では法律上問題ないものの、検査装置が海外に販売された際にはグレーゾーン、場合によってはアウトになってしまいます

平山:初めてお話を伺った際、「世界基準の権利規定に則った学習用データでなければならない」とのことで、撮影者や制作者、被写体などに対する様々な権利(著作権・肖像権・知的財産権など)に40年以上向き合ってきたアマナイメージズだからこそ、御社のご要望に応えられると感じました。

権利クリアランスの観点以外に、我々に求めていたことはありますか?

藤田氏:弊社独自の親モデルを開発するためには、バラエティに富んだ高品質の画像100万枚以上が必要でした。プロのフォトグラファーが撮影した高品質な画像が望ましいですが、大量に必要なため、1枚あたり高価だと実現が難しい。そのため、AI学習におけるデータセットとしてふさわしい料金体系を希望していました。そこで出会ったのが『Qlean』です。まさに我々が求めていた、権利クリアで高品質、そして価格も抑えられたデータセットであり、同様のサービスも他に見当たらなかったためアプローチさせてもらった次第です。

API経由で権利クリアな学習用データを
自由に活用できる環境をスピード構築

平山:御社のニーズと我々の事業モデルがまさに合致したこともあって、かなりのスピード感で対応させていただいたと考えております。

藤田氏:そうですね。こちらから連絡してお話を伺い、議論を重ねながら取り組みがスタートしました。また、2ヶ月間の期間中、画像データ取得とAIモデルの学習、精度確認の一連の流れを検証することができました。API経由でデータをダウンロードして利用させてもらいましたが、仕様を明確に説明いただけたことで、弊社エンジニアもすぐに理解し活用できました。
スピード感も我々が重視するポイントの1つでしたが、十分に満足いくものでした。

平山:弊社との取り組みを進める中で、印象的だった出来事はありますか?

藤田氏:「権利がクリアである」という点を最も気にしていたので、Qleanのサイト上に、著作権含む知的財産権、肖像権をきちんと管理していると明記されていた点は安心しました。また、実際に利用して感じたのは一枚一枚丁寧にタグ付けされているなど、その管理方法の素晴らしさです。今後は、AI学習用のタグ付けがより一層強化・最適化されていくことを期待しています。

ヨーロッパを筆頭に厳しくなる各種法規制に
はじめから権利クリアなものを使うのが効率的

平山:AI倫理や権利クリアの重要性について分かってはいるものの、時間やコストをかけるべきか悩んでいる日本の企業は多いかと思います。海外展開を見据えて、世界基準でAI活用の第一線を推進している藤田さんは、この状況をどのように考えていますか?

藤田氏:著作権や肖像権がクリアでない場合、企業としては十分留意する必要があります。近年、特にヨーロッパ中心に権利関係の規制はますます厳しくなっています。であればグレーゾーンの取り組みを進めながら様子を見るのではなく、最初からクリアな状態で臨んだ方が効率的ではないでしょうか。今後日本においても、各種権利を厳守することが原則である社会になると考えています。

平山:最後に、今後『Qlean』に期待することがあれば、教えてください。

藤田氏:AIのスタートアップである我々としては、データの豊富さというのが非常に重要な要素なので、画像などのデータの数が日々増えていくのは嬉しいことです。

加えて、画像に付随するメタ的な情報です。「この画像はどんなイメージなのか」を示すタグの管理は十分されていますが、元々の用途である広告やクリエイティブに向いたタグ構成になっていることが多いように感じます。AIに適したタグは別の種類になってくるので、AI向けデータベースサービスという意味では、タグ関連の部分もAIの事業者に利用しやすいようにしていただけるとありがたいです。

平山:ありがとうございます。2022年10月、アマナイメージズはアノテーションプラットフォームを提供するFastLabelと提携しており、AI学習に特化したアノテーションも共同提供可能な体制を整えています。引き続き、AIの事業者に活用頂きやすいプラットフォームとなるよう、サービスのアップデートに尽力させて頂きます。

関連記事
Qlean's Voice #2 
30年のノウハウを学習用データ開発に還元。AI学習用データ「Qlean」プロデューサーが語る可能性
Qlean's Voice #3
著作権に詳しい福井健策弁護士に聞く「AI学習で押さえたい権利と法的・炎上トラブル防止策」

 

アマナイメージズのAI学習用データセット開発サービス『Qlean(キュリン)』に関するご質問をお気軽にお問い合わせください。

電話:0120-410-225
営業時間 9:30~18:00(土日祝日を除く)
E-mail qlean@visual-bank.co.jp
Qlean サービスサイト 
Qleanお問い合わせフォーム