IT・インターネット
2023.11.26

生成系AI開発で世界トップクラスのAIベンダーにおける、開発に欠かせない「教師データ」の扱いとは。

生成系AI開発で世界トップクラスのAIベンダーにおける、開発に欠かせない「教師データ」の扱いとは。

物体検出用の教師データ作成 / アノテーションで利用。harBestプラットフォームを利用してAI開発の加速に成功。

御社の事業内容を伺ってもよろしいでしょうか。

Lightblueは、人を対象にした画像処理を主とする「ヒューマンセンシング技術」と、あと昨今盛り上がりを見せている「自然言語処理を活かしたLLM開発」、この2軸をメインに事業展開しています。

前者の画像解析については現場からのニーズが多いです。建設・工事現場や工場といったシチュエーションを対象にしている開発が多く、安全管理や人の行動の把握に活用いただいています。

特に「これ」と対象を絞っているというよりは、幅広くお客さんの課題に最適なアルゴリズムを提供することを目標にしています。

ありがとうございます。谷口さんのキャリアを教えてください。

はい。東大の大学院を卒業して、この会社に入社しました。私が大学二年生の時に、代表の園田がちょうど会社を創業し、そのときに私もエンジニアのアルバイトがしたかったので手を挙げて、ジョインしたのがきっかけです。その後いろいろあって、今のポジションになりました。現在はPM兼エンジニアとして、PMをしつつ、案件によっては自分で実装したりするものあるという形です。内容としてはPMのほうが多めで、6対4とか7対3ぐらいの感じです。

そうなんですね。研究室にいらっしゃったんですか?

大学院では「青山研」という研究室にいました。先生の研究は幅広く、生産性を向上するためのシステム工学をメインで研究をしていて、僕は金属のプレス加工をどのように効率化できるかを研究していました。プレス加工した後の金属データを共同開発していた企業に提供していただいて、画像処理活用して分析していました。当時は修論も書きつつ、会社の業務もしていたという感じです。

ありがとうございます。従業員って今現在何人ですか?

社員が15人前後、業務委託などを入れると30人ぐらいになるかなというイメージです。

harBestとの出会いを教えてください。

弊社の業務上アノテーションは大量に発生していました。当初は開発環境としてAWSを使っており、その都合でAWSのsagemakerを自社で完全に構築して運用していましたが、アノテーションを管理するコストが課題でした。一方で、完全に自社でやるリソースもないという状況で。より良いアノテーションサービスを探しているときに見つけました。

教師データが必要だったのはどういったプロダクトだったんですか?

基本的には物体検出のアノテーションが一番多いかなと思いますね。工場内の特定の部品を見つけるためのものや、あとはトンネル内の重機を検出するための個別の重機ごとのラベル付けなど様々です。

ありがとうございます。アノテーションツールを比較検討した際、何が決め手となったのかお聞きしてもいいですか?

まずはプラットフォームの利用費用ですね。弊社としてはそもそもアノテーション専用のアルバイトを雇っていたこともあり、新規にアノテーターを探すことは考えていませんでした。あとはツール上で「何ができるか」っていうところですね。画像分類、物体検出、セグメンテーションなど、どこまで対応してるか等を見て、決めた記憶があります。

無料のアノテーションツールもある中、harBestを選んだ理由をお聞かせ願えますか。

弊社内でも枚数が多くない時などを想定して、無料ツールを立てた場合の調査したことがありましたが、いざ試してみると、サーバー代などの費用面と社内のアノテーターさんの管理の工数もあり実運用は難しそうでした。その点harBestでは両方が解決するということで選びましたね。

収集・作成したいデータ形式に応じて、プラットフォームから簡単に発注できるのが harBestの魅力。

使っていて、改善してほしいポイントはありますか。

比較的早いペースで できることがどんどん増えている印象があります。当社の要望にも答えていただいており、大変ありがたいなと思ってます。UIもわかりやすいです。新しく使う方のため社内用の簡単なマニュアルがあるんですが、一度共有すれば、ほぼ説明なく、詰まらず使えていますね。

一点、プロジェクトがものすごく増えていて、フィルタリングの機能があると助かりますね。時期やステータス、登録日等でフィルタリングできるとより便利です。

間もなく搭載予定です!フィードバックありがとうございます。最後に、今後のビジョンを伺ってもいいですか。

はい。会社としては「今メインで取り組んでいるヒューマンセンシング」と「LLM」を組み合わせたようなサービス展開ができるようにしていきたいです。画像解析は画像解析、自然言語系は自然言語系、とある程度分けてプロダクト開発や受注の案件を実施していますが、今後は画像解析で出た結果をLLMを活用して自動でレポート化するというような掛け合わせによってサービスの価値を上げていきたいですね。密度も高めつつ、優秀なメンバーを増やしていきたいと思っています。将来的にはもっと大きなプロジェクトに取り組んで社会にインパクトを与えるような仕事ができたらと思います。継続して依頼していただけるお客さんが多いので、少しずつ大きな課題に挑めたらと思っています。

谷口さん、本日は貴重なお時間をありがとうございました!

取材・文:狩野洋一
2023年8月取材実施 ※掲載内容は取材当時のものです。


データで、
革新のきっかけを。

APTOの高品質AIデータで、あなたのビジネスに新たな可能性を。
まずは資料請求からお気軽にお問い合わせください。