富士通が自動機械学習技術をHugging Faceに公開 OSSコミュニティで発展するAI技術
Article | 2023年12月5日
この記事は約5分で読めます
近年、新しい技術がオープンソースコミュニティから生まれ、世界中の開発者の協力によって発展していく傾向が強まっています。
歴史を紐解くと、1990年代に登場したLinuxは、個人開発者のみならず企業と業界を巻き込んで、ハードウェア、ソフトウェア、開発言語の巨大なエコシステムを構築しました。今では、証券取引所のミッションクリティカルシステムでもLinuxが採用されています。また、次世代のインターネットとして注目されるWeb3の基盤技術であるブロックチェーンは、2009年の誕生時からソースコードが公開されていました。現在は様々な種類のブロックチェーンが存在しますが、Hyperledger Fabric、Bitcoin、Ethereumなどの主要なプラットフォームはソースコードが公開され、オープンソースコミュニティで開発が進んでいます。
オープンソース化の流れは、昨今急速に普及するAI技術の領域でも顕著です。機械学習ライブラリの「scikit-learn」や、Metaが開発した深層学習フレームワーク「PyTorch」、Googleの深層学習フレームワーク「Tensorflow」は、オープンソース化によって広く普及しました。現在、5万以上の組織がAI技術共有プラットフォーム「Hugging Face」を利用し、自社で開発したAIのモデルやデータを公開しています。AI技術の開発や運用には高度な専門知識が要求されるため、オープンに世界中の開発者へ共有されるプラットフォームが求められているのです。透明性、信頼性の観点からも、ブラックボックス化されていないオープンソースのAI技術に対するニーズがますます高まっています。自社技術を公開する企業は、世界中の開発者の技術活用によるAIの普及と発展に貢献することに加えて、コミュニティを通じたアライアンスや標準化によって、AIの分野で競争力を高めることができます。
独自開発の自動機械学習技術をオープンソース化
富士通は、AI技術を誰でも使える・作れる世界のために、AIモデルの生成を自動化する自動機械学習技術(AutoML)の開発に取り組んできました。より多くの開発者や企業に使ってもらうことを目的に、当社は2023年8月に、この技術をオープンソース化しました。現在は、「SapientML」の名称で、Linux Foundationの正式なオープンソースプロジェクトになっています。
SapientMLは、表データから説明付きの機械学習モデル生成コードを高速に自動生成する自動機械学習技術を開発するプロジェクトです。既存のデータセットのコーパス(言語のデータベース)と人間が作成したパイプラインから学習し、知りたい変数を予測する高品質なパイプラインを生成します。コードがどのように生成されたのか確認して理解できるように、説明が付くのが特徴です。
本プロジェクトで開発された自動機械学習技術を使うことで、例えば、商談の成約確度予測するAIモデルや、住宅の価格予測をするAIモデルを高速に生成できます。データサイエンティストは高精度なAIモデルを瞬時に生成できるだけでなく、生成されたコードを使って試行錯誤しながら、より高精度なモデルに作り変えることが可能になります。
今回当社は、SapientMLをHugging Faceで公開しました。誰でも、Hugging Face上で高速・高精度なAIモデルの自動生成を実行いただけます。ぜひお試しください。
またOSSプロジェクトのコントリビュータとしての参加も歓迎しております。以下のリンクより、SapientMLコミュニティへ参加いただけます。
当社は、最新のAI技術を安全に試すことができるAIプラットフォーム「Fujitsu Kozuchi (code name) - Fujitsu AI Platform」(以下、Fujitsu Kozuchi)をお客様とパートナーに提供しています。今回ご紹介した当社開発の自動機械学習技術は、「Fujitsu AutoML」の名称でFujitsu Kozuchi上で提供しており、今後、SapientMLプロジェクトでの技術アップデートをFujitsu Kozuchiへも順次反映していきます。
プロフィール
富士通株式会社 グローバルマーケティング本部
マネージャー テクノロジーマーケティング担当
羽野 三千世
富士通が提供するAI、オープンソース関連記事
富士通研究所所長に聞く 生成AIに関する取り組みの今後の勘所
Fujitsu Web3 Acceleration Platform
AIも判断を間違う?! AIを自動でアップデートするHDL技術